计算机工程与应用 ›› 2026, Vol. 62 ›› Issue (8): 176-188.DOI: 10.3778/j.issn.1002-8331.2507-0389
董禹彤1,侯惠芳1+,龚明明2,陈自康1
DONG Yutong1, HOU Huifang1+, GONG Mingming2, CHEN Zikang1
摘要: 缺陷检测是工业领域的重要应用场景。针对传统检测效率低、工业数据需智能分析处理、单模态系统泛化能力不足及大模型存在幻觉等问题,提出并实现一种增强型工业缺陷智检系统,支持多源异构数据协同处理与高效决策。系统微调工业异常检测多模态大模型,通过改进的跨模态特征对齐算法与提示学习,实现图像、文本等多源数据语义融合,同步输出缺陷识别的语义描述;构建工业数据知识库,借助RAG检索增强生成,抑制模型幻觉,提升检测可信度与决策效果;结合Depth-Anything-V2生成高一致性深度图,支持缺陷三维量化分析,突破二维检测局限;基于自然语言驱动的Excel智能分析模块,自动提取质检表格数据并可视化;OCR智检模块融合PaddleOCR与ErnieBot,实现工业文档文本提取与语义理解。通过智能体统筹核心功能模块给出综合决策建议。在金属、螺丝等5类典型工业零件测试中,系统缺陷类型平均识别精确率为95.26%,位置定位平均误差2.9像素,其拓展了工业质检自动化水平与分析维度,为制造业智能化转型提供了实用技术方案。