全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 一年内发表文章
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于大语言模型的智能问答系统研究综述
    任海玉, 刘建平, 王健, 顾勋勋, 陈曦, 张越, 赵昌顼
    计算机工程与应用    2025, 61 (7): 1-24.   DOI: 10.3778/j.issn.1002-8331.2409-0300
    摘要352)      PDF(pc) (1720KB)(398)    收藏
    智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥有数十亿甚至上千亿个参数,不仅能够理解和生成自然语言,还能显著提升问答系统的准确性和效率,推动智能问答技术的发展。近年来,基于大模型技术的智能问答逐渐成为研究热点,但对该领域的系统性综述仍然较为欠缺。因此,针对大模型的智能问答系统进行系统综述,介绍了问答系统的基本概念和数据集及其评价指标;介绍了基于大模型的问答系统,其中包括基于提示学习的问答系统、基于知识图谱的问答系统、基于检索增强生成的问答系统和基于智能代理的问答系统以及微调在问答任务中的技术路线,并对比了五种方法在问答系统中的优缺点和应用场景;对于当前基于大语言模型的问答系统面临的研究挑战和未来发展趋势进行了总结。
    参考文献 | 相关文章 | 多维度评价
    2. 轻量化深度卷积神经网络设计研究进展
    周志飞, 李华, 冯毅雄, 陆见光, 钱松荣, 李少波
    计算机工程与应用    2024, 60 (22): 1-17.   DOI: 10.3778/j.issn.1002-8331.2404-0372
    摘要321)      PDF(pc) (6330KB)(382)    收藏
    轻量化设计是解决深度卷积神经网络(deep convolutional neural network,DCNN)对设备性能和硬件资源依赖性的流行范式,轻量化的目的是在不牺牲网络性能的前提下,提高计算速度和减少内存占用。综述了DCNN的轻量化设计方法,着重回顾了近年来DCNN的研究进展,包括体系设计和模型压缩两大轻量化策略,深入比较了这两类方法的创新性、优势与局限性,并探讨了支撑轻量化模型的底层框架。此外,对轻量化网络已经成功应用的场景进行了描述,并对DCNN轻量化的未来发展趋势进行了预测,旨在为深度卷积神经网络的轻量化研究提供有益的见解和参考。
    参考文献 | 相关文章 | 多维度评价
    3. 推荐算法研究进展及知识图谱可视化分析
    林素青, 罗定南, 张书华
    计算机工程与应用    2024, 60 (21): 1-17.   DOI: 10.3778/j.issn.1002-8331.2312-0032
    摘要306)      PDF(pc) (1215KB)(348)    收藏
    互联网技术的应用普及使网络数据资源呈指数级增长,从海量数据中获取需求信息愈加困难。推荐算法因能有效解决信息过载问题而备受关注,相关研究成果层出不穷。以中国知网(CNKI)和科学网(WOS)核心合集为主要数据源,采集2012—2024年间出版的4?773篇和4?531篇中英文文献,利用可视化分析工具CiteSpace和VOSviewer绘制文献基本信息与关键词共现图谱;借助图谱分析,提炼核心技术关键词:知识图谱、图神经网络和深度学习,并选取与之关联的代表性推荐算法;通过图表直观展示算法核心机制和基本原理,聚焦现有研究的不足与挑战以及针对性解决方案;基于挑战-方案-来源文献的格式,绘制各核心技术关键词所关联算法的知识架构图,实现推荐原理的可视化。
    参考文献 | 相关文章 | 多维度评价
    4. 基于卷积神经网络的图像分类深度学习模型综述
    刘鸿达, 孙旭辉, 李沂滨, 韩琳, 张宇
    计算机工程与应用    2025, 61 (11): 1-21.   DOI: 10.3778/j.issn.1002-8331.2411-0196
    摘要297)      PDF(pc) (1675KB)(330)    收藏
    使用神经网络模型进行图像分类任务一直是非常重要的研究方向,随着深度学习技术的发展,对神经网络模型的要求也越来越高。在识别率高的同时,对模型的参数量、训练时间也都有较高的要求。卷积神经网络一直是深度学习中针对图像处理的主流方法,主要介绍基于卷积神经网络的分类模型的发展历程,分析其不同阶段各个模型的搭建思路;介绍Transformer与卷积神经网络结合的相关模型以及各模型在其他领域的应用情况。最后,对卷积神经网络的发展进行了探讨。
    参考文献 | 相关文章 | 多维度评价
    5. 基于深度学习的基础设施表面裂纹检测方法研究进展
    胡翔坤, 李华, 冯毅雄, 钱松荣, 李键, 李少波
    计算机工程与应用    2025, 61 (1): 1-23.   DOI: 10.3778/j.issn.1002-8331.2407-0407
    摘要310)      PDF(pc) (9136KB)(324)    收藏
    民用基础设施在长期使用后容易发生物理结构或性能状态的改变,对其功能和使用安全造成一定的损害,因此,对这类设施的结构健康监测是十分必要的。裂纹检测是结构健康监测中极其重要的一部分,及时检测并识别这类损伤,能有效避免事故的发生。基于计算机视觉的表面裂纹检测方法操作简单、检测速度快、准确率高,被广泛应用于民用基础设施的表面裂纹检测。从图像分类、目标检测、语义分割三个不同的检测方向综述了基于深度学习的基础设施表面裂纹检测方法,总结了常见的数据采集方法和常用的公共裂纹数据集。最后讨论了基于深度学习的基础设施表面裂纹检测方法存在的困难与挑战,并展望了未来可能的发展方向。
    参考文献 | 相关文章 | 多维度评价
    6. 多模态驾驶员情绪识别研究综述
    周欣颖, 李雷孝, 林浩, 张虎成
    计算机工程与应用    2025, 61 (10): 1-18.   DOI: 10.3778/j.issn.1002-8331.2410-0153
    摘要234)      PDF(pc) (1630KB)(321)    收藏
    准确识别驾驶员情绪可以有效预防潜在的危险驾驶行为,减少交通事故的发生,是提升道路安全和驾驶体验的重要技术。随着人工智能和多模态数据处理技术的进步,情绪识别技术从单模态方法逐步发展为多模态方法。梳理了当前多模态驾驶员情绪识别的研究进展,重点总结了面部表情、语音信号、生理信号以及车辆行为四种模态的识别流程,关键步骤包括数据预处理、特征提取和多模态融合。通过分析现有研究,总结了不同方法的优势与不足,介绍了多个驾驶员情绪相关数据集。最后结合当前研究所面临的挑战,提出了未来多模态驾驶员情绪识别研究领域的五个研究方向。
    参考文献 | 相关文章 | 多维度评价
    7. 人工智能在中医诊疗领域的研究综述
    苏尤丽, 胡宣宇, 马世杰, 张雨宁, 阿布都克力木·阿布力孜, 哈里旦木·阿布都克里木
    计算机工程与应用    2024, 60 (16): 1-18.   DOI: 10.3778/j.issn.1002-8331.2312-0400
    摘要331)      PDF(pc) (6171KB)(306)    收藏
    中医诊疗领域正逐步迈向标准化、客观化、现代化与智能化。在此过程中,人工智能的融入极大地推动了中医诊疗、科学研究及中医传承的发展。从人工智能在中医领域的研究现状出发,梳理了从最初的专家系统和规则引擎,到逐渐成熟的传统机器学习算法,再到如今引领潮流的深度学习三个阶段,人工智能在中医领域的应用发展情况。总结了近年来涌现出的中医知识管理工具和大型模型,这些工具和模型为中医诊疗的智能化提供了坚实的支持。最后针对现阶段人工智能在中医领域中存在的数据公平性、多模态数据理解、模型鲁棒性、个性化医疗及可解释性等多重挑战进行分析。为应对这些挑战,需要持续探索并提出可能的解决方案,以推动中医诊疗智能化的深入发展,更好地满足人民健康需求。
    参考文献 | 相关文章 | 多维度评价
    8. 改进YOLOv11n的无人机小目标检测算法
    李彬, 李生林
    计算机工程与应用    2025, 61 (7): 96-104.   DOI: 10.3778/j.issn.1002-8331.2411-0072
    摘要297)      PDF(pc) (1241KB)(291)    收藏
    为了有效应对无人机航拍中小目标检测面临的复杂背景、目标密集、目标微小化和移动端部署等挑战,对YOLOv11n模型进行了改进。使用RFCBAMConv模块改进C3k2,增强了特征提取能力。设计了膨胀特征金字塔卷积(dilated feature pyramid convolution,DFPC)模块,替代了原有的SPPF层。通过多尺度膨胀卷积,加强了对无人机小目标细节特征的提取。提出了一种新的特征金字塔结构,在P2层增加160×160尺寸的特征图输出,以提取小目标特征信息。该方法替代了传统通过添加P2小目标检测头的做法。引入了CSPOK模块和ContextGuidedBlock_Down(CGBD)卷积,显著提升了全局特征的提取能力和多尺度特征的融合能力。采用动态检测头(DyHead)替代了原有的检测头,提升了模型的目标检测精度。实验结果表明,改进模型在VisDrone数据集上的mAP@0.5和mAP@0.5:0.95指标分别提高了0.071和0.049。此外,在AI-TOD和SODA-A等数据集上的泛化实验也显示,改进模型在mAP@0.5上分别获得0.055和0.048的提升,充分验证了模型的有效性和泛用性。
    参考文献 | 相关文章 | 多维度评价
    9. 大语言模型微调技术的研究综述
    张钦彤, 王昱超, 王鹤羲, 王俊鑫, 陈海
    计算机工程与应用    2024, 60 (17): 17-33.   DOI: 10.3778/j.issn.1002-8331.2312-0035
    摘要261)      PDF(pc) (6335KB)(282)    收藏
    大型语言模型的崛起是深度学习领域的全新里程碑,而微调技术在优化模型性能方面的起到了关键作用。对大型语言模型微调技术进行了全面的综述,回顾了语言模型的统计语言模型、神经网络语言模型、预训练语言模型和大语言模型四个阶段的发展历程和微调技术的基本概念,从经典参数微调、高效参数微调、提示微调和强化学习微调方法四大部分,探讨总结了各微调技术的原理与发展,并进行了一定的对比分析。最后,总结了当前微调技术的研究状况与发展重点,强调了该领域的潜在研究价值,并展望了未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    10. 多智能体深度强化学习及可扩展性研究进展
    刘延飞, 李超, 王忠, 王杰铃
    计算机工程与应用    2025, 61 (4): 1-24.   DOI: 10.3778/j.issn.1002-8331.2407-0034
    摘要241)      PDF(pc) (2161KB)(281)    收藏
    多智能体深度强化学习近年来在解决智能体协作、竞争和通信问题上展现出巨大潜力。然而伴随着其在更多领域的应用,可扩展性问题备受关注,是理论研究到大规模工程应用的重要问题。回顾了强化学习理论和深度强化学习的典型算法,介绍了多智能体深度强化学习三类学习范式及其代表算法,并简要整理出当前主流的开源实验平台。详细探讨了多智能体深度强化学习在数量和场景上的可扩展性研究进展,分析了各自面临的核心问题并给出了现有的解决思路。展望了多智能体深度强化学习的应用前景和发展趋势,为推动该领域的进一步研究提供参考和启示。
    参考文献 | 相关文章 | 多维度评价
    11. 面向通用目标检测的YOLO方法研究综述
    米增, 连哲
    计算机工程与应用    2024, 60 (21): 38-54.   DOI: 10.3778/j.issn.1002-8331.2404-0130
    摘要295)      PDF(pc) (5798KB)(280)    收藏
    作为深度学习时代首个单阶段目标检测算法,YOLO以其强大且独特的范式在计算机视觉领域掀起了一股热潮,并成为目标检测算法的里程碑式成果,至今为止仍是在速度与精度之间实现最佳平衡的典型算法,广泛应用于自动驾驶、智能视觉系统等工业领域。过去的八年里,在深度学习技术的驱动下, YOLO方法有了快速发展并对整个目标检测领域产生深远影响。从技术进化角度深入调查YOLO方法相关工作,对最初的YOLO v1到最新的YOLO v9与YOLO v10每一次迭代创新和贡献进行全面总结,根据不同时间节点的和技术的重大改进将YOLO方法分为早期基础YOLO、标准版本YOLO、标准改进YOLO和独特改进YOLO四部分,详细介绍每个时期改进方法的独特视角。此外,总结评估YOLO方法的数据集与指标,收集了不同版本YOLO、同一版本YOLO不同型号的详细实验结果,从宏观层面与微观层面归纳YOLO的发展变化,通过分析揭示各版本YOLO之间的开发框架、骨干网络架构、先验框使用情况等技术的差异和内在联系,强调了YOLO在速度与准确率之间平衡的重要性。最后通过系统的梳理,凝练YOLO方法未来的发展趋势。
    参考文献 | 相关文章 | 多维度评价
    12. 基于图神经网络的文本分类方法研究综述
    苏易礌, 李卫军, 刘雪洋, 丁建平, 刘世侠, 李浩南, 李贯峰
    计算机工程与应用    2024, 60 (19): 1-17.   DOI: 10.3778/j.issn.1002-8331.2403-0142
    摘要247)      PDF(pc) (3425KB)(272)    收藏
    文本分类是自然语言处理领域中的一个重要任务,旨在将给定的文本数据分配到预定义的一组类别中。传统的文本分类方法只能处理欧氏空间的数据,不能处理图这种非欧氏数据。而对于图结构的文本数据无法直接处理,无法捕捉图中的非欧氏结构。因此,如何将图神经网络应用到文本分类任务中是目前的研究热点之一。对基于图神经网络的文本分类方法进行了综述,概述了基于机器学习和基于深度学习的传统文本分类方法,总结了图卷积神经网络的背景和原理;根据不同类型的图网络详细阐述了基于图神经网络的文本分类方法,同时对图神经网络模型在文本分类中的应用进行了深入分析;对目前基于图神经网络的文本分类模型进行了对比实验,讨论了模型的分类性能;提出了未来的研究方向,以推动该领域的进一步发展。
    参考文献 | 相关文章 | 多维度评价
    13. 大模型在垂直领域应用的现状与挑战
    籍欣萌, 昝红英, 崔婷婷, 张坤丽
    计算机工程与应用    2025, 61 (12): 1-11.   DOI: 10.3778/j.issn.1002-8331.2409-0181
    摘要265)      PDF(pc) (839KB)(271)    收藏
    近年来,以ChatGPT为代表的大语言模型在多个领域受到广泛的关注,并取得优异的表现,推动了人工智能技术的新一轮发展浪潮。目前国产大模型数量已有上百个,覆盖多个行业领域,应用场景也不断扩展。为了更好地应对大模型在自然语言处理中的发展及其对通用任务和领域应用带来的冲击,对自然语言处理和大模型的发展历程进行回顾,阐述了当前大模型的相关技术以及大模型在医疗、法律、金融等垂直领域的应用,并对大模型在应用过程中面临的挑战如能力缺陷、协同问题等作出分析。最后,针对这些问题探讨了大模型在实际应用中的未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    14. 视觉大模型SAM在医学图像分割中的应用综述
    孙兴, 蔡肖红, 李明, 张帅, 马金刚
    计算机工程与应用    2024, 60 (17): 1-16.   DOI: 10.3778/j.issn.1002-8331.2401-0136
    摘要290)      PDF(pc) (7912KB)(262)    收藏
    随着大模型技术的不断发展,以分割一切模型(segment anything model,SAM)为代表的视觉大模型在图像分割领域取得重要突破。SAM通过提示驱动完成一系列下游分割任务,旨在统一解决所有的图像分割问题。因此,将SAM应用于医学图像分割具有重要意义,其泛化性能够适应多种医学图像,为医生提供更全面的解剖结构和病变信息。介绍了图像分割常用的数据集;对SAM的网络结构和泛化性进行细致阐述;重点对SAM应用在全切片成像、磁共振成像、计算机断层扫描、超声和多模态图像的五大类医学图像进行梳理分析,总结优缺点和相应的改进方法;结合当前医学图像分割领域中存在的实际问题,讨论并展望了SAM未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    15. 无人机集群弹性评估及重构技术研究
    韦宸越, 何明, 韩伟, 徐昕, 高宏
    计算机工程与应用    2024, 60 (15): 1-10.   DOI: 10.3778/j.issn.1002-8331.2401-0452
    摘要216)      PDF(pc) (4418KB)(249)    收藏
    无人机集群在实际应用中常受地形地貌、风雪雨雾、防空打击等扰动因素影响,导致集群性能下降、任务完成能力降低。为有效评估和提升集群抗扰能力,从无人机集群弹性评估指标和弹性重构方法两方面展开深入研究。梳理分析无人机集群弹性评估指标研究现状;从预测性重构和抗扰动重构两方面对无人机集群弹性重构方法进行了研究总结;针对评估指标不全面及多任务、多扰动情况下集群无法自适应重构问题,分别提出多维弹性评估指标和无人机集群相变重构方法,进一步考虑了覆盖率、能耗等因素对集群性能的影响,实现了不同任务类型和扰动种类自适应相变,大幅提升了集群应对扰动能力。最后,总结展望无人机集群弹性重构未来发展趋势。
    参考文献 | 相关文章 | 多维度评价
    16. 基于大型语言模型的检索增强生成综述
    刘雪颖, 云静, 李博, 史晓国, 张钰莹
    计算机工程与应用    2025, 61 (13): 1-25.   DOI: 10.3778/j.issn.1002-8331.2410-0088
    摘要227)      PDF(pc) (1412KB)(246)    收藏
    最近,智能体代理能在复杂任务中提供高效的解决方案,在工业界备受关注。作为智能体代理的常见范式之一,检索增强生成(retrieval-augmented generation,RAG)旨在结合信息检索和内容生成技术增强生成响应质量,已逐步成为研究的重点。在对国内外检索增强生成方法研究的基础上,阐述了RAG的基本概念及工作流程,归纳了技术现状,分析了现有RAG技术的优缺点,梳理了现有评估指标、数据集和基准。最后探讨了RAG技术在未来应用场景下所面临的挑战,并展望了其未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    17. 因果学习方法和应用概述
    龙享福, 李少波, 张仪宗, 杨磊, 李传江
    计算机工程与应用    2024, 60 (24): 1-19.   DOI: 10.3778/j.issn.1002-8331.2405-0407
    摘要212)      PDF(pc) (6887KB)(242)    收藏
    机器学习是人工智能和数据科学的核心所在,被广泛应用于教育、交通运输和制造业等领域;随着机器学习的发展及应用领域的延伸,模型在可解释性和公平性等方面显现了一些需要解决的问题。因果学习作为一种将因果关系和机器学习技术相结合的方法,可以增强模型的可解释性,解决公平性等问题,其研究已逐渐成为学术界的热点。因此,在介绍因果学习的相关理论知识的基础上,根据因果学习所能解决的问题对因果解释、因果监督学习、因果公平、因果强化学习等技术进行了全方位的分析概述;从多角度归纳了因果学习在医学、农业和智能制造等领域的应用。最后,总结了因果学习存在的一些开放性问题和挑战,并给出了未来的研究方向,旨在推动因果学习的不断发展。
    参考文献 | 相关文章 | 多维度评价
    18. 改进RT-DETR的航拍小目标检测算法
    刘思元, 高凯, 雍龙泉
    计算机工程与应用    2025, 61 (4): 272-281.   DOI: 10.3778/j.issn.1002-8331.2407-0399
    摘要184)      PDF(pc) (1975KB)(238)    收藏
    针对现有的目标检测算法在航拍图像中的小目标上易出现的漏检和误检问题,提出了基于改进RT-DETR(real-time detection transformer)的算法。在主干网络中引入了部分卷积(partial convolution,PConv),设计了PConvBlock结构,并通过由PConvBlock组成的BasicBlock-PConvBlock模块替代原有BasicBlock,有效减少了模型参数。采用双向特征金字塔网络(bidirectional feature pyramid network,BiFPN)结构优化特征融合模块,并引入S2特征进一步提升小目标的检测能力。引入CARAFE上采样算子,增强了多尺度特征的快速融合。实验表明,在VisDrone测试集上,改进后的模型在参数量上比RT-DETR模型降低了13.9%,同时在mAP0.5和mAP0.5:0.95指标上分别提升了2.4和1.9个百分点。在TT100K和DOTA数据集上均优于RT-DETR算法。改进模型在保持较小参数量和计算量的同时,提高了检测精度,满足了无人机航拍图像实时检测的应用需求。
    参考文献 | 相关文章 | 多维度评价
    19. 太赫兹图像超分辨率重建方法的研究进展
    蒋玉英, 江梦蝶, 葛宏义, 张元, 李广明, 陈心雨, 温茜茜, 陈浩
    计算机工程与应用    2024, 60 (18): 1-16.   DOI: 10.3778/j.issn.1002-8331.2401-0161
    摘要211)      PDF(pc) (6043KB)(238)    收藏
    图像超分辨率是近几十年来图像处理领域的一个重要研究课题,旨在从低分辨率图像中重建出高分辨率图像,其突破了传感器和光学器件制造工艺和成本的限制,从算法方面提高图像分辨率,是一种简单、高效、低成本的方法。太赫兹(Terahertz,THz)图像受到THz波衍射和散射的影响,会产生图像模糊、纹理细节不清晰等问题,越来越多的学者致力于开发THz图像的超分辨率重建方法。根据近年来THz技术与超分辨率重建技术相关文献的研究,对THz图像的三大重建方法进行了详细阐述,重点对基于深度学习的方法进行介绍,并对比了各类算法的重建效果与优缺点;回顾了THz图像质量评价指标和常用数据集,并总结THz图像超分辨率重建技术的相关应用。最后,探讨了THz图像超分辨率重建技术的未来发展趋势。
    参考文献 | 相关文章 | 多维度评价
    20. 改进YOLOv8的道路缺陷检测算法
    王雪秋, 高焕兵, 郏泽萌
    计算机工程与应用    2024, 60 (17): 179-190.   DOI: 10.3778/j.issn.1002-8331.2404-0288
    摘要262)      PDF(pc) (5995KB)(232)    收藏
    道路在长期使用后路面会出现各种缺陷,未能及时侦测和修补这些缺陷可能严重缩短道路寿命并危害行车安全。因此,道路缺陷的即时检测是一项重要的任务。传统的检测方法存在检测速度慢,成本要求高的问题。为了解决这些问题,在YOLOv8的基础上提出了一种名为DML-YOLO新型道路检测算法,该算法在主干网络中加入MPCA(MultiPath coordinate attention)注意力机制,提高主干网络的特征提取能力,在此基础上提出了C2f-MPDC模块,动态调整感受野,提高检测能力;重新设计了网络的颈部结构,提出新的特征融合金字塔结构DFPN(diversity feature pyramid network),减小模型的体积并融合低层的特征图获得丰富的细节信息,提高检测小目标的成功率;设计一种轻量级共享卷积检测头(LSCD head),减少模型尺寸,提高检测效率。大量实验结果表明,DML-YOLO在RDD2022数据集和VOC2007数据集上平均检测精度mAP@0.5分别为89.6%和73.6%,优于其他测试模型,并且参数量和计算量相较于YOLOv8模型分别减少了32.37%和14.49%,更加适合部署在嵌入式系统、移动设备等计算资源受限和边缘计算的场景。
    参考文献 | 相关文章 | 多维度评价
    21. 视觉惯性联合标定发展综述
    赵军阳, 吕慎华, 李永旭, 祝慧鑫, 张克凡
    计算机工程与应用    2025, 61 (8): 1-16.   DOI: 10.3778/j.issn.1002-8331.2409-0330
    摘要191)      PDF(pc) (1197KB)(229)    收藏
    相机和IMU联合可充分利用两个传感器的互补优势,实现数据融合与相互校正。近年来,更多智能化的联合标定方法不断出现,但缺少统一的归纳分析。为此,将视觉惯性联合标定方法统一分类整理,旨在分析各类方法的应用特点与局限性,为相机与IMU联合标定方法应用层面或是研究层面提供更好的选择基础。介绍了相机与IMU标定参数以及标定原理,并从时间、空间两个角度展开论述。分别对在线、离线的时间标定方法,进行分类归纳并作对比分析;从空间的角度,基于IMU和相机的标定方法原理不同将标定方法分为四类:基于优化的标定、基于解耦模型的标定、基于滤波的标定、基于机器学习的标定,深入分析每种方法的优势与局限性等。最后,总结全文并提出未来联合标定的发展趋势:时空统一标定、更多标定工具包、机器学习的扩展、多传感器联合标定等。
    参考文献 | 相关文章 | 多维度评价
    22. BEV感知学习在自动驾驶中的应用综述
    黄德启, 黄海峰, 黄德意, 刘振航
    计算机工程与应用    2025, 61 (6): 1-21.   DOI: 10.3778/j.issn.1002-8331.2407-0501
    摘要212)      PDF(pc) (2079KB)(227)    收藏
    自动驾驶感知模块中作为采集输入的传感器种类不断发展,要使多模态数据统一地表征出来变得愈加困难。BEV感知学习在自动驾驶感知任务模块中可以使多模态数据统一融合到一个特征空间,相比于其他感知学习模型拥有更好的发展潜力。从研究意义、空间部署、准备工作、算法发展及评价指标五个方面总结了BEV感知模型具有良好发展潜力的原因。BEV感知模型从框架角度概括为四个系列:Lift-Splat-Lss系列、IPM逆透视转换、MLP视图转换及Transformer视图转换;从输入数据概括为两类:第一类是纯图像特征的输入包括单目摄像头输入和多摄像头输入,第二类在融合数据输入中不仅是简单的点云数据和图像特征的数据融合,还包括了以点云数据为引导或监督的知识蒸馏融合和以引导切片方式去划分高度段的融合。概述了多目标追踪、地图分割、车道线检测及3D目标检测四种自动驾驶任务在BEV感知模型当中的应用,并总结了目前BEV感知学习四个系列框架的缺点。
    参考文献 | 相关文章 | 多维度评价
    23. 基于深度学习的二维单人姿态估计综述
    苏妍妍, 邱志良, 李帼, 陆声链, 陈明
    计算机工程与应用    2024, 60 (21): 18-37.   DOI: 10.3778/j.issn.1002-8331.2403-0152
    摘要141)      PDF(pc) (7680KB)(226)    收藏
    人体姿态估计是计算机视觉领域的一项关键技术,它通过检测人体关键点以识别人体姿态。随着深度学习的快速发展,其已成为人体姿态估计的主流技术并取得了显著进展。围绕单人姿态估计问题,从数据预处理、网络架构设计、监督学习方法以及后处理技术四个维度对基于深度学习的单人姿态估计研究进行回顾,同时探讨关键点表征的新方式及Transformer模型在该领域的应用,此外还介绍了常用的数据集和性能估计指标,深入讨论当前单人姿态估计领域的挑战和发展方向。
    参考文献 | 相关文章 | 多维度评价
    24. 基于深度学习的肺部CT图像病灶区域分割研究综述
    李小童, 马素芬, 生慧, 魏国辉, 李欣桐
    计算机工程与应用    2025, 61 (4): 25-42.   DOI: 10.3778/j.issn.1002-8331.2403-0315
    摘要213)      PDF(pc) (4394KB)(223)    收藏
    肺癌严重威胁人们的生命健康。肺部CT图像病灶区域形态复杂多样,实现高精度的肺部CT图像病变区域分割,成为计算机辅助诊断领域的一个极具挑战性的关键问题。基于深度学习的肺部病灶区域分割不仅可以帮助医生快速、准确地诊断出早期肺癌,而且对于肺癌的治疗也具有重要的临床价值。为了深入研究肺部病灶区域分割技术,介绍了常用的数据集及评价指标;重点从基于卷积神经网络、基于U-Net模型、基于生成对抗网络三个方面对深度学习肺部病灶区域分割模型进行了综述;结合具体实验总结了近5年国内外研究的创新点,对比分析了各个模型的分割性能;最后总结了各类模型的优缺点,展望了该领域的未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    25. 改进RT-DETR的无人机图像目标检测算法
    姜贸翔, 司占军, 王晓喆
    计算机工程与应用    2025, 61 (1): 98-108.   DOI: 10.3778/j.issn.1002-8331.2405-0331
    摘要216)      PDF(pc) (5878KB)(220)    收藏
    针对轻小型无人机图像目标检测中由于目标灵活多样、环境复杂多变导致的检测精度低等问题,提出基于改进RT-DETR无人机目标检测算法。综合考虑轻量级SimAM注意力和倒置残差模块改进ResNet-r18主干网络,提高目标检测模型的特征提取能力。采用级联分组注意力机制优化倒置残差模块和特征交互模块,提升特征选择能力,实现目标检测信息的精细化获取。颈部网络中引入160×160检测层,提升特征融合阶段小目标的感知能力。基于VisDrone2019数据集的实验结果表明,改进后的模型具有更低的参数量和更高的检测精度。在Alver_Lab_Ulastirma和HIT-UAV数据集上进一步验证了改进方法的有效性和鲁棒性。
    参考文献 | 相关文章 | 多维度评价
    26. 知识图谱嵌入方法的链接预测研究综述
    刘海超, 柳林, 王海龙, 赵巍伟, 刘静
    计算机工程与应用    2025, 61 (8): 17-34.   DOI: 10.3778/j.issn.1002-8331.2407-0158
    摘要177)      PDF(pc) (1109KB)(218)    收藏
    知识图谱中普遍存在实体和关系缺失等不足,知识图谱补全能够有效解决上述不足被研究者广泛关注。知识图谱嵌入方法的链接预测作为知识补全的重要研究方向,能够预测出知识图谱中缺失的实体或关系,来补全知识图谱并增强其完整性。阐述了知识图谱链接预测的研究背景、意义和定义;以嵌入单位的实体个数为分类标准,将知识图谱嵌入的链接预测模型划分为双实体嵌入链接预测模型和多实体嵌入链接预测模型,详细阐述模型构建思路,分析实验结果并总结各类模型优缺点。最后,展望知识图谱嵌入链接预测现状以及未来研究方向,为后续的发展提供启示和指导。
    参考文献 | 相关文章 | 多维度评价
    27. 改进YOLOv8的无人机航拍图像小目标检测算法
    侯颖, 吴琰, 寇旭瑞, 黄嘉超, 庹金豆, 王裕旗, 黄晓俊
    计算机工程与应用    2025, 61 (11): 83-92.   DOI: 10.3778/j.issn.1002-8331.2411-0214
    摘要145)      PDF(pc) (1986KB)(217)    收藏
    无人机拍摄影像存在大量分布密集的小目标,针对通用目标检测方法对小目标容易造成漏检和错检的问题,提出了一种改进YOLOv8的无人机航拍图像小目标检测算法。利用高分辨率浅层特征信息具有较小的感受野和更精细的空间信息特性,改进算法增加小目标物体检测头,采用四个特征检测头提升小目标检测率。设计构造ConvSPD卷积模块和BiFormer注意力增强模块的小目标检测模块组改进YOLOv8骨干网络,有效增强小目标浅层细节特征信息的捕获能力。为确保模型的硬件终端部署需求,采用可重参数化的Rep-PAN模型优化Neck网络。Head网络采用Focaler-CIoU损失函数优化回归定位损失,提高定位精度。在VisDrone-2019数据集上,改进算法平均检测精度达到51.2%,比YOLOv8提高10.9个百分点,检测速度为63.7 FPS,具有良好的实时性。
    参考文献 | 相关文章 | 多维度评价
    28. 语义信息处理方式分类的车道线检测技术研究综述
    洪书颖, 张东霖
    计算机工程与应用    2025, 61 (5): 1-17.   DOI: 10.3778/j.issn.1002-8331.2406-0160
    摘要194)      PDF(pc) (2981KB)(215)    收藏
    随着自动驾驶技术的迅猛发展,车道线检测作为其关键组成部分,引起了广泛关注,并在智能交通系统中展现出巨大的应用潜力。然而,在应对复杂环境挑战时,传统车道线检测技术往往难以提供足够的识别精度。回顾车道线检测技术的发展轨迹,系统性地梳理了84种先进算法,并创新性地根据语义处理方式划分为四类别:语义分割辅助类、语义信息融合类、语义信息增强类和语义关系建模类。通过深入剖析算法的技术特点和优势,揭示了当前车道线检测技术所面临的主要局限。最后,对未来车道线检测技术的发展方向提出见解,特别是在语义信息利用方面,指出了潜在的研究方向。
    参考文献 | 相关文章 | 多维度评价
    29. LOL-YOLO:融合多注意力机制的低照度目标检测
    蒋畅江, 何旭颖, 向杰
    计算机工程与应用    2024, 60 (24): 177-187.   DOI: 10.3778/j.issn.1002-8331.2406-0424
    摘要208)      PDF(pc) (7039KB)(214)    收藏
    针对低照度图像中目标检测面临的夜间模糊场景、边界不明显场景、明暗差异较大场景等挑战,提出了一种动态特征融合的的检测方法LOL-YOLO(low-light YOLO)。引入了自校正照明模块改善低光照图片的质量,应对低照度下的目标不明显问题;提出了动态特征提取模块,采用结合了大卷积核和可变形卷积的注意力机制,广泛灵活的捕捉图像的上下文信息;设计动态检测头增强对不同尺度、空间位置和任务的感知能力,进一步提升目标检测的精度和鲁棒性。采用ExDark、DarkFace、NPD(nighttime pedestrian detection)数据集进行实验验证,实验结果表明,提出的方法与主流算法相比检测精度明显提升,充分验证了该方法的有效性。
    参考文献 | 相关文章 | 多维度评价
    30. 图着色问题的算法研究综述
    宋家欢, 王晓峰, 胡思敏, 贾璟伟, 颜冬
    计算机工程与应用    2024, 60 (18): 66-77.   DOI: 10.3778/j.issn.1002-8331.2403-0434
    摘要276)      PDF(pc) (4612KB)(205)    收藏
    图着色问题(graph coloring problem,GCP)是一个经典的组合优化问题,已广泛应用于数学、计算机科学和生物科学等多个领域。由于图着色问题的NP难特性,目前还没有多项式时间内的精确算法求解该问题,为了给出求解该问题的高效算法,需要对现有算法进行梳理。主要分为智能优化算法、启发式算法、强化学习算法等,从算法原理、改进思路、性能和精度等方面进行对比分析,归纳出算法的优缺点,并指出GCP的研究方向和算法设计路径,对于相关问题的研究有指导意义。
    参考文献 | 相关文章 | 多维度评价
    31. 改进YOLOv8的轻量级瓷砖表面缺陷检测
    余松森, 薛国鹏, 何皇, 赵桂, 文火生
    计算机工程与应用    2024, 60 (18): 88-102.   DOI: 10.3778/j.issn.1002-8331.2312-0155
    摘要163)      PDF(pc) (8560KB)(194)    收藏
    在瓷砖表面缺陷检测方面,在保证一定检测速度的前提下,对于小目标缺陷的检测较为困难,总体检测精度依然较低。提出了一种改进YOLOv8的瓷砖表面缺陷检测方法。第一,对原始的大幅面瓷砖数据集进行数据预处理,通过切片操作得到适合YOLOv8输入尺寸的瓷砖数据,防止瓷砖缺陷在缩放的过程中丢失;第二,考虑到瓷砖表面存在小目标缺陷的占比较大问题,使用SPD-Conv的结构代替传统的下采样方式,能够完整地保留通道维度中的所有信息,从而提高对小目标缺陷的检测能力;第三,对YOLOv8中原有的C2f模块进行改造,加入了Efficient Channel Attention注意力机制,设计了C2f_ECA模块,并在backbone网络中进行替换,使得网络在特征提取的过程中能够更为关注缺陷信息,减少背景信息的干扰;第四,添加了微小目标检测头在第二次下采样后进行检测,提高YOLOv8对微小目标的检测能力。该方法在天池瓷砖瑕疵检测数据集上进行实验验证,改进后的模型分别在mAP50-95、mAP50和mAP75上达到57.7%、86.6%、60.6%,比基础网络YOLOv8s分别提升了9.4、5、14.3个百分点。同时,高于YOLOv8m的精度和远低于YOLOv8m的复杂度,属于轻量级模型,符合工业化的需求。
    参考文献 | 相关文章 | 多维度评价
    32. 基于YOLOv4-tiny-SR的涂层表面缺陷嵌入式检测方法
    赵辉, 侯旭涛, 宋龙, 徐可, 沙建军, 陈宗阳
    计算机工程与应用    2025, 61 (8): 239-249.   DOI: 10.3778/j.issn.1002-8331.2312-0180
    摘要134)      PDF(pc) (4597KB)(194)    收藏
    提出一种涂层表面缺陷检测方法,解决涂层表面缺陷嵌入式检测过程中的检测精度低、速度慢以及对硬件配置要求高等难题。YOLOv4-tiny-SR中使用了新模型块DSRBlock,该模型块的局部结构能够在保证检测精度的同时大幅降低内存消耗并提升检测速度;提出几何平均聚类方法,将聚类中心的更新方式由算术平均转换为几何平均,以避免聚类中心向大目标框偏移;同时针对难检测样本,设计包围盒聚焦损失函数,以增大网络对其学习强度,改善检测效果。基于涂层表面缺陷实测数据的比对实验结果显示,该方法与其他方法相比在参数量、模型大小、检测速度及精度上均具有明显优势,其中与目前主流的YOLOv4-tiny相比,参数量降低51.82%,模型大小减小46%,速度提升39.47%,精度也提升了1.25个百分点。该方法检测速度更快、检测精度更高、内存消耗更小,在面向工业应用的嵌入式设备上实时检测表面缺陷实用价值高,可向相关领域推广应用。
    参考文献 | 相关文章 | 多维度评价
    33. 面向边缘智能的协同推理方法研究综述
    赵婵婵, 吕飞, 石宝, 尉晓敏, 杨星辰, 岳效灿
    计算机工程与应用    2025, 61 (3): 1-20.   DOI: 10.3778/j.issn.1002-8331.2406-0040
    摘要152)      PDF(pc) (7788KB)(191)    收藏
    随着边缘智能的兴起,协同推理技术通过云、边缘和终端设备之间的协作在提升智能应用的效率和性能方面取得了明显的进展。阐述了边缘智能的性能指标和应用场景及挑战,并以边缘智能的评级架构引出协同推理技术下的四种推理范式:端端协同、边端协同、边边协同和云边端协同推理。根据协同推理技术应用场景的局限性和差异性,对不同推理范式中协同推理技术的优势、局限性、原理及优化目标进行了全面分析对比。详细探讨了协同推理技术在不同应用场景下所解决的计算资源分配、推理时延优化和吞吐量优化等问题,指出了边缘智能中协同推理技术在隐私安全、通信服务资源管理、协同训练方面的挑战,并对其未来的发展趋势和研究方向进行了讨论,为该领域的研究提供参考和借鉴。
    参考文献 | 相关文章 | 多维度评价
    34. 提示学习研究综述
    崔金满, 李冬梅, 田萱, 孟湘皓, 杨宇, 崔晓晖
    计算机工程与应用    2024, 60 (23): 1-27.   DOI: 10.3778/j.issn.1002-8331.2407-0436
    摘要180)      PDF(pc) (9840KB)(189)    收藏
    经过微调的预训练语言模型在各领域任务中均取得了显著的性能。但是,预训练和微调之间在训练数据和目标函数方面存在着巨大差距,阻碍了预训练语言模型对下游任务的有效适应。提示学习的提出缩小了预训练和微调之间的差距,并可以很好地应用到小样本甚至零样本场景中。提示学习的核心思想是将提示模板插入到原始输入中,将下游任务数据转化为自然语言的形式输入到预训练模型中,输出预测结果,然后通过语言表达器将输出映射到相应的标签。系统地梳理了当前提示学习的相关工作,根据提示学习的实现步骤,从提示模板和语言表达器构建两个阶段介绍该类方法的研究进展。将基于提示模板的方法细分为人工构建、自动构建、引入外部知识构建提示和思维提示方法4种;将基于语言表达器的方法细分为人工构建的表达器、基于搜索的表达器、软表达器和引入外部知识构建表达器的方法4种。总结了提示学习在自然语言处理、计算机视觉和多模态领域的主要应用,并对提示学习相关实验进行了分析。最后,概述了提示学习的现状和挑战,展望了提示学习的未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    35. 改进YOLOv8算法的城市车辆目标检测
    许德刚, 王双臣, 王再庆, 尹柯栋
    计算机工程与应用    2024, 60 (18): 136-146.   DOI: 10.3778/j.issn.1002-8331.2401-0277
    摘要205)      PDF(pc) (6421KB)(184)    收藏
    针对复杂交通场景下城市车辆目标检测算法存在的漏检、精度低、泛化能力弱的问题,提出一种改进的YOLOv8城市车辆目标检测算法。采用一种改进的GAM-C2f结构来代替主干网络中的C2f模块,平衡模型的计算效率和准确性;设计一种SPPFAPGC模块,防止SPPF结构因最大池化操作所导致的局部特征丢失问题,提高特征图的丰富度,并进一步结合小目标检测头来加强对远处小目标车辆的检测能力,加强局部特征与全局特征的融合。为抑制低质量图像产生的有害梯度,使用WIOU损失函数代替CIoU,以提升网络的边界框回归性能,提高模型的收敛速度和回归精度。在Streets车辆数据集上的实验结果表明,与基准模型YOLOv8n相比,改进算法的mAP50和Recall分别提高了1.6和2.0个百分点,有效改善了城市交通场景下小目标车辆检测性能不佳的问题;在VisDrone2019数据集上进行验证,mAP50和Recall也分别提高了1.1和1.6个百分点,充分证明了改进算法的优越性。与其他先进主流算法相比,改进算法表现出了更高的准确率和查全率,表明改进算法在城市车辆检测任务中具有更好的性能。
    参考文献 | 相关文章 | 多维度评价
    36. 深度学习驱动下的目标检测研究进展综述
    山显英, 张琳, 李泽慧
    计算机工程与应用    2025, 61 (1): 24-41.   DOI: 10.3778/j.issn.1002-8331.2407-0038
    摘要200)      PDF(pc) (7781KB)(184)    收藏
    近年来,深度学习在GPU高性能计算能力的加持下得到了迅速推广,并在安防、医疗、工业等领域实现了广泛应用。目标检测模型的性能也在稳步提高,从传统的目标检测方法逐渐过渡到基于卷积神经网络(CNN)深度学习的进一步应用,极大地节省了人力物力。通过参考大量文献,按照两阶段脉络梳理了目标检测的发展历程以及近年深度学习在目标检测领域内的研究进展,对比了在不同数据集上模型网络的性能,总结不同方法的优势与不足,并对领域内重要数据集作了归纳,还对目标检测算法的落地效果做了总结,特别是生活与科技中的实际应用(无人驾驶、医学图像、遥感等)。最后,还对深度学习驱动下目标检测在未来研究上的机遇和挑战作了展望。
    参考文献 | 相关文章 | 多维度评价
    37. 深度学习在知识图谱构建及推理中的应用
    孙宇, 刘川, 周扬
    计算机工程与应用    2025, 61 (6): 36-52.   DOI: 10.3778/j.issn.1002-8331.2408-0280
    摘要176)      PDF(pc) (892KB)(180)    收藏
    知识图谱作为自然语言处理领域的一种结构化知识表示形式,能够描述现实世界中的概念及相互关系,常被应用于信息检索、数据管理等领域。深度学习因其具有自动学习多元数据内在规律和表示层次的特性,可用于大规模、高质量知识图谱的精准构建及有效推理,已逐渐成为新兴研究热点。为进一步促进深度学习和知识图谱的技术融合,以知识图谱构建及推理过程为主线,全面介绍深度学习在知识表示、知识抽取、知识融合、知识推理领域的相关理论及最新研究成果;同时,根据近年来的研究趋势,重点归纳与总结了适用于图数据特征推理的图深度学习与知识推理相融合的最新研究成果。最后,对深度学习和知识图谱的融合发展做了概要总结和技术展望,为未来研究发展提供参考和思路。
    参考文献 | 相关文章 | 多维度评价
    38. 基于改进的YOLOv5s刨花板表面小目标缺陷检测算法
    查健, 陈先中, 王文财, 关淯尹, 张洁
    计算机工程与应用    2024, 60 (17): 158-166.   DOI: 10.3778/j.issn.1002-8331.2305-0475
    摘要149)      PDF(pc) (4887KB)(179)    收藏
    针对目前刨花板缺陷检测在小目标检测上精度不佳的问题,提出了一种改进的YOLOv5s刨花板表面小缺陷检测算法YOLOv5s-ATG。对刨花板缺陷存在小目标及尺度变化较大缺陷的问题,将原有检测头与自适应空间特征融合网络(ASFF)相结合,以获得更好的特征融合,提高尺度变化较大情况下小目标检测的精度;在主干网络中引入Transformer模块,利用多头自注意力机制捕获全局空间关系,提升网络的特征提取能力;考虑到平衡模型精度和复杂度,在网络的主干和颈部加入Ghostv2模块,去提升算法的实时性。实验结果表明,改进的算法在实际刨花板缺陷数据集上平均精度(mAP)能够达到0.901,与原始YOLOv5s算法相比,mAP提高了0.046;而对于小目标缺陷类型胶斑,mAP提高了0.138。
    参考文献 | 相关文章 | 多维度评价
    39. 面向工业场景带钢表面缺陷检测的LF-YOLO
    马肖瑶, 黎睿, 李自力, 翟文正
    计算机工程与应用    2024, 60 (18): 78-87.   DOI: 10.3778/j.issn.1002-8331.2404-0411
    摘要172)      PDF(pc) (4872KB)(178)    收藏
    针对工业场景下带钢表面缺陷尺寸大小不一、采集图像模糊导致传统缺陷检测算法在实际应用中精度低的问题,提出一种面向工业场景带钢表面缺陷检测的LF-YOLO算法。模型通过设计一种局部填充上采样模块对输入像素进行上采样,提高模型对模糊图片的识别能力,降低模型对小目标缺陷的漏检率。通过引入专注视觉任务的FReLU激活函数,提高模型定位缺陷的准确率。提出一种轻量级的漏斗注意力机制并与特征提取模块C2f进行结合,增强模型对不同尺寸缺陷的特征提取能力。在开源数据集NEU-DET与GC10-DET上的实验结果表明,改进后的模型平均检测精度比原始YOLOv8算法精度分别高7.0和15.4个百分点,且相较于其他目标缺陷检测模型在平均检测精度方面具有优势,并进一步通过消融实验验证了每个模块的有效性。
    参考文献 | 相关文章 | 多维度评价
    40. 深度学习的多视角三维重建技术综述
    王文举, 唐邦, 顾泽骅, 王森
    计算机工程与应用    2025, 61 (6): 22-35.   DOI: 10.3778/j.issn.1002-8331.2405-0328
    摘要155)      PDF(pc) (3077KB)(178)    收藏
    为解决经典的多视角三维重建方法难以重建复杂物体、重建效果不佳以及在高分辨率上的扩展等问题,深度学习方法被引入用以重建具有更高精度的三维模型。系统地总结归纳、分析和比较了使用深度学习方法的多视角三维重建算法,并按照显式几何和隐式几何两种几何表示方式对近几年的多视角三维重建算法进行了分类与梳理。重点介绍了目前具有较高重建精度的将隐式函数以及体渲染相结合的神经隐式三维重建算法,并分别定量、定性分析了该类部分算法在数据集上的结果;另外列举了常用数据集和评价指标,并对未来的研究趋势和发展方向进行了展望。
    参考文献 | 相关文章 | 多维度评价