全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 两年内
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 改进YOLOv13的红外遥感小目标检测算法
    李平, 陈继锋
    计算机工程与应用    2026, 62 (7): 131-142.   DOI: 10.3778/j.issn.1002-8331.2509-0101
    摘要264)      PDF(pc) (5813KB)(4121)    收藏
    为了有效应对红外遥感场景中小目标尺度较小、信噪比低且易被复杂背景淹没等挑战,对YOLOv13模型进行改进,实现实时性和轻量化的检测需求。通过构建多阶特征聚合模块(multi-level feature aggregation module, MFAM),自底向上汇聚不同语义深度与空间分辨率的层级信息,并自适应重标定其贡献,以缓解小目标在深层语义中被稀释的问题。设计了双路径融合金字塔网络(dual-path fusion pyramid network,DFPN),以互补的自顶向下语义增强路径与自底向上细节回流路径实现跨尺度信息循环交互,从而强化弱小热目标的可分性。提出的上下文感知融合模块(context-aware fusion block,CAFBlock)采用全局自注意力和局部深度卷积的双分支结构以协同建模长距离依赖与精细局部特征,同时结合膨胀卷积多感受野和深度卷积局部细节的双路径处理方式与门控融合机制,全面增强模型的多尺度上下文建模能力。在SIRST和HIT-UAV数据集上进行对比评估,改进模型实现了90.06%和64.37%的AP,分别提高了7.65个百分点和8.55个百分点,充分验证了模型的有效性和可行性。
    参考文献 | 相关文章 | 多维度评价
    2. 基于大语言模型的智能问答系统研究综述
    任海玉, 刘建平, 王健, 顾勋勋, 陈曦, 张越, 赵昌顼
    计算机工程与应用    2025, 61 (7): 1-24.   DOI: 10.3778/j.issn.1002-8331.2409-0300
    摘要1327)      PDF(pc) (1720KB)(1033)    收藏
    智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥有数十亿甚至上千亿个参数,不仅能够理解和生成自然语言,还能显著提升问答系统的准确性和效率,推动智能问答技术的发展。近年来,基于大模型技术的智能问答逐渐成为研究热点,但对该领域的系统性综述仍然较为欠缺。因此,针对大模型的智能问答系统进行系统综述,介绍了问答系统的基本概念和数据集及其评价指标;介绍了基于大模型的问答系统,其中包括基于提示学习的问答系统、基于知识图谱的问答系统、基于检索增强生成的问答系统和基于智能代理的问答系统以及微调在问答任务中的技术路线,并对比了五种方法在问答系统中的优缺点和应用场景;对于当前基于大语言模型的问答系统面临的研究挑战和未来发展趋势进行了总结。
    参考文献 | 相关文章 | 多维度评价
    3. 改进YOLOv11n的无人机小目标检测算法
    李彬, 李生林
    计算机工程与应用    2025, 61 (7): 96-104.   DOI: 10.3778/j.issn.1002-8331.2411-0072
    摘要1111)      PDF(pc) (1241KB)(885)    收藏
    为了有效应对无人机航拍中小目标检测面临的复杂背景、目标密集、目标微小化和移动端部署等挑战,对YOLOv11n模型进行了改进。使用RFCBAMConv模块改进C3k2,增强了特征提取能力。设计了膨胀特征金字塔卷积(dilated feature pyramid convolution,DFPC)模块,替代了原有的SPPF层。通过多尺度膨胀卷积,加强了对无人机小目标细节特征的提取。提出了一种新的特征金字塔结构,在P2层增加160×160尺寸的特征图输出,以提取小目标特征信息。该方法替代了传统通过添加P2小目标检测头的做法。引入了CSPOK模块和ContextGuidedBlock_Down(CGBD)卷积,显著提升了全局特征的提取能力和多尺度特征的融合能力。采用动态检测头(DyHead)替代了原有的检测头,提升了模型的目标检测精度。实验结果表明,改进模型在VisDrone数据集上的mAP@0.5和mAP@0.5:0.95指标分别提高了0.071和0.049。此外,在AI-TOD和SODA-A等数据集上的泛化实验也显示,改进模型在mAP@0.5上分别获得0.055和0.048的提升,充分验证了模型的有效性和泛用性。
    参考文献 | 相关文章 | 多维度评价
    4. 基于多模态融合的无人机识别研究综述
    李旻姝, 周莫涵, 支瑞聪
    计算机工程与应用    2025, 61 (21): 1-14.   DOI: 10.3778/j.issn.1002-8331.2501-0014
    摘要911)      PDF(pc) (17525KB)(803)    收藏
    随着无人机技术的迅速发展,在相关技术应用越来越多的同时也带来了许多安全隐患和监管难题。反无人机检测技术作为应对这些挑战的重要手段,受到了广泛的关注。传统的无人机检测方法依赖于单一的模态数据,例如视觉、音频、雷达及射频信号等,但这些单一模态数据在复杂场景下所获取的信息有限。近年来,深度学习方法在小目标检测领域取得良好进展,同时多模态融合技术的相关研究也使目标检测的精度和鲁棒性得到进一步的提升。综述了无人机检测领域的研究进展,重点梳理了多模态融合技术的研究现状;此外,整理了相关无人机检测的评价指标和公开数据集,分析了现有技术的局限性,并指出了未来提升检测精度与鲁棒性的研究方向。
    参考文献 | 相关文章 | 多维度评价
    5. 基于大型语言模型的检索增强生成综述
    刘雪颖, 云静, 李博, 史晓国, 张钰莹
    计算机工程与应用    2025, 61 (13): 1-25.   DOI: 10.3778/j.issn.1002-8331.2410-0088
    摘要1044)      PDF(pc) (1412KB)(700)    收藏
    最近,智能体代理能在复杂任务中提供高效的解决方案,在工业界备受关注。作为智能体代理的常见范式之一,检索增强生成(retrieval-augmented generation,RAG)旨在结合信息检索和内容生成技术增强生成响应质量,已逐步成为研究的重点。在对国内外检索增强生成方法研究的基础上,阐述了RAG的基本概念及工作流程,归纳了技术现状,分析了现有RAG技术的优缺点,梳理了现有评估指标、数据集和基准。最后探讨了RAG技术在未来应用场景下所面临的挑战,并展望了其未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    6. 基于卷积神经网络的图像分类深度学习模型综述
    刘鸿达, 孙旭辉, 李沂滨, 韩琳, 张宇
    计算机工程与应用    2025, 61 (11): 1-21.   DOI: 10.3778/j.issn.1002-8331.2411-0196
    摘要961)      PDF(pc) (1675KB)(627)    收藏
    使用神经网络模型进行图像分类任务一直是非常重要的研究方向,随着深度学习技术的发展,对神经网络模型的要求也越来越高。在识别率高的同时,对模型的参数量、训练时间也都有较高的要求。卷积神经网络一直是深度学习中针对图像处理的主流方法,主要介绍基于卷积神经网络的分类模型的发展历程,分析其不同阶段各个模型的搭建思路;介绍Transformer与卷积神经网络结合的相关模型以及各模型在其他领域的应用情况。最后,对卷积神经网络的发展进行了探讨。
    参考文献 | 相关文章 | 多维度评价
    7. DMF-YOLOv11:基于改进YOLOv11n的无人机航拍图像目标检测算法
    贺智轩, 陈里里, 王翔, 李荣华
    计算机工程与应用    2025, 61 (14): 88-100.   DOI: 10.3778/j.issn.1002-8331.2502-0223
    摘要1052)      PDF(pc) (1893KB)(527)    收藏
    针对无人机航拍视角下目标检测中存在的小尺寸目标密集、多尺度变化显著及复杂场景干扰导致的检测精度不足问题,提出一种基于YOLOv11n改进的无人机航拍图像目标检测算法DMF-YOLOv11。设计双重双向辅助特征金字塔网络(dual bidirectional auxiliary feature pyramid network,DBAFPN)作为Neck结构,通过多层级特征双向融合机制增强极小目标与常规小目标的特征表征能力;构建多分支混合卷积模块(multi-branch hybrid convolution,MBHConv),采用并行异构卷积路径提升模型对小尺度目标的感知灵敏度;将自调特征聚合网络(self-modulating feature aggregation network, SMFANet)与主干网络C3K2模块深度融合,提出C3K2_FMB模块以协同提取局部细节与非全局上下文特征。在VisDrone2019数据集上的实验表明,DMF-YOLOv11的mAP50与mAP50-95分别达到46.2%和28.4%,较基准模型YOLOv11n分别提升11.5和8.3个百分点,召回率提升9.4个百分点至44.6%。改进算法有效提升了无人机航拍场景下的目标检测精度。
    参考文献 | 相关文章 | 多维度评价
    8. 大语言模型微调技术的研究综述
    张钦彤, 王昱超, 王鹤羲, 王俊鑫, 陈海
    计算机工程与应用    2024, 60 (17): 17-33.   DOI: 10.3778/j.issn.1002-8331.2312-0035
    摘要637)      PDF(pc) (6335KB)(482)    收藏
    大型语言模型的崛起是深度学习领域的全新里程碑,而微调技术在优化模型性能方面的起到了关键作用。对大型语言模型微调技术进行了全面的综述,回顾了语言模型的统计语言模型、神经网络语言模型、预训练语言模型和大语言模型四个阶段的发展历程和微调技术的基本概念,从经典参数微调、高效参数微调、提示微调和强化学习微调方法四大部分,探讨总结了各微调技术的原理与发展,并进行了一定的对比分析。最后,总结了当前微调技术的研究状况与发展重点,强调了该领域的潜在研究价值,并展望了未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    9. 大模型在垂直领域应用的现状与挑战
    籍欣萌, 昝红英, 崔婷婷, 张坤丽
    计算机工程与应用    2025, 61 (12): 1-11.   DOI: 10.3778/j.issn.1002-8331.2409-0181
    摘要725)      PDF(pc) (839KB)(473)    收藏
    近年来,以ChatGPT为代表的大语言模型在多个领域受到广泛的关注,并取得优异的表现,推动了人工智能技术的新一轮发展浪潮。目前国产大模型数量已有上百个,覆盖多个行业领域,应用场景也不断扩展。为了更好地应对大模型在自然语言处理中的发展及其对通用任务和领域应用带来的冲击,对自然语言处理和大模型的发展历程进行回顾,阐述了当前大模型的相关技术以及大模型在医疗、法律、金融等垂直领域的应用,并对大模型在应用过程中面临的挑战如能力缺陷、协同问题等作出分析。最后,针对这些问题探讨了大模型在实际应用中的未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    10. 轻量化深度卷积神经网络设计研究进展
    周志飞, 李华, 冯毅雄, 陆见光, 钱松荣, 李少波
    计算机工程与应用    2024, 60 (22): 1-17.   DOI: 10.3778/j.issn.1002-8331.2404-0372
    摘要610)      PDF(pc) (6330KB)(472)    收藏
    轻量化设计是解决深度卷积神经网络(deep convolutional neural network,DCNN)对设备性能和硬件资源依赖性的流行范式,轻量化的目的是在不牺牲网络性能的前提下,提高计算速度和减少内存占用。综述了DCNN的轻量化设计方法,着重回顾了近年来DCNN的研究进展,包括体系设计和模型压缩两大轻量化策略,深入比较了这两类方法的创新性、优势与局限性,并探讨了支撑轻量化模型的底层框架。此外,对轻量化网络已经成功应用的场景进行了描述,并对DCNN轻量化的未来发展趋势进行了预测,旨在为深度卷积神经网络的轻量化研究提供有益的见解和参考。
    参考文献 | 相关文章 | 多维度评价
    11. 深度强化学习求解移动机器人端到端导航问题的研究综述
    何丽, 姚佳程, 廖雨鑫, 张文智, 卢赵清, 袁亮, 肖文东
    计算机工程与应用    2024, 60 (14): 1-13.   DOI: 10.3778/j.issn.1002-8331.2312-0256
    摘要389)      PDF(pc) (4646KB)(450)    收藏
    自主导航是移动机器人完成复杂任务的前提和基础,传统的自主导航系统依赖于地图的精度,无法适应高度复杂的作业和服务场景。移动机器人不依赖先验地图信息,通过深度强化学习与环境交互学习能够自主决策的端到端导航方法成为新的研究热点。大多数现有的分类方法不能全面地总结端到端导航问题的挑战和机遇,根据端到端导航系统的特点,将导航问题的挑战归结为导航智能体感知能力差、学习效率低和导航策略泛化能力弱等关键问题,阐述了端到端导航系统的研究现状和发展趋势,分别详细介绍了近年来针对这些关键问题的代表性研究成果,并对其优势和不足进行了归纳总结。最后,从视觉语言导航、多智能体协同导航、融合超分辨率重建图像的端到端导航和可解释性端到端导航等方面展望了移动机器人端到端导航的未来发展趋势,为移动机器人端到端导航的研究和应用提供一定的思路。
    参考文献 | 相关文章 | 多维度评价
    12. 多智能体深度强化学习及可扩展性研究进展
    刘延飞, 李超, 王忠, 王杰铃
    计算机工程与应用    2025, 61 (4): 1-24.   DOI: 10.3778/j.issn.1002-8331.2407-0034
    摘要605)      PDF(pc) (2161KB)(423)    收藏
    多智能体深度强化学习近年来在解决智能体协作、竞争和通信问题上展现出巨大潜力。然而伴随着其在更多领域的应用,可扩展性问题备受关注,是理论研究到大规模工程应用的重要问题。回顾了强化学习理论和深度强化学习的典型算法,介绍了多智能体深度强化学习三类学习范式及其代表算法,并简要整理出当前主流的开源实验平台。详细探讨了多智能体深度强化学习在数量和场景上的可扩展性研究进展,分析了各自面临的核心问题并给出了现有的解决思路。展望了多智能体深度强化学习的应用前景和发展趋势,为推动该领域的进一步研究提供参考和启示。
    参考文献 | 相关文章 | 多维度评价
    13. 多模态驾驶员情绪识别研究综述
    周欣颖, 李雷孝, 林浩, 张虎成
    计算机工程与应用    2025, 61 (10): 1-18.   DOI: 10.3778/j.issn.1002-8331.2410-0153
    摘要438)      PDF(pc) (1630KB)(422)    收藏
    准确识别驾驶员情绪可以有效预防潜在的危险驾驶行为,减少交通事故的发生,是提升道路安全和驾驶体验的重要技术。随着人工智能和多模态数据处理技术的进步,情绪识别技术从单模态方法逐步发展为多模态方法。梳理了当前多模态驾驶员情绪识别的研究进展,重点总结了面部表情、语音信号、生理信号以及车辆行为四种模态的识别流程,关键步骤包括数据预处理、特征提取和多模态融合。通过分析现有研究,总结了不同方法的优势与不足,介绍了多个驾驶员情绪相关数据集。最后结合当前研究所面临的挑战,提出了未来多模态驾驶员情绪识别研究领域的五个研究方向。
    参考文献 | 相关文章 | 多维度评价
    14. YOLO-PD:轻量级实时行人检测算法
    陈胜宝, 施隆照
    计算机工程与应用    2026, 62 (6): 122-133.   DOI: 10.3778/j.issn.1002-8331.2507-0218
    摘要266)      PDF(pc) (13743KB)(419)    收藏
    针对边缘端设备资源受限和行人检测算法在小目标物体、多尺度物体和重叠遮挡造成的几何形变物体上检测精度低的问题,提出了一种适合部署在边缘端设备的基于YOLOv8的行人检测算法YOLO-PD。针对小目标物体,设计局部Transformer块(partial Transformer block,PTB),增强模型的特征提取能力,PTB的混合结构在保持高效特征提取的同时还能降低计算成本;针对多尺度物体,设计金字塔共享空洞卷积(pyramid shared dilation convolution,PSDC),利用共享权重参数的多尺度空洞卷积来提高模型多尺度特征提取能力的同时减小模块体积;针对几何形变物体,设计轻量级可变形动态检测头(light deformable dynamic head,LDDH),在检测头中通过动态调整加权因子来提升检测精度、通过可变形卷积来更精准地获取形变物体的特征。实验结果表明,与基线模型YOLOv8n相比,YOLO-PD在自建的行人检测数据集COCO-Person和VOC-Person上的mAP50分别提高了2.9和1.9个百分点,参数量减少了34.3%;在公开的行人检测数据集WidePerson上,mAP50和mAP50:95分别提高了1.8和1.1个百分点。在行人检测任务上该算法检测精度高、泛化能力强、极小的参数量让它适合部署在边缘端设备。
    参考文献 | 相关文章 | 多维度评价
    15. 深度学习下的医学图像分割综述
    邢素霞, 李珂娴, 方俊泽, 郭正, 赵士杭
    计算机工程与应用    2025, 61 (7): 25-41.   DOI: 10.3778/j.issn.1002-8331.2409-0142
    摘要775)      PDF(pc) (1527KB)(416)    收藏
    针对医学图像的高维性、复杂性和高精度要求等特性,深度学习下的医学图像分割方法凭借其强大的特征提取能力和对复杂模式的学习能力,能够自适应地从大量数据中学习并提取多层次特征,展现出高精度、高鲁棒性和可扩展性强等优势。通过端到端地提取感兴趣的器官、组织或病变区域,为医生在疾病诊断、制定治疗策略和临床研究等领域提供有力帮助。重点综述了U-Net、Transformer、Mamba、分割一切模型(segment anything model,SAM)及其各自变体模型在医学图像分割中的应用情况和发展脉络,从多个维度进行了综合对比分析,对开展医学影像研究、临床疾病诊断与治疗决策,以及医疗技术创新产品开发均具有一定参考价值。在此基础上,总结了目前医学图像分割研究中面临的挑战,并对该领域未来的研究前景进行展望。
    参考文献 | 相关文章 | 多维度评价
    16. 改进RT-DETR的航拍小目标检测算法
    刘思元, 高凯, 雍龙泉
    计算机工程与应用    2025, 61 (4): 272-281.   DOI: 10.3778/j.issn.1002-8331.2407-0399
    摘要446)      PDF(pc) (1975KB)(407)    收藏
    针对现有的目标检测算法在航拍图像中的小目标上易出现的漏检和误检问题,提出了基于改进RT-DETR(real-time detection transformer)的算法。在主干网络中引入了部分卷积(partial convolution,PConv),设计了PConvBlock结构,并通过由PConvBlock组成的BasicBlock-PConvBlock模块替代原有BasicBlock,有效减少了模型参数。采用双向特征金字塔网络(bidirectional feature pyramid network,BiFPN)结构优化特征融合模块,并引入S2特征进一步提升小目标的检测能力。引入CARAFE上采样算子,增强了多尺度特征的快速融合。实验表明,在VisDrone测试集上,改进后的模型在参数量上比RT-DETR模型降低了13.9%,同时在mAP0.5和mAP0.5:0.95指标上分别提升了2.4和1.9个百分点。在TT100K和DOTA数据集上均优于RT-DETR算法。改进模型在保持较小参数量和计算量的同时,提高了检测精度,满足了无人机航拍图像实时检测的应用需求。
    参考文献 | 相关文章 | 多维度评价
    17. 深度学习框架下的红外与可见光图像融合方法综述
    李淑慧, 蔡伟, 王鑫, 高蔚洁, 狄星雨
    计算机工程与应用    2025, 61 (9): 25-40.   DOI: 10.3778/j.issn.1002-8331.2410-0012
    摘要657)      PDF(pc) (25398KB)(405)    收藏
    红外与可见光图像融合(infrared and visible image fusion,IVIF)将红外图像与可见光图像的互补信息融合,提升图像质量以支持下游任务。鉴于深度学习在图像融合方面的优势,将其应用在IVIF领域已成为研究热点。对深度学习框架下的红外与可见光图像融合方法进行梳理分析,根据不同的融合框架将融合方法分为基于自编码器、卷积神经网络、生成对抗网络和变换器,并对比分析这四类方法的特点;综述了IVIF的主要应用领域、常用的6个数据集和8个评价指标,并在典型数据集上对各类主流IVIF方法进行定性和定量评估。最后,总结了现有IVIF方法的局限性,并展望了IVIF的未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    18. 基于深度学习的基础设施表面裂纹检测方法研究进展
    胡翔坤, 李华, 冯毅雄, 钱松荣, 李键, 李少波
    计算机工程与应用    2025, 61 (1): 1-23.   DOI: 10.3778/j.issn.1002-8331.2407-0407
    摘要465)      PDF(pc) (9136KB)(394)    收藏
    民用基础设施在长期使用后容易发生物理结构或性能状态的改变,对其功能和使用安全造成一定的损害,因此,对这类设施的结构健康监测是十分必要的。裂纹检测是结构健康监测中极其重要的一部分,及时检测并识别这类损伤,能有效避免事故的发生。基于计算机视觉的表面裂纹检测方法操作简单、检测速度快、准确率高,被广泛应用于民用基础设施的表面裂纹检测。从图像分类、目标检测、语义分割三个不同的检测方向综述了基于深度学习的基础设施表面裂纹检测方法,总结了常见的数据采集方法和常用的公共裂纹数据集。最后讨论了基于深度学习的基础设施表面裂纹检测方法存在的困难与挑战,并展望了未来可能的发展方向。
    参考文献 | 相关文章 | 多维度评价
    19. 面向交通流预测的时空图神经网络发展综述
    闫佳和, 李红辉, 孙婧, 刘杰, 张骏温, 杨晓睿, 徐邑
    计算机工程与应用    2025, 61 (22): 1-19.   DOI: 10.3778/j.issn.1002-8331.2502-0225
    摘要725)      PDF(pc) (1418KB)(392)    收藏
    近年来,深度学习在交通流预测中的应用受到了广泛关注,特别是时空图神经网络在捕捉时空依赖关系和交通特征预测等方面取得了显著成效。已有一些综述探讨了时空图神经网络的应用,但这些研究大多以应用场景为分类依据,未能从模型设计的角度提供深入的总结分析,更缺乏统一的模型分类体系。提出了一种综合考虑“模块选择、融合机制、架构设计、训练策略”的层次分类方法,并将时空图神经网络分为六类:循环图卷积网络、时空全卷积网络、时空注意力网络、时空编码器网络、时空混搭架构网络、附加策略时空网络。针对每一个类别,详细分析了其特有的模型建模方法、时空融合机制,并对比了主要变体的特点。通过分析代表性工作和最新工作,探讨了时空图神经网络的发展规律,并给出了开源模型的源代码地址。收集了常用的公开数据集,并在对比前人实验结果的基础上,对最新先进模型的性能进行可视化分析。最后总结了该领域的发展机遇与挑战,为后续研究提供启发。
    参考文献 | 相关文章 | 多维度评价
    20. 人工智能在中医诊疗领域的研究综述
    苏尤丽, 胡宣宇, 马世杰, 张雨宁, 阿布都克力木·阿布力孜, 哈里旦木·阿布都克里木
    计算机工程与应用    2024, 60 (16): 1-18.   DOI: 10.3778/j.issn.1002-8331.2312-0400
    摘要588)      PDF(pc) (6171KB)(390)    收藏
    中医诊疗领域正逐步迈向标准化、客观化、现代化与智能化。在此过程中,人工智能的融入极大地推动了中医诊疗、科学研究及中医传承的发展。从人工智能在中医领域的研究现状出发,梳理了从最初的专家系统和规则引擎,到逐渐成熟的传统机器学习算法,再到如今引领潮流的深度学习三个阶段,人工智能在中医领域的应用发展情况。总结了近年来涌现出的中医知识管理工具和大型模型,这些工具和模型为中医诊疗的智能化提供了坚实的支持。最后针对现阶段人工智能在中医领域中存在的数据公平性、多模态数据理解、模型鲁棒性、个性化医疗及可解释性等多重挑战进行分析。为应对这些挑战,需要持续探索并提出可能的解决方案,以推动中医诊疗智能化的深入发展,更好地满足人民健康需求。
    参考文献 | 相关文章 | 多维度评价
    21. 面向通用目标检测的YOLO方法研究综述
    米增, 连哲
    计算机工程与应用    2024, 60 (21): 38-54.   DOI: 10.3778/j.issn.1002-8331.2404-0130
    摘要575)      PDF(pc) (5798KB)(384)    收藏
    作为深度学习时代首个单阶段目标检测算法,YOLO以其强大且独特的范式在计算机视觉领域掀起了一股热潮,并成为目标检测算法的里程碑式成果,至今为止仍是在速度与精度之间实现最佳平衡的典型算法,广泛应用于自动驾驶、智能视觉系统等工业领域。过去的八年里,在深度学习技术的驱动下, YOLO方法有了快速发展并对整个目标检测领域产生深远影响。从技术进化角度深入调查YOLO方法相关工作,对最初的YOLO v1到最新的YOLO v9与YOLO v10每一次迭代创新和贡献进行全面总结,根据不同时间节点的和技术的重大改进将YOLO方法分为早期基础YOLO、标准版本YOLO、标准改进YOLO和独特改进YOLO四部分,详细介绍每个时期改进方法的独特视角。此外,总结评估YOLO方法的数据集与指标,收集了不同版本YOLO、同一版本YOLO不同型号的详细实验结果,从宏观层面与微观层面归纳YOLO的发展变化,通过分析揭示各版本YOLO之间的开发框架、骨干网络架构、先验框使用情况等技术的差异和内在联系,强调了YOLO在速度与准确率之间平衡的重要性。最后通过系统的梳理,凝练YOLO方法未来的发展趋势。
    参考文献 | 相关文章 | 多维度评价
    22. 推荐算法研究进展及知识图谱可视化分析
    林素青, 罗定南, 张书华
    计算机工程与应用    2024, 60 (21): 1-17.   DOI: 10.3778/j.issn.1002-8331.2312-0032
    摘要476)      PDF(pc) (1215KB)(368)    收藏
    互联网技术的应用普及使网络数据资源呈指数级增长,从海量数据中获取需求信息愈加困难。推荐算法因能有效解决信息过载问题而备受关注,相关研究成果层出不穷。以中国知网(CNKI)和科学网(WOS)核心合集为主要数据源,采集2012—2024年间出版的4?773篇和4?531篇中英文文献,利用可视化分析工具CiteSpace和VOSviewer绘制文献基本信息与关键词共现图谱;借助图谱分析,提炼核心技术关键词:知识图谱、图神经网络和深度学习,并选取与之关联的代表性推荐算法;通过图表直观展示算法核心机制和基本原理,聚焦现有研究的不足与挑战以及针对性解决方案;基于挑战-方案-来源文献的格式,绘制各核心技术关键词所关联算法的知识架构图,实现推荐原理的可视化。
    参考文献 | 相关文章 | 多维度评价
    23. 多无人机协同规划研究综述
    宁聪, 范菁, 孙书魁
    计算机工程与应用    2025, 61 (1): 42-58.   DOI: 10.3778/j.issn.1002-8331.2405-0110
    摘要792)      PDF(pc) (6173KB)(368)    收藏
    无人机在各行各业中发挥重要作用,多无人机之间的合作已成为研究热点。针对任务分配与路径规划两个核心问题,整理和分析了多无人机协同规划两个关键问题之间的复杂性,以及子问题间的信息耦合因素,并重点探讨了解耦策略;从数学模型方面对多无人机协同规划问题的通用模型进行描述,整理归纳出常见环境建模方法和多目标优化求解的约束条件;综述了基于集中式控制和分布式控制的任务规划方法,以及启发式算法在多无人机协同规划中的应用和研究进展,并重点介绍了多无人机协同规划问题面临实时性要求下的协同规划方法;结合典型研究,讨论了多无人机协同规划问题的未来研究方法与挑战,展望多无人机协同规划的发展。
    参考文献 | 相关文章 | 多维度评价
    24. 检索增强生成技术研究综述
    吴璇, 付涛
    计算机工程与应用    2025, 61 (20): 19-35.   DOI: 10.3778/j.issn.1002-8331.2501-0061
    摘要1358)      PDF(pc) (1071KB)(363)    收藏
    大语言模型在自然语言处理领域表现出强大的能力,但依然面临诸如幻觉、缺乏领域特定知识等问题。检索增强生成(retrieval-augmented generation,RAG)利用大规模的外部知识库来增强模型的语义理解和生成能力,有效缓解了大语言模型所面临的部分问题,为开放域问答、文本摘要、对话系统等自然语言处理任务提供了有效的解决方案。将全面综述检索增强生成的关键技术进展,包括检索器、生成器以及各个部分优化的可能性;总结了现有的检索增强生成评估方法,探讨了当前RAG评估的局限性。最后,讨论了检索增强生成未来可能的研究方向。
    参考文献 | 相关文章 | 多维度评价
    25. 改进YOLOv11s的航拍小目标检测方法研究
    郭家林, 曹云峰
    计算机工程与应用    2026, 62 (8): 80-92.   DOI: 10.3778/j.issn.1002-8331.2507-0111
    摘要269)      PDF(pc) (7612KB)(357)    收藏
    针对在无人机航拍图像中小目标检测面临的高动态场景、目标特征信息少以及机载计算资源受限等问题,提出了一种基于改进YOLOv11s的航拍小目标检测方法。提出了密集跨路径特征金字塔网络(dense cross-path feature pyramid network,DCP-FPN)作为Neck结构,移除了大目标检测层,新增小目标检测层,通过密集连接方式最大化特征利用效率,显著减少模型参数量的同时,有效提升小目标特征捕获能力。提出了一种集成动态通道调整和双分支特征交互的新型轻量级卷积模块Ghost-DSConv,主干分支采用深度可分离卷积(depthwise separable conv,DSConv),辅以分组卷积构成的廉价分支生成补充特征,能够以更小的计算代价提取空间特征并增强特征多样性。提出了轻量级小目标注意力机制模块(lightweight small-target attention,LSTA),通过引入三重注意力强化机制,在极小计算开销的前提下,显著提升了模型对小目标的检测性能。实验结果表明,在VisDrone2019-DET数据集上,提出的改进算法的mAP50与mAP50-95分别提升到44.8%和27.4%。改进后的YOLOv11s模型参数量仅为3.51×106,并部署在基于RK3588s的嵌入式平台上,结果表明该模型能满足实时性的要求,实现了精度与效率的良好平衡;同时,在CARPK和Tinyperson数据集上验证了所提方法的泛化性和有效性。
    参考文献 | 相关文章 | 多维度评价
    26. 基于深度学习的单目视觉目标检测综述
    刘桂超, 王怀光, 任国全, 吴定海
    计算机工程与应用    2026, 62 (1): 1-19.   DOI: 10.3778/j.issn.1002-8331.2504-0330
    摘要356)      PDF(pc) (2212KB)(355)    收藏
    单目视觉目标检测凭借其低硬件成本与高实时性的显著优势,已逐渐成为自动驾驶、智能监控等领域的核心技术,发挥着不可或缺的作用。然而,几何歧义性、遮挡鲁棒性及小目标检测精度等问题仍是当前研究的瓶颈。主要从算法层面出发,从算法演进、性能评估与轻量化设计三个维度系统性地量化分析单目视觉目标检测技术的进展:将单阶段检测算法解构为经典卷积架构与Transformer架构进行剖析,总结其结构创新与性能瓶颈,揭示精度-速度-复杂度的权衡规律;从网络设计-算法优化-模型压缩三个层面探讨轻量化技术与目标检测算法的融合策略,并整合目标检测用于训练和评估的三种主要官方数据集中的多维度评价指标,搭建基于MS-COCO-2017数据集的跨模型对比框架,对不同架构的单阶段检测器进行横向性能对比;展望多模态融合、轻量化改进等前沿方向,旨在为单目视觉目标检测算法的工程化应用与理论突破提供系统性参考。
    参考文献 | 相关文章 | 多维度评价
    27. 基于数字孪生的工控系统信息安全防护研究综述
    王昆昆, 李亚辉, 杜鑫, 徐裴行, 周纯杰
    计算机工程与应用    2026, 62 (6): 1-15.   DOI: 10.3778/j.issn.1002-8331.2508-0252
    摘要315)      PDF(pc) (1788KB)(354)    收藏
    数字孪生技术通过构建实体对象的高保真动态机理模型,在虚拟空间中模拟实体对象行为,孪生空间与实体对象进行实时交互与协同演化,为工控系统信息安全防护研究提供了新的视角。概述了工控系统在信息安全防护过程中面临的多重挑战,阐述了数字孪生的基本原理、发展历程和关键技术;综述了数字孪生技术在工控系统信息安全防护中的应用研究,重点总结了其在系统仿真模拟、防护体系、异常检测和风险评估等方面的研究进展,并对现有研究的局限性进行了总结分析。最后,对数字孪生在工控系统信息安全防护中的未来发展方向进行了总结与展望。
    参考文献 | 相关文章 | 多维度评价
    28. 可见光-红外图像融合的目标检测综述
    朱自文, 宋晓鸥, 崔巍, 岂峰利
    计算机工程与应用    2025, 61 (17): 17-32.   DOI: 10.3778/j.issn.1002-8331.2501-0206
    摘要635)      PDF(pc) (1610KB)(345)    收藏
    随着人工智能技术的快速发展,目标检测与识别的地位日益凸显。基于深度学习的可见光-红外图像融合的目标检测技术具有强大的特征提取和泛化能力,能够有效提取和融合可见光与红外图像特征。对基于双模态图像融合检测的发展现状进行概述,并在基于深度学习的目标检测基础上分析双模态图像融合检测的优势,对比介绍常用的数据集和主要的技术难题。对基于不同阶段融合的目标检测算法进行总结分析,指出特征级融合检测的优势与主导地位;重点对基于不同基础模型的融合检测算法进行分析和总结,探讨了Transformer在双模态融合检测领域的优势和主导地位,以及Mamba在未来研究中的巨大潜力。根据当前可见光-红外图像融合的目标检测研究现状,对未来以实际的开发应用为导向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    29. 改进YOLOv8的道路缺陷检测算法
    王雪秋, 高焕兵, 郏泽萌
    计算机工程与应用    2024, 60 (17): 179-190.   DOI: 10.3778/j.issn.1002-8331.2404-0288
    摘要437)      PDF(pc) (5995KB)(340)    收藏
    道路在长期使用后路面会出现各种缺陷,未能及时侦测和修补这些缺陷可能严重缩短道路寿命并危害行车安全。因此,道路缺陷的即时检测是一项重要的任务。传统的检测方法存在检测速度慢,成本要求高的问题。为了解决这些问题,在YOLOv8的基础上提出了一种名为DML-YOLO新型道路检测算法,该算法在主干网络中加入MPCA(MultiPath coordinate attention)注意力机制,提高主干网络的特征提取能力,在此基础上提出了C2f-MPDC模块,动态调整感受野,提高检测能力;重新设计了网络的颈部结构,提出新的特征融合金字塔结构DFPN(diversity feature pyramid network),减小模型的体积并融合低层的特征图获得丰富的细节信息,提高检测小目标的成功率;设计一种轻量级共享卷积检测头(LSCD head),减少模型尺寸,提高检测效率。大量实验结果表明,DML-YOLO在RDD2022数据集和VOC2007数据集上平均检测精度mAP@0.5分别为89.6%和73.6%,优于其他测试模型,并且参数量和计算量相较于YOLOv8模型分别减少了32.37%和14.49%,更加适合部署在嵌入式系统、移动设备等计算资源受限和边缘计算的场景。
    参考文献 | 相关文章 | 多维度评价
    30. 视觉大模型SAM在医学图像分割中的应用综述
    孙兴, 蔡肖红, 李明, 张帅, 马金刚
    计算机工程与应用    2024, 60 (17): 1-16.   DOI: 10.3778/j.issn.1002-8331.2401-0136
    摘要446)      PDF(pc) (7912KB)(334)    收藏
    随着大模型技术的不断发展,以分割一切模型(segment anything model,SAM)为代表的视觉大模型在图像分割领域取得重要突破。SAM通过提示驱动完成一系列下游分割任务,旨在统一解决所有的图像分割问题。因此,将SAM应用于医学图像分割具有重要意义,其泛化性能够适应多种医学图像,为医生提供更全面的解剖结构和病变信息。介绍了图像分割常用的数据集;对SAM的网络结构和泛化性进行细致阐述;重点对SAM应用在全切片成像、磁共振成像、计算机断层扫描、超声和多模态图像的五大类医学图像进行梳理分析,总结优缺点和相应的改进方法;结合当前医学图像分割领域中存在的实际问题,讨论并展望了SAM未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    31. 融合多尺度层级特征的航拍小目标检测
    杨鸿丹, 付贵, 邵慧超, 汪艺欣, 邵延华, 楚红雨, 邓琥
    计算机工程与应用    2025, 61 (9): 230-241.   DOI: 10.3778/j.issn.1002-8331.2408-0105
    摘要425)      PDF(pc) (4334KB)(329)    收藏
    针对航拍图像大视野、小尺寸、分布密集从而导致小目标检测精度低的问题,提出一种基于YOLOv8改进的融合多尺度特征的航拍检测算法,构建了轻量化的L-MobileViT模块捕获特征间的有效关系,减缓信息丢失,提高模型的检测性能。提出了多层级的多尺度融合模块HF(hierarchical fusion),融合深层级的语义信息与底层级空间纹理信息,提高密集场景下小目标的检测能力。在YOLOv8基础上增加小目标检测头删减大目标检测头,提升小目标检测能力,减少小目标的漏检。实验结果表明,改进后的模型在VisDrone2019与UAV航拍交通小目标数据集(UAV-TrafficTinyDataset)中取得了较优的效果,与基线模型相比,mAP@50分别提高17.6%、15.7%,对小目标的检测效果有明显的提升,综合性能优于主流的航拍检测算法,表明改进算法具有更优泛化性与鲁棒性,适用于航拍场景下的检测任务。
    参考文献 | 相关文章 | 多维度评价
    32. 基于大模型检索增强生成的气象数据库问答模型实现
    江双五, 张嘉玮, 华连生, 杨菁林
    计算机工程与应用    2025, 61 (5): 113-121.   DOI: 10.3778/j.issn.1002-8331.2406-0230
    摘要332)      PDF(pc) (1198KB)(323)    收藏
    随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索智能问答技术实现方案。该方案设计了一种基于关系型数据库(SQL)与文档型数据(NoSQL)的多通道查询路由(multi-channel retrieval router,McRR)方法,为了适配数据库进行大模型查询以及增强大模型对查询表的理解,分别提出指令查询转换方法与数据库表摘要方法DNSUM,提升大模型对数据库的语义理解能力,通过结合问题理解、重排序器和响应生成等关键模块,构建了一个端到端的智能问答模型,可实现多数据源的相关知识检索及答案生成。实验结果显示,该模型可以有效理解用户问题并生成准确的答案,具有良好的检索和响应能力。不仅为气象领域提供了一种智能问答的解决方案,也为气象智能问答技术提供了新的应用实施参考。
    参考文献 | 相关文章 | 多维度评价
    33. 改进YOLOv8的无人机航拍图像小目标检测算法
    侯颖, 吴琰, 寇旭瑞, 黄嘉超, 庹金豆, 王裕旗, 黄晓俊
    计算机工程与应用    2025, 61 (11): 83-92.   DOI: 10.3778/j.issn.1002-8331.2411-0214
    摘要494)      PDF(pc) (1986KB)(322)    收藏
    无人机拍摄影像存在大量分布密集的小目标,针对通用目标检测方法对小目标容易造成漏检和错检的问题,提出了一种改进YOLOv8的无人机航拍图像小目标检测算法。利用高分辨率浅层特征信息具有较小的感受野和更精细的空间信息特性,改进算法增加小目标物体检测头,采用四个特征检测头提升小目标检测率。设计构造ConvSPD卷积模块和BiFormer注意力增强模块的小目标检测模块组改进YOLOv8骨干网络,有效增强小目标浅层细节特征信息的捕获能力。为确保模型的硬件终端部署需求,采用可重参数化的Rep-PAN模型优化Neck网络。Head网络采用Focaler-CIoU损失函数优化回归定位损失,提高定位精度。在VisDrone-2019数据集上,改进算法平均检测精度达到51.2%,比YOLOv8提高10.9个百分点,检测速度为63.7 FPS,具有良好的实时性。
    参考文献 | 相关文章 | 多维度评价
    34. 基于多模态融合网络的无人机小目标检测方法
    姚继林, 刘宏哲, 张铖, 路璐
    计算机工程与应用    2026, 62 (4): 273-283.   DOI: 10.3778/j.issn.1002-8331.2508-0255
    摘要156)      PDF(pc) (42031KB)(315)    收藏
    针对无人机小目标检测在低光和复杂背景下精度低、误检率高的问题,单一模态检测方法难以取得理想效果。因此,提出了一种基于动态交互融合策略的小目标检测方法YOLOv8-DF。设计了双流特征提取网络,采用并行模式分别提取红外和可见光特征,并在Backbone部分引入感受野卷积(receptive field attention convolution,RFAConv),以增强模型的多尺度感知能力。为进一步捕捉全局上下文信息,提出了基于注意力机制的远程信息增强模块(remote information enhancement module,RIEM),并设计了动态特征交互模块(dynamic feature interaction module,DFIM),动态调整各模态优势信息权重,实现深度特征融合。实验结果表明,在DroneVehicle数据集上,YOLOv8-DF与单模态基准模型YOLOv8_RGB和YOLOv8_IR相比,mAP50分别提升了12.3和13.4个百分点,相较于PSFusion融合检测方法,mAP50提升了8.4个百分点,并在LLVIP公开数据集上进行了计算效率和泛化性实验,证明了所提出的方法具有较好的计算效率和泛化性能。
    参考文献 | 相关文章 | 多维度评价
    35. 遥感图像变化检测方法研究综述
    孙剑明, 赵梦鑫, 郝旭耀
    计算机工程与应用    2024, 60 (20): 30-48.   DOI: 10.3778/j.issn.1002-8331.2404-0392
    摘要481)      PDF(pc) (6518KB)(312)    收藏
    遥感图像变化检测是遥感领域中一项重要的研究内容,其旨在利用遥感技术和图像处理方法来识别地表覆盖变化的模式和趋势。为了深入了解该方面的发展现状及其使用的技术方法,总结分析了大量的资料和文献,对遥感图像变化检测方法进行了较为全面的综述。介绍了变化检测的概念和处理流程;从6个角度总结了变化检测方法的分类体系,并回顾了其发展历程;概述了各类变化检测方法的原理和特点,对其优缺点进行了简要分析,从6个方面讨论了对遥感图像进行变化检测的现实应用价值;对存在的一些问题与不足进行了简要分析,提出了可能改善这些问题的方法,同时也预言了这些方法在实际应用中可能会遇到的阻碍。最后,对变化检测方法进行总结,并展望了未来的发展方向,以期更好地了解遥感图像变化检测方法的研究现状和发展趋势,为进一步的研究提供参考。
    参考文献 | 相关文章 | 多维度评价
    36. 深度学习的多视角三维重建技术综述
    王文举, 唐邦, 顾泽骅, 王森
    计算机工程与应用    2025, 61 (6): 22-35.   DOI: 10.3778/j.issn.1002-8331.2405-0328
    摘要462)      PDF(pc) (3077KB)(303)    收藏
    为解决经典的多视角三维重建方法难以重建复杂物体、重建效果不佳以及在高分辨率上的扩展等问题,深度学习方法被引入用以重建具有更高精度的三维模型。系统地总结归纳、分析和比较了使用深度学习方法的多视角三维重建算法,并按照显式几何和隐式几何两种几何表示方式对近几年的多视角三维重建算法进行了分类与梳理。重点介绍了目前具有较高重建精度的将隐式函数以及体渲染相结合的神经隐式三维重建算法,并分别定量、定性分析了该类部分算法在数据集上的结果;另外列举了常用数据集和评价指标,并对未来的研究趋势和发展方向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    37. 面向单目标追踪的对抗攻击技术综述
    陆正之, 黄希宸, 彭勃
    计算机工程与应用    2025, 61 (16): 1-15.   DOI: 10.3778/j.issn.1002-8331.2410-0308
    摘要306)      PDF(pc) (5480KB)(302)    收藏
    单目标追踪是计算机视觉中的关键任务之一。随着人工智能技术的发展,基于深度学习的追踪方法已经成为单目标追踪的主流,显著提升了追踪的精度和可用性。然而深度学习方法易受到对抗攻击威胁,攻击者能够诱使深度追踪模型产生错误的追踪结果,严重影响追踪的鲁棒性和安全性。综述了近年来单目标追踪领域对抗性攻击技术的研究进展,揭示了深度学习追踪模型所面临的潜在安全风险,并分析了该领域所面临的挑战和难题。依据攻击方法是否与视频追踪的在线特性相适应,对现有的单目标追踪对抗性攻击技术进行了分类总结,阐述了基本原理、特征以及代表性工作。最后从构建安全可靠的追踪模型和面向实际应用的追踪攻击等视角,对追踪对抗技术的未来发展趋势进行了展望,探讨了当前追踪攻击研究中的关键问题,包括追踪对抗防御、多模态追踪攻击、物理可实现追踪攻击及非合作追踪攻击等,以推动该领域创新与进步。
    参考文献 | 相关文章 | 多维度评价
    38. 深度学习的点云语义分割方法综述
    蔡子悦, 袁振岳, 庞明勇
    计算机工程与应用    2025, 61 (11): 22-30.   DOI: 10.3778/j.issn.1002-8331.2408-0033
    摘要566)      PDF(pc) (605KB)(298)    收藏
    点云语义分割将点云中每个点赋予语义标签,实现对场景中不同物体的分割,是场景理解的基础。近年来,随着深度学习技术的发展,将深度学习与点云语义分割方法相结合,提升了点云语义分割的处理效率和分割精度,展现出卓越的性能,被广泛应用于交通、医学、建筑设计、虚拟现实等众多领域。在回顾点云语义分割发展历程的基础上,对已有研究进行分类综述,然后分析相关数据集和评价指标,对比已有方法的性能。最后,总结现有研究的不足,并展望未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    39. 因果学习方法和应用概述
    龙享福, 李少波, 张仪宗, 杨磊, 李传江
    计算机工程与应用    2024, 60 (24): 1-19.   DOI: 10.3778/j.issn.1002-8331.2405-0407
    摘要394)      PDF(pc) (6887KB)(297)    收藏
    机器学习是人工智能和数据科学的核心所在,被广泛应用于教育、交通运输和制造业等领域;随着机器学习的发展及应用领域的延伸,模型在可解释性和公平性等方面显现了一些需要解决的问题。因果学习作为一种将因果关系和机器学习技术相结合的方法,可以增强模型的可解释性,解决公平性等问题,其研究已逐渐成为学术界的热点。因此,在介绍因果学习的相关理论知识的基础上,根据因果学习所能解决的问题对因果解释、因果监督学习、因果公平、因果强化学习等技术进行了全方位的分析概述;从多角度归纳了因果学习在医学、农业和智能制造等领域的应用。最后,总结了因果学习存在的一些开放性问题和挑战,并给出了未来的研究方向,旨在推动因果学习的不断发展。
    参考文献 | 相关文章 | 多维度评价
    40. 改进RT-DETR的无人机图像目标检测算法
    姜贸翔, 司占军, 王晓喆
    计算机工程与应用    2025, 61 (1): 98-108.   DOI: 10.3778/j.issn.1002-8331.2405-0331
    摘要392)      PDF(pc) (5878KB)(296)    收藏
    针对轻小型无人机图像目标检测中由于目标灵活多样、环境复杂多变导致的检测精度低等问题,提出基于改进RT-DETR无人机目标检测算法。综合考虑轻量级SimAM注意力和倒置残差模块改进ResNet-r18主干网络,提高目标检测模型的特征提取能力。采用级联分组注意力机制优化倒置残差模块和特征交互模块,提升特征选择能力,实现目标检测信息的精细化获取。颈部网络中引入160×160检测层,提升特征融合阶段小目标的感知能力。基于VisDrone2019数据集的实验结果表明,改进后的模型具有更低的参数量和更高的检测精度。在Alver_Lab_Ulastirma和HIT-UAV数据集上进一步验证了改进方法的有效性和鲁棒性。
    参考文献 | 相关文章 | 多维度评价