全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 三年内
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 改进YOLOv13的红外遥感小目标检测算法
    李平, 陈继锋
    计算机工程与应用    2026, 62 (7): 131-142.   DOI: 10.3778/j.issn.1002-8331.2509-0101
    摘要239)      PDF(pc) (5813KB)(4085)    收藏
    为了有效应对红外遥感场景中小目标尺度较小、信噪比低且易被复杂背景淹没等挑战,对YOLOv13模型进行改进,实现实时性和轻量化的检测需求。通过构建多阶特征聚合模块(multi-level feature aggregation module, MFAM),自底向上汇聚不同语义深度与空间分辨率的层级信息,并自适应重标定其贡献,以缓解小目标在深层语义中被稀释的问题。设计了双路径融合金字塔网络(dual-path fusion pyramid network,DFPN),以互补的自顶向下语义增强路径与自底向上细节回流路径实现跨尺度信息循环交互,从而强化弱小热目标的可分性。提出的上下文感知融合模块(context-aware fusion block,CAFBlock)采用全局自注意力和局部深度卷积的双分支结构以协同建模长距离依赖与精细局部特征,同时结合膨胀卷积多感受野和深度卷积局部细节的双路径处理方式与门控融合机制,全面增强模型的多尺度上下文建模能力。在SIRST和HIT-UAV数据集上进行对比评估,改进模型实现了90.06%和64.37%的AP,分别提高了7.65个百分点和8.55个百分点,充分验证了模型的有效性和可行性。
    参考文献 | 相关文章 | 多维度评价
    2. 无人机飞控系统故障诊断技术研究综述
    安雪, 李少波, 张仪宗, 张安思
    计算机工程与应用    2023, 59 (24): 1-15.   DOI: 10.3778/j.issn.1002-8331.2305-0137
    摘要718)      PDF(pc) (917KB)(1922)    收藏
    近年来,无人机因其运行成本低、机动性强等独特优势被广泛应用于军民各复杂领域;同时,复杂多样的任务对无人机系统的可靠性和安全性提出了更高的要求。无人机故障诊断技术能够及时准确地提供诊断结果,有助于无人机的维护、保养与维修,对提升无人机的作战效能具有重要意义。因此,从无人机的飞控系统剖析各类常见故障的机理,并进行故障归类。主要围绕飞控系统中的传感器、执行器和其他部件的故障诊断技术,分析总结了无人机故障诊断技术的研究方法和现状。探讨了无人机故障诊断技术面临的主要挑战,并指出了未来的发展方向;旨在为无人机故障诊断技术领域研究人员提供一定参考,促进我国无人机故障诊断技术水平的提升。
    参考文献 | 相关文章 | 多维度评价
    3. 基于大语言模型的智能问答系统研究综述
    任海玉, 刘建平, 王健, 顾勋勋, 陈曦, 张越, 赵昌顼
    计算机工程与应用    2025, 61 (7): 1-24.   DOI: 10.3778/j.issn.1002-8331.2409-0300
    摘要1303)      PDF(pc) (1720KB)(1022)    收藏
    智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥有数十亿甚至上千亿个参数,不仅能够理解和生成自然语言,还能显著提升问答系统的准确性和效率,推动智能问答技术的发展。近年来,基于大模型技术的智能问答逐渐成为研究热点,但对该领域的系统性综述仍然较为欠缺。因此,针对大模型的智能问答系统进行系统综述,介绍了问答系统的基本概念和数据集及其评价指标;介绍了基于大模型的问答系统,其中包括基于提示学习的问答系统、基于知识图谱的问答系统、基于检索增强生成的问答系统和基于智能代理的问答系统以及微调在问答任务中的技术路线,并对比了五种方法在问答系统中的优缺点和应用场景;对于当前基于大语言模型的问答系统面临的研究挑战和未来发展趋势进行了总结。
    参考文献 | 相关文章 | 多维度评价
    4. YOLO系列目标检测算法研究进展
    王琳毅, 白静, 李文静, 蒋金哲
    计算机工程与应用    2023, 59 (14): 15-29.   DOI: 10.3778/j.issn.1002-8331.2301-0081
    摘要2054)      PDF(pc) (1009KB)(1015)    收藏
    YOLO算法是目标检测中研究的热点方向之一。近几年,随着YOLO系列算法及其改进模型的不断提出,使其在目标检测领域取得了优异的成绩,被广泛应用于现实中各个领域。针对YOLO系列目标检测算法,整理了目标检测典型数据集及评价指标;回顾了YOLO整体框架以及YOLOv1~YOLOv7目标检测算法的发展历程;总结了在输入、特征提取和预测这三个阶段下的数据增强、轻量化网络构建和IOU损失优化等八个改进方向的模型及性能;介绍了YOLO算法应用领域;结合目标检测目前存在的实际问题,总结并展望了YOLO算法的发展方向。
    参考文献 | 相关文章 | 多维度评价
    5. 激光雷达SLAM算法综述
    刘铭哲, 徐光辉, 唐堂, 钱晓健, 耿明
    计算机工程与应用    2024, 60 (1): 1-14.   DOI: 10.3778/j.issn.1002-8331.2308-0455
    摘要1796)      PDF(pc) (854KB)(990)    收藏
    即时定位与地图构建(simultaneous localization and mapping,SLAM)是自主移动机器人和自动驾驶的关键技术之一,而激光雷达则是支撑SLAM算法运行的重要传感器。基于激光雷达的SLAM算法,对激光雷达SLAM总体框架进行介绍,详细阐述前端里程计、后端优化、回环检测、地图构建模块的作用并总结所使用的算法;按由2D到3D,单传感器到多传感器融合的顺序,对经典的具有代表性的开源算法进行描述和梳理归纳;介绍常用的开源数据集,以及精度评价指标和测评工具;从深度学习、多传感器融合、多机协同和鲁棒性研究四个维度对激光雷达SLAM技术的发展趋势进行展望。
    参考文献 | 相关文章 | 多维度评价
    6. 基于深度学习的目标检测算法研究与应用综述
    张阳婷, 黄德启, 王东伟, 贺佳佳
    计算机工程与应用    2023, 59 (18): 1-13.   DOI: 10.3778/j.issn.1002-8331.2305-0310
    摘要1920)      PDF(pc) (662KB)(983)    收藏
    随着深度学习的不断发展,深度卷积神经网络在目标检测领域中的应用愈加广泛,现已被应用于农业、交通和医学等众多领域。与基于特征的传统手工方法相比,基于深度学习的目标检测方法可以学习低级和高级图像特征,有更好的检测精度和泛化能力。为了概括和总结目标检测领域的最新进展和技术,通过分析近年来基于深度学习的目标检测技术,对基于深度学习的目标检测算法与应用现状进行综述。归纳了两阶段与单阶段两种目标检测网络架构的发展及优缺点;从骨干网络、数据集和评价指标等方面进行叙述,对比了经典算法的检测精度,总结经典目标检测算法的改进策略;讨论了现阶段目标检测应用,并提出了目标检测领域今后的研究重点。
    参考文献 | 相关文章 | 多维度评价
    7. 面向无人机视角下小目标检测的YOLOv8s改进模型
    潘玮, 韦超, 钱春雨, 杨哲
    计算机工程与应用    2024, 60 (9): 142-150.   DOI: 10.3778/j.issn.1002-8331.2312-0043
    摘要928)      PDF(pc) (5858KB)(960)    收藏
    从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(concentration-based attention module)注意力机制改进卷积模块,解决注意力权重参数在感受野特征中共享问题的同时,在通道和空间维度加上注意力权重,增强特征提取能力;通过引入大型可分离卷积注意力思想,改造空间金字塔池化层,增加不同层级特征间的信息交融;优化颈部结构,增加具有丰富小目标语义信息的特征层;使用inner-IoU损失函数的思想改进MPDIoU(minimum point distance based IoU)函数,以inner-MPDIoU代替原损失函数,提升对困难样本的学习能力。实验结果表明,改进后的YOLOv8s模型在VisDrone数据集上mAP、P、R分别提升了16.1%、9.3%、14.9%,性能超过YOLOv8m,可以有效应用于无人机平台上的目标检测任务。
    参考文献 | 相关文章 | 多维度评价
    8. 改进YOLOv11n的无人机小目标检测算法
    李彬, 李生林
    计算机工程与应用    2025, 61 (7): 96-104.   DOI: 10.3778/j.issn.1002-8331.2411-0072
    摘要1103)      PDF(pc) (1241KB)(881)    收藏
    为了有效应对无人机航拍中小目标检测面临的复杂背景、目标密集、目标微小化和移动端部署等挑战,对YOLOv11n模型进行了改进。使用RFCBAMConv模块改进C3k2,增强了特征提取能力。设计了膨胀特征金字塔卷积(dilated feature pyramid convolution,DFPC)模块,替代了原有的SPPF层。通过多尺度膨胀卷积,加强了对无人机小目标细节特征的提取。提出了一种新的特征金字塔结构,在P2层增加160×160尺寸的特征图输出,以提取小目标特征信息。该方法替代了传统通过添加P2小目标检测头的做法。引入了CSPOK模块和ContextGuidedBlock_Down(CGBD)卷积,显著提升了全局特征的提取能力和多尺度特征的融合能力。采用动态检测头(DyHead)替代了原有的检测头,提升了模型的目标检测精度。实验结果表明,改进模型在VisDrone数据集上的mAP@0.5和mAP@0.5:0.95指标分别提高了0.071和0.049。此外,在AI-TOD和SODA-A等数据集上的泛化实验也显示,改进模型在mAP@0.5上分别获得0.055和0.048的提升,充分验证了模型的有效性和泛用性。
    参考文献 | 相关文章 | 多维度评价
    9. 基于多模态融合的无人机识别研究综述
    李旻姝, 周莫涵, 支瑞聪
    计算机工程与应用    2025, 61 (21): 1-14.   DOI: 10.3778/j.issn.1002-8331.2501-0014
    摘要883)      PDF(pc) (17525KB)(786)    收藏
    随着无人机技术的迅速发展,在相关技术应用越来越多的同时也带来了许多安全隐患和监管难题。反无人机检测技术作为应对这些挑战的重要手段,受到了广泛的关注。传统的无人机检测方法依赖于单一的模态数据,例如视觉、音频、雷达及射频信号等,但这些单一模态数据在复杂场景下所获取的信息有限。近年来,深度学习方法在小目标检测领域取得良好进展,同时多模态融合技术的相关研究也使目标检测的精度和鲁棒性得到进一步的提升。综述了无人机检测领域的研究进展,重点梳理了多模态融合技术的研究现状;此外,整理了相关无人机检测的评价指标和公开数据集,分析了现有技术的局限性,并指出了未来提升检测精度与鲁棒性的研究方向。
    参考文献 | 相关文章 | 多维度评价
    10. 农村电商物流下无人机与车辆协同配送路径优化研究
    许菱, 杨林超, 朱文兴, 钟少君
    计算机工程与应用    2024, 60 (1): 310-318.   DOI: 10.3778/j.issn.1002-8331.2306-0115
    摘要1064)      PDF(pc) (666KB)(784)    收藏
    无人机配送正在成为解决物流末端配送难题的重要手段。无人机与车辆协同配送模式克服了无人机配送能力不足、安全性不高的弊端,是无人机参与配送的重要途径之一。针对农村电商物流“最后一公里”配送难、配送贵问题,考虑无人机与车辆协同方式、多无人机多包裹配送等约束,以配送成本最小化为目标构建混合整数规划模型并提出一种两阶段算法对无人机与车辆协同配送路径优化问题进行求解。第一阶段通过带约束的自适应K-means算法确定车辆停靠点范围,第二阶段设计爬山算子与分裂算子改进遗传算法,求得无人机与车辆配送路径。最后,通过算例实验验证了模型和算法的可行性与有效性。研究成果有望为农村电商物流末端配送降本增效提供新思路和参考价值。
    参考文献 | 相关文章 | 多维度评价
    11. 道路交通流数据预测方法研究综述
    孟闯, 王慧, 林浩, 李科岑, 王鑫鹏
    计算机工程与应用    2023, 59 (14): 51-61.   DOI: 10.3778/j.issn.1002-8331.2209-0458
    摘要1591)      PDF(pc) (605KB)(750)    收藏
    道路交通流预测作为智能交通系统中的重要分支,在道路拥堵预测、路径规划等方面起着重要作用。道路交通流数据时空多态、关联性复杂的特性迫使大数据时代下的道路交通流预测方法转型和升级。为了深入挖掘交通流时空性的特征,学者们相继提出各类方法,包括模型融合、模型算法改进、数据定义转换等方式,以求提高模型的预测精度。为了合理综述各类交通流的预测方法,根据所用方法的种类分为三大类:基于统计学的方法、基于机器学习的方法、基于深度学习的方法。通过综述各类交通流预测方法,对近年来新出现的模型与算法进行概括与分析,旨在为相关研究学者提供研究思路。对交通流预测方法进行了总结及展望,给出未来交通流预测领域的探索方向。
    参考文献 | 相关文章 | 多维度评价
    12. 基于多模态融合的情感分析算法研究综述
    郭续, 买日旦·吾守尔, 古兰拜尔·吐尔洪
    计算机工程与应用    2024, 60 (2): 1-18.   DOI: 10.3778/j.issn.1002-8331.2305-0439
    摘要1128)      PDF(pc) (954KB)(685)    收藏
    情感分析是一项新兴技术,其旨在探索人们对实体的态度,可应用于各种领域和场景,例如产品评价分析、舆情分析、心理健康分析和风险评估。传统的情感分析模型主要关注文本内容,然而一些特殊的表达形式,如讽刺和夸张,则很难通过文本检测出来。随着技术的不断进步,人们现在可以通过音频、图像和视频等多种渠道来表达自己的观点和感受,因此情感分析正向多模态转变,这也为情感分析带来了新的机遇。多模态情感分析除了包含文本信息外,还包含丰富的视觉和听觉信息,利用融合分析可以更准确地推断隐含的情感极性(积极、中性、消极)。多模态情感分析面临的主要挑战是跨模态情感信息的整合,因此,重点介绍了不同融合方法的框架和特点,并对近几年流行的融合算法进行了阐述,同时对目前小样本场景下的多模态情感分析进行了讨论,此外,还介绍了多模态情感分析的发展现状、常用数据集、特征提取算法、应用领域和存在的挑战。期望此综述能够帮助研究人员了解多模态情感分析领域的研究现状,并从中得到启发,开发出更加有效的模型。
    参考文献 | 相关文章 | 多维度评价
    13. 基于大型语言模型的检索增强生成综述
    刘雪颖, 云静, 李博, 史晓国, 张钰莹
    计算机工程与应用    2025, 61 (13): 1-25.   DOI: 10.3778/j.issn.1002-8331.2410-0088
    摘要992)      PDF(pc) (1412KB)(678)    收藏
    最近,智能体代理能在复杂任务中提供高效的解决方案,在工业界备受关注。作为智能体代理的常见范式之一,检索增强生成(retrieval-augmented generation,RAG)旨在结合信息检索和内容生成技术增强生成响应质量,已逐步成为研究的重点。在对国内外检索增强生成方法研究的基础上,阐述了RAG的基本概念及工作流程,归纳了技术现状,分析了现有RAG技术的优缺点,梳理了现有评估指标、数据集和基准。最后探讨了RAG技术在未来应用场景下所面临的挑战,并展望了其未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    14. 可解释人工智能研究综述
    赵延玉, 赵晓永, 王磊, 王宁宁
    计算机工程与应用    2023, 59 (14): 1-14.   DOI: 10.3778/j.issn.1002-8331.2208-0322
    摘要1242)      PDF(pc) (683KB)(662)    收藏
    随着机器学习和深度学习的发展,人工智能技术已经逐渐应用在各个领域。然而采用人工智能的最大缺陷之一就是它无法解释预测的依据。模型的黑盒性质使得在医疗、金融和自动驾驶等关键任务应用场景中人类还无法真正信任模型,从而限制了这些领域中人工智能的落地应用。推动可解释人工智能(explainable artificial intelligence,XAI)的发展成为实现关键任务应用落地的重要问题。目前,国内外相关领域仍缺少有关可解释人工智能的研究综述,也缺乏对因果解释方法的关注以及对可解释性方法评估的研究。从解释方法的特点出发,将主要可解释性方法分为三类:独立于模型的方法、依赖于模型的方法和因果解释方法,分别进行总结分析,对解释方法的评估进行总结,列举出可解释人工智能的应用,讨论当前可解释性存在的问题并进行展望。
    参考文献 | 相关文章 | 多维度评价
    15. 公交辅助无人机的城市物流配送模式研究
    彭勇, 任志
    计算机工程与应用    2024, 60 (7): 335-343.   DOI: 10.3778/j.issn.1002-8331.2212-0252
    摘要884)      PDF(pc) (755KB)(653)    收藏
    电子商务迅猛发展倒逼物流行业不断转型升级,针对各地政府鼓励公共交通发展,倡导绿色低碳的物流配送方式,研究了一种公交辅助无人机的配送模式。对问题做出说明后,构建了以配送成本最小的数学模型,并设计了智能通用变邻域搜索算法对问题求解,同时为提高算法求解效率,引入K-means分簇与贪婪算法生成初始解。针对不同规模算例,进行多种局部搜索策略、多种算法对比实验,验证了算法有效性;选取标准CVRP算例,将单卡车配送、卡车无人机协同配送与公交辅助无人机配送模式进行对比,证明其成本、时间优势;选取北京快速公交2号线及周边客户点,通过改变公交站点间距、发车间隔做出敏感度分析,实验结果证明增大站点间距的影响大于发车间隔的改变。
    参考文献 | 相关文章 | 多维度评价
    16. 机器视觉在农作物种子检测中的研究进展
    王昊, 祝玉华, 李智慧, 甄彤
    计算机工程与应用    2023, 59 (22): 69-83.   DOI: 10.3778/j.issn.1002-8331.2303-0166
    摘要424)      PDF(pc) (858KB)(636)    收藏
    农作物种子是农业生产的基础。种子检测作为一种重要的手段,在种子生产、贸易和利用的各个环节都扮演着不可或缺的角色。然而传统的农作物种子识别方法效率低,需要人力以及专业检测设备的支持。相比之下,机器视觉技术能够通过模拟人的视觉功能来实现对目标的无损检测,效率高、准确度高,有助于实现农作物种子的品种识别、分级、分类的自动化、智能化。首先简单叙述了机器视觉技术中图像采集、预处理的方法,并以玉米种子为例给出了目前主流的处理流程,然后具体叙述了机器视觉技术中传统机器学习和深度学习两种检测方式在农作物种子检测中的应用,最后针对玉米不完善粒的研究,在分为以上两种检测方式进行具体叙述的同时,指出了目前存在的问题以及玉米不完善粒检测未来的研究方向。
    参考文献 | 相关文章 | 多维度评价
    17. 基于卷积神经网络的图像分类深度学习模型综述
    刘鸿达, 孙旭辉, 李沂滨, 韩琳, 张宇
    计算机工程与应用    2025, 61 (11): 1-21.   DOI: 10.3778/j.issn.1002-8331.2411-0196
    摘要940)      PDF(pc) (1675KB)(622)    收藏
    使用神经网络模型进行图像分类任务一直是非常重要的研究方向,随着深度学习技术的发展,对神经网络模型的要求也越来越高。在识别率高的同时,对模型的参数量、训练时间也都有较高的要求。卷积神经网络一直是深度学习中针对图像处理的主流方法,主要介绍基于卷积神经网络的分类模型的发展历程,分析其不同阶段各个模型的搭建思路;介绍Transformer与卷积神经网络结合的相关模型以及各模型在其他领域的应用情况。最后,对卷积神经网络的发展进行了探讨。
    参考文献 | 相关文章 | 多维度评价
    18. 改进YOLOv8的多尺度轻量型车辆目标检测算法
    张利丰, 田莹
    计算机工程与应用    2024, 60 (3): 129-137.   DOI: 10.3778/j.issn.1002-8331.2309-0145
    摘要623)      PDF(pc) (713KB)(587)    收藏
    针对传统车辆目标检测模型设备需求高、检测精度低、重叠目标漏检率高等问题,提出了一种改进YOLOv8的车辆目标检测算法RBT-YOLO。采用多尺度融合的方式对主干网络进行重构。对BiFPN进行改进,增加卷积操作以及调整输入输出通道个数以适应YOLOv8,加强其特征融合能力。在Neck部分输出的特征图之后加入轻量型注意力机制Triplet Attention,提升模型的特征提取能力。针对真实情况下车辆目标重叠度较高的问题,使用SoftNMS(soft non-maximum suppression)替换原有NMS,使模型对候选框的处理方式更为温和,增强了模型对目标的检测能力,提升了召回率。在Pascal VOC和MS COCO数据集上进行实验,结果表明提出的RBT-YOLO性能超越原始模型,参数量和计算量下降60%左右,mAP分别提高了2.6和3.0个百分点,并在体积和精度上优于其他经典检测模型,具有很强的实用性。
    参考文献 | 相关文章 | 多维度评价
    19. 轻量化YOLOv8的小样本钢板缺陷检测算法
    窦智, 高浩然, 刘国奇, 常宝方
    计算机工程与应用    2024, 60 (9): 90-100.   DOI: 10.3778/j.issn.1002-8331.2311-0070
    摘要593)      PDF(pc) (5010KB)(568)    收藏
    钢板的表面积较大,表面缺陷非常常见,且呈现多类少量的特点。深度学习很难有效应用于此类小样本缺陷的检测中。为了解决此问题,提出一种基于轻量化YOLOv8的小样本钢板缺陷检测算法,提出一种基于模糊搜索的交互式数据增强算法,可有效解决训练样本缺失导致网络模型无法得到有效训练的问题,使深度学习应用于该领域成为可能。设计LMSRNet(lightweight multi-scale residual networks)网络替换YOLOv8的主干,以实现网络模型的轻量化,并提高其可移植性。提出CBFPN(context bidirectional feature pyramid network)和ECSA(efficient channel spatial attention)模块,使网络能更有效地提取并融合伤痕特征,同时采用Wise-IoU损失函数以提高检测性能。对比实验结果表明,与原YOLOv8算法相比,改进后的网络参数量只有原网络的30%,计算量是原网络的49%,FPS提高了9?帧/s,精确率、召回率、mAP分别提高了2.9、6.5、5.5个百分点,实验结果充分验证了该算法的优势。
    参考文献 | 相关文章 | 多维度评价
    20. 图可视化布局方法最新研究进展综述
    杨卓, 谢雅淇, 陈谊, 战荫伟
    计算机工程与应用    2023, 59 (16): 1-15.   DOI: 10.3778/j.issn.1002-8331.2212-0068
    摘要389)      PDF(pc) (863KB)(561)    收藏
    图可视化是图数据的直观表示,随着图数据的广泛应用,合适的图可视化能够使用户对图数据的理解更加深入和高效。但随着图数据量级的增长,图可视化布局面临着计算时间长,难以发现图的重要结构和关系,以及节点遮挡和复杂的边交叉所产生的视觉杂乱等挑战。因此,如何快速对大规模图数据进行布局,如何强化对图中重要的结构和关系的探索,以及如何生成美观的图可视化布局成为亟需解决的问题。近年来,许多基于力学模型和美学评价标准的优化方法被提出来解决上述问题。另外,图挖掘、图嵌入、图神经网络等机器学习方法从图数据特点的角度,为解决图可视化的布局问题提供了新思路,相比之下,机器学习方法在布局效率和效果上表现出一定的优越性。主要从力导向算法、基于美学约束的布局方法、图挖掘技术和机器学习方法这四方面对图可视化布局的最新研究进展进行了阐述,最后对图可视化布局方法的未来发展进行了展望。
    参考文献 | 相关文章 | 多维度评价
    21. 改进YOLOv8的轻量化无人机目标检测算法
    胡峻峰, 李柏聪, 朱昊, 黄晓文
    计算机工程与应用    2024, 60 (8): 182-191.   DOI: 10.3778/j.issn.1002-8331.2310-0063
    摘要493)      PDF(pc) (813KB)(540)    收藏
    针对无人机目标检测算法计算复杂难以部署,且长尾分布的无人机数据导致检测精度较低的问题,提出了基于改进YOLOv8的轻量化无人机目标检测算法(PC-YOLOv8-n),可均衡网络检测精度与计算量,并对长尾分布数据有一定泛化能力。使用部分卷积层(PConv)替换YOLOv8中的3×3卷积层,对网络进行轻量化处理,解决网络冗余和计算量复杂的问题;融合双通道特征金字塔,增加自上而下的路径,将深层信息与浅层信息进行融合,同层引入轻量化注意力机制,提升网络的特征提取能力;采用均衡焦点损失(EFL)作为类别损失函数,通过均衡尾部类别在网络训练时的梯度权重,增加网络的类别检测能力。实验结果表明,PC-YOLOv8-n在VisDrone2019数据集中具有良好的表现,在mAP50精度上比原始YOLOv8-n算法提高了1.6个百分点,同时模型的参数和计算量分别降低为2.6×106和7.6 GFLOPs,检测速度达到77.2 FPS。
    参考文献 | 相关文章 | 多维度评价
    22. 基于多模态数据的人体行为识别方法研究综述
    王彩玲, 闫晶晶, 张智栋
    计算机工程与应用    2024, 60 (9): 1-18.   DOI: 10.3778/j.issn.1002-8331.2310-0090
    摘要486)      PDF(pc) (8541KB)(523)    收藏
    人体行为识别广泛应用于智能安防、自动驾驶和人机交互等领域。随着拍摄设备和传感器技术的发展,可获取用于人体行为识别的数据不再局限于RGB数据,还有深度、骨骼和红外等多模态数据。详细介绍了基于RGB和骨骼数据模态的人体行为识别任务中特征提取方法,包括基于手工标注和基于深度学习的方法。对于RGB数据模态,重点分析了基于双流卷积神经网络、3D卷积神经网络和混合网络的特征提取算法。对于骨骼数据模态,介绍了目前流行的单人和多人姿态评估算法;重点分析了基于卷积神经网络、循环神经网络和图卷积神经网络的分类算法;进一步全面展示了两种数据模态的通用数据集。此外,基于RGB和骨骼各自的数据结构特征,探讨了目前面临的挑战,最后对未来基于深度学习的人体行为识别方法的研究方向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    23. DMF-YOLOv11:基于改进YOLOv11n的无人机航拍图像目标检测算法
    贺智轩, 陈里里, 王翔, 李荣华
    计算机工程与应用    2025, 61 (14): 88-100.   DOI: 10.3778/j.issn.1002-8331.2502-0223
    摘要1037)      PDF(pc) (1893KB)(519)    收藏
    针对无人机航拍视角下目标检测中存在的小尺寸目标密集、多尺度变化显著及复杂场景干扰导致的检测精度不足问题,提出一种基于YOLOv11n改进的无人机航拍图像目标检测算法DMF-YOLOv11。设计双重双向辅助特征金字塔网络(dual bidirectional auxiliary feature pyramid network,DBAFPN)作为Neck结构,通过多层级特征双向融合机制增强极小目标与常规小目标的特征表征能力;构建多分支混合卷积模块(multi-branch hybrid convolution,MBHConv),采用并行异构卷积路径提升模型对小尺度目标的感知灵敏度;将自调特征聚合网络(self-modulating feature aggregation network, SMFANet)与主干网络C3K2模块深度融合,提出C3K2_FMB模块以协同提取局部细节与非全局上下文特征。在VisDrone2019数据集上的实验表明,DMF-YOLOv11的mAP50与mAP50-95分别达到46.2%和28.4%,较基准模型YOLOv11n分别提升11.5和8.3个百分点,召回率提升9.4个百分点至44.6%。改进算法有效提升了无人机航拍场景下的目标检测精度。
    参考文献 | 相关文章 | 多维度评价
    24. 基于深度神经网络的图像修复算法综述
    吕建峰, 邵立珍, 雷雪梅
    计算机工程与应用    2023, 59 (20): 1-12.   DOI: 10.3778/j.issn.1002-8331.2303-0111
    摘要546)      PDF(pc) (720KB)(507)    收藏
    深度学习的快速发展使计算机视觉技术应用越来越广泛,同时利用深度神经网络根据破损图像的已知信息对图像复原的修复技术成为关注的热点。对近年基于深度神经网络的图像修复方法进行了综述和分析:按照模型优化的方向,对图像修复方法进行分类综述;介绍了图像修复常用的数据集和性能评价指标,并在相关数据集上对各种基于深度神经网络的破损图像修复算法进行性能评价和分析;总结和分析了现有图像修复方法面临的挑战和未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    25. 机器学习在影像组学分析中的应用综述
    鲁慧民, 薛涵, 王奕龙, 王贵增, 桑鹏程
    计算机工程与应用    2023, 59 (17): 22-34.   DOI: 10.3778/j.issn.1002-8331.2210-0435
    摘要650)      PDF(pc) (5275KB)(475)    收藏
    影像组学(radiomics)是一种从标准医学影像中定量地提取特征的技术。借助机器学习构建预测或诊断模型,能够在临床决策支持系统中提取和应用数据,以提高诊断的准确性,该技术在肿瘤分期、癌症检测、生存分析等任务中得到了广泛的应用。回顾了机器学习在影像组学分析中的相关应用和研究进展;重点论述了机器学习算法在影像组学分析中各阶段的适用性和局限性,在原理和应用效果上对代表性算法进行了深入梳理与分析;综合介绍了在影像组学分析中对各阶段工作的评估方法;整理了公开的医学影像数据集以及用于影像组学特征提取的软件与工具包;最后讨论了机器学习在影像组学中的未来发展。
    参考文献 | 相关文章 | 多维度评价
    26. 大语言模型微调技术的研究综述
    张钦彤, 王昱超, 王鹤羲, 王俊鑫, 陈海
    计算机工程与应用    2024, 60 (17): 17-33.   DOI: 10.3778/j.issn.1002-8331.2312-0035
    摘要617)      PDF(pc) (6335KB)(471)    收藏
    大型语言模型的崛起是深度学习领域的全新里程碑,而微调技术在优化模型性能方面的起到了关键作用。对大型语言模型微调技术进行了全面的综述,回顾了语言模型的统计语言模型、神经网络语言模型、预训练语言模型和大语言模型四个阶段的发展历程和微调技术的基本概念,从经典参数微调、高效参数微调、提示微调和强化学习微调方法四大部分,探讨总结了各微调技术的原理与发展,并进行了一定的对比分析。最后,总结了当前微调技术的研究状况与发展重点,强调了该领域的潜在研究价值,并展望了未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    27. 大模型在垂直领域应用的现状与挑战
    籍欣萌, 昝红英, 崔婷婷, 张坤丽
    计算机工程与应用    2025, 61 (12): 1-11.   DOI: 10.3778/j.issn.1002-8331.2409-0181
    摘要715)      PDF(pc) (839KB)(471)    收藏
    近年来,以ChatGPT为代表的大语言模型在多个领域受到广泛的关注,并取得优异的表现,推动了人工智能技术的新一轮发展浪潮。目前国产大模型数量已有上百个,覆盖多个行业领域,应用场景也不断扩展。为了更好地应对大模型在自然语言处理中的发展及其对通用任务和领域应用带来的冲击,对自然语言处理和大模型的发展历程进行回顾,阐述了当前大模型的相关技术以及大模型在医疗、法律、金融等垂直领域的应用,并对大模型在应用过程中面临的挑战如能力缺陷、协同问题等作出分析。最后,针对这些问题探讨了大模型在实际应用中的未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    28. 轻量化深度卷积神经网络设计研究进展
    周志飞, 李华, 冯毅雄, 陆见光, 钱松荣, 李少波
    计算机工程与应用    2024, 60 (22): 1-17.   DOI: 10.3778/j.issn.1002-8331.2404-0372
    摘要584)      PDF(pc) (6330KB)(469)    收藏
    轻量化设计是解决深度卷积神经网络(deep convolutional neural network,DCNN)对设备性能和硬件资源依赖性的流行范式,轻量化的目的是在不牺牲网络性能的前提下,提高计算速度和减少内存占用。综述了DCNN的轻量化设计方法,着重回顾了近年来DCNN的研究进展,包括体系设计和模型压缩两大轻量化策略,深入比较了这两类方法的创新性、优势与局限性,并探讨了支撑轻量化模型的底层框架。此外,对轻量化网络已经成功应用的场景进行了描述,并对DCNN轻量化的未来发展趋势进行了预测,旨在为深度卷积神经网络的轻量化研究提供有益的见解和参考。
    参考文献 | 相关文章 | 多维度评价
    29. 基于改进YOLO v8的行李追踪技术
    曹超, 顾幸生
    计算机工程与应用    2024, 60 (9): 151-158.   DOI: 10.3778/j.issn.1002-8331.2310-0238
    摘要422)      PDF(pc) (6479KB)(468)    收藏
    在机场行李分拣场景下,传统多目标追踪算法存在目标ID切换率高和目标轨迹误报率高的问题。提出一种基于改进YOLO v8和ByteTrack算法的行李追踪技术。增加了CBAM模块,替换ADH解耦头以及改变训练时的损失函数,增加了检测精度,加强了目标特征的判别性,降低目标的ID切换率。在Byte数据关联中进行了GSI插值后处理,不仅利用了高分框和低分框,也使得长时间遮挡后的追踪效果得到保证,降低了因遮挡产生的ID错误切换。在机场行李分拣数据集上,MOTA和IDF1分别达到了89.9%和90.3%,有了较为明显的提升,能稳定地实现对行李箱ID的追踪。
    参考文献 | 相关文章 | 多维度评价
    30. 优化改进YOLOv8实现实时无人机车辆检测的算法
    史涛, 崔杰, 李松
    计算机工程与应用    2024, 60 (9): 79-89.   DOI: 10.3778/j.issn.1002-8331.2312-0291
    摘要520)      PDF(pc) (4614KB)(458)    收藏
    针对现有无人机车辆检测算法精度低、易受背景环境干扰、难以检测微小目标车辆问题,提出了一种改进YOLOv8的无人机车辆检测算法YOLOv8-CX。结合Deformable Convolutional Networks v1-3的优点,提出一种能够灵活采样特征的C2f-DCN模块,以更好地提取不同尺寸大小车辆之间的特征。利用Large Separable Kernel Attention的思想,提出了具有长程依赖性和自适应能力的SPPF-LSKA模块,可以有效减少背景对于车辆检测的干扰。在颈部网络,采用CF-FPN(ment network for tiny object deteciton)特征融合结构,通过结合上下文信息和抑制不同尺度特征之间的冲突信息,提升了对小目标的检测精度。最后,将原始YOLOv8的头部替换为Dynamic Head检测头。通过将尺度、空间和任务三种注意力机制结合统一,进一步提升了模型的检测性能。实验结果表明,在Mapsai数据集上,改进算法与原算法相比准确率(P)、召回率(R)、平均精度(mAP)分别提升了8.5、11.2和6.2个百分点,且算法检测速度达到72.6?FPS,满足无人机车辆检测实时性的要求。通过与其他主流目标检测算法比较,验证了该方法的有效性和卓越性。
    参考文献 | 相关文章 | 多维度评价
    31. 深度强化学习求解移动机器人端到端导航问题的研究综述
    何丽, 姚佳程, 廖雨鑫, 张文智, 卢赵清, 袁亮, 肖文东
    计算机工程与应用    2024, 60 (14): 1-13.   DOI: 10.3778/j.issn.1002-8331.2312-0256
    摘要382)      PDF(pc) (4646KB)(449)    收藏
    自主导航是移动机器人完成复杂任务的前提和基础,传统的自主导航系统依赖于地图的精度,无法适应高度复杂的作业和服务场景。移动机器人不依赖先验地图信息,通过深度强化学习与环境交互学习能够自主决策的端到端导航方法成为新的研究热点。大多数现有的分类方法不能全面地总结端到端导航问题的挑战和机遇,根据端到端导航系统的特点,将导航问题的挑战归结为导航智能体感知能力差、学习效率低和导航策略泛化能力弱等关键问题,阐述了端到端导航系统的研究现状和发展趋势,分别详细介绍了近年来针对这些关键问题的代表性研究成果,并对其优势和不足进行了归纳总结。最后,从视觉语言导航、多智能体协同导航、融合超分辨率重建图像的端到端导航和可解释性端到端导航等方面展望了移动机器人端到端导航的未来发展趋势,为移动机器人端到端导航的研究和应用提供一定的思路。
    参考文献 | 相关文章 | 多维度评价
    32. 结合Swin及多尺度特征融合的细粒度图像分类
    项剑文, 陈泯融, 杨百冰
    计算机工程与应用    2023, 59 (20): 147-157.   DOI: 10.3778/j.issn.1002-8331.2211-0456
    摘要426)      PDF(pc) (718KB)(445)    收藏
    针对细粒度图像类间差异小、类内差异大等问题,提出了一种基于Swin及多尺度特征融合的模型(SwinFC)。基准骨干网络采用具有多阶段层级架构设计的Swin Transformer模型作为全新视觉特征提取器,从中获取局部和全局信息以及多尺度特征。然后在每个阶段的分支通道上嵌入融合外部依赖及跨空间注意力模块,以捕获数据样本之间的潜在相关性,同时捕捉不同空间方向上具有判别力的特征信息,进而强化网络每个阶段的信息表征。进一步地,引入特征融合模块将每个阶段提取的特征进行多尺度融合,促使网络学习更加全面、互补且多样化的特征信息。最后构建特征选择模块来筛选重要且具有辨别力的图像块,以此增大类间差异,减小类内差异,增强模型的判别力。实验结果表明,该方法在CUB-200-2011、NABirds和WebFG-496三个公开细粒度图像数据集上分别达到了92.5%、91.8%和85.84%的分类准确率,性能优于大部分主流模型方法,并且与基准模型Swin相比,分别提高了1.4、2.6和4.86个百分点的分类性能。
    参考文献 | 相关文章 | 多维度评价
    33. 基于机器学习的信用卡交易欺诈检测研究综述
    蒋洪迅, 江俊毅, 梁循
    计算机工程与应用    2023, 59 (21): 1-25.   DOI: 10.3778/j.issn.1002-8331.2302-0129
    摘要822)      PDF(pc) (674KB)(430)    收藏
    机器学习在信用卡交易检测中有其特殊性,面对的环境更为复杂。由于有人的智力介入,战胜信用卡交易欺诈,其挑战性比人脸识别、无人驾驶等工程问题的难度更高,照搬工程学科的机器学习方法往往会失败。综述了2000年以来基于机器学习的信用卡欺诈检测研究历程,辨析了该领域的研究范畴、应用场景、技术流派等相关概念及其联系;解构了机器学习欺诈识别的一般性研究架构,从特征工程、模型算法、评价指标三个环节归纳总结了领域内研究的最新进展;从数据集是否具备标签角度,着重列举了面向欺诈识别的有监督的、无监督和半监督三类主流机器学习模型,讨论了这些模型的出发点、核心思想、求解方法以及优缺点;还分析了强化学习模型模拟欺诈者与机构之间的动态博弈过程;探讨了机器学习面临的海量数据、样本偏斜和概念漂移三大难点问题,并汇集整理了缓解这些问题的最新进展;总结了面向欺诈检测的机器学习研究目前存在的局限、争议和挑战,并为未来的研究方向提供趋势分析与建议。
    参考文献 | 相关文章 | 多维度评价
    34. 基于深度元学习的小样本图像分类研究综述
    周伯俊, 陈峙宇
    计算机工程与应用    2024, 60 (8): 1-15.   DOI: 10.3778/j.issn.1002-8331.2308-0271
    摘要441)      PDF(pc) (14249KB)(422)    收藏
    深度元学习是解决小样本分类问题的流行范式。对近年来基于深度元学习的小样本图像分类算法进行了详细综述。从问题的描述出发对基于深度元学习的小样本图像分类算法进行概括,并介绍了常用小样本图像分类数据集及评价准则;分别从基于模型的深度元学习方法、基于优化的深度元学习方法以及基于度量的深度元学习方法三个方面对其中的典型模型以及最新研究进展进行详细阐述。最后,给出了现有算法在常用公开数据集上的性能表现,总结了该课题中的研究热点,并讨论了未来的研究方向。
    参考文献 | 相关文章 | 多维度评价
    35. 多智能体深度强化学习及可扩展性研究进展
    刘延飞, 李超, 王忠, 王杰铃
    计算机工程与应用    2025, 61 (4): 1-24.   DOI: 10.3778/j.issn.1002-8331.2407-0034
    摘要599)      PDF(pc) (2161KB)(419)    收藏
    多智能体深度强化学习近年来在解决智能体协作、竞争和通信问题上展现出巨大潜力。然而伴随着其在更多领域的应用,可扩展性问题备受关注,是理论研究到大规模工程应用的重要问题。回顾了强化学习理论和深度强化学习的典型算法,介绍了多智能体深度强化学习三类学习范式及其代表算法,并简要整理出当前主流的开源实验平台。详细探讨了多智能体深度强化学习在数量和场景上的可扩展性研究进展,分析了各自面临的核心问题并给出了现有的解决思路。展望了多智能体深度强化学习的应用前景和发展趋势,为推动该领域的进一步研究提供参考和启示。
    参考文献 | 相关文章 | 多维度评价
    36. 多模态驾驶员情绪识别研究综述
    周欣颖, 李雷孝, 林浩, 张虎成
    计算机工程与应用    2025, 61 (10): 1-18.   DOI: 10.3778/j.issn.1002-8331.2410-0153
    摘要431)      PDF(pc) (1630KB)(419)    收藏
    准确识别驾驶员情绪可以有效预防潜在的危险驾驶行为,减少交通事故的发生,是提升道路安全和驾驶体验的重要技术。随着人工智能和多模态数据处理技术的进步,情绪识别技术从单模态方法逐步发展为多模态方法。梳理了当前多模态驾驶员情绪识别的研究进展,重点总结了面部表情、语音信号、生理信号以及车辆行为四种模态的识别流程,关键步骤包括数据预处理、特征提取和多模态融合。通过分析现有研究,总结了不同方法的优势与不足,介绍了多个驾驶员情绪相关数据集。最后结合当前研究所面临的挑战,提出了未来多模态驾驶员情绪识别研究领域的五个研究方向。
    参考文献 | 相关文章 | 多维度评价
    37. YOLO-PD:轻量级实时行人检测算法
    陈胜宝, 施隆照
    计算机工程与应用    2026, 62 (6): 122-133.   DOI: 10.3778/j.issn.1002-8331.2507-0218
    摘要262)      PDF(pc) (13743KB)(416)    收藏
    针对边缘端设备资源受限和行人检测算法在小目标物体、多尺度物体和重叠遮挡造成的几何形变物体上检测精度低的问题,提出了一种适合部署在边缘端设备的基于YOLOv8的行人检测算法YOLO-PD。针对小目标物体,设计局部Transformer块(partial Transformer block,PTB),增强模型的特征提取能力,PTB的混合结构在保持高效特征提取的同时还能降低计算成本;针对多尺度物体,设计金字塔共享空洞卷积(pyramid shared dilation convolution,PSDC),利用共享权重参数的多尺度空洞卷积来提高模型多尺度特征提取能力的同时减小模块体积;针对几何形变物体,设计轻量级可变形动态检测头(light deformable dynamic head,LDDH),在检测头中通过动态调整加权因子来提升检测精度、通过可变形卷积来更精准地获取形变物体的特征。实验结果表明,与基线模型YOLOv8n相比,YOLO-PD在自建的行人检测数据集COCO-Person和VOC-Person上的mAP50分别提高了2.9和1.9个百分点,参数量减少了34.3%;在公开的行人检测数据集WidePerson上,mAP50和mAP50:95分别提高了1.8和1.1个百分点。在行人检测任务上该算法检测精度高、泛化能力强、极小的参数量让它适合部署在边缘端设备。
    参考文献 | 相关文章 | 多维度评价
    38. 深度学习下的医学图像分割综述
    邢素霞, 李珂娴, 方俊泽, 郭正, 赵士杭
    计算机工程与应用    2025, 61 (7): 25-41.   DOI: 10.3778/j.issn.1002-8331.2409-0142
    摘要761)      PDF(pc) (1527KB)(408)    收藏
    针对医学图像的高维性、复杂性和高精度要求等特性,深度学习下的医学图像分割方法凭借其强大的特征提取能力和对复杂模式的学习能力,能够自适应地从大量数据中学习并提取多层次特征,展现出高精度、高鲁棒性和可扩展性强等优势。通过端到端地提取感兴趣的器官、组织或病变区域,为医生在疾病诊断、制定治疗策略和临床研究等领域提供有力帮助。重点综述了U-Net、Transformer、Mamba、分割一切模型(segment anything model,SAM)及其各自变体模型在医学图像分割中的应用情况和发展脉络,从多个维度进行了综合对比分析,对开展医学影像研究、临床疾病诊断与治疗决策,以及医疗技术创新产品开发均具有一定参考价值。在此基础上,总结了目前医学图像分割研究中面临的挑战,并对该领域未来的研究前景进行展望。
    参考文献 | 相关文章 | 多维度评价
    39. 低光照图像增强研究方法综述
    彭大鑫, 甄彤, 李智慧
    计算机工程与应用    2023, 59 (18): 14-27.   DOI: 10.3778/j.issn.1002-8331.2210-0143
    摘要812)      PDF(pc) (645KB)(407)    收藏
    低光照图像增强目的是从低光照条件下恢复细节完整的图像,并逐渐成为计算机图像处理研究的热点。图像成像的质量对于智能安防、视频监控等场景至关重要,且在相关行业中有着十分广阔的应用前景。为了深入研究低光照图像增强,对传统低光照图像增强方法进行详细地分类阐述与分析,列举了基于深度学习的图像增强方法,对所用到的各种网络以及所解决的问题进行了详细的梳理,并将所提到的方法进行了细致的对比。又对数据集进行了细致的分析和研究,并对一些常用的评价指标进行了简单梳理。对所述内容做出总结以及指出了当前研究中存在的困难,并指出了未来的研究目标。
    参考文献 | 相关文章 | 多维度评价
    40. 深度学习框架下的红外与可见光图像融合方法综述
    李淑慧, 蔡伟, 王鑫, 高蔚洁, 狄星雨
    计算机工程与应用    2025, 61 (9): 25-40.   DOI: 10.3778/j.issn.1002-8331.2410-0012
    摘要650)      PDF(pc) (25398KB)(401)    收藏
    红外与可见光图像融合(infrared and visible image fusion,IVIF)将红外图像与可见光图像的互补信息融合,提升图像质量以支持下游任务。鉴于深度学习在图像融合方面的优势,将其应用在IVIF领域已成为研究热点。对深度学习框架下的红外与可见光图像融合方法进行梳理分析,根据不同的融合框架将融合方法分为基于自编码器、卷积神经网络、生成对抗网络和变换器,并对比分析这四类方法的特点;综述了IVIF的主要应用领域、常用的6个数据集和8个评价指标,并在典型数据集上对各类主流IVIF方法进行定性和定量评估。最后,总结了现有IVIF方法的局限性,并展望了IVIF的未来研究方向。
    参考文献 | 相关文章 | 多维度评价