计算机工程与应用

Select

1. 深度学习优化器进展综述

常禧龙, 梁琨, 李文涛

计算机工程与应用 2024, 60 (7): 1-12. DOI: 10.3778/j.issn.1002-8331.2307-0370

摘要（171）

PDF（pc）（1327KB）（222）

优化器是提高深度学习模型性能的关键因素，通过最小化损失函数使得模型的参数和真实参数接近从而提高模型的性能。随着GPT等大语言模型成为自然语言处理领域研究焦点，以梯度下降优化器为核心的传统优化器对大模型的优化效果甚微。因此自适应矩估计类优化器应运而生，其在提高模型泛化能力等方面显著优于传统优化器。以梯度下降、自适应梯度和自适应矩估计三类优化器为主线，分析其原理及优劣。将优化器应用到Transformer架构中，选取法-英翻译任务作为评估基准，通过实验深入探讨优化器在特定任务上的效果差异。实验结果表明，自适应矩估计类优化器在机器翻译任务上有效提高模型的性能。同时，展望优化器的发展方向并给出在具体任务上的应用场景。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于深度元学习的小样本图像分类研究综述

周伯俊, 陈峙宇

计算机工程与应用 2024, 60 (8): 1-15. DOI: 10.3778/j.issn.1002-8331.2308-0271

摘要（115）

PDF（pc）（1091KB）（196）

深度元学习是解决小样本分类问题的流行范式。对近年来基于深度元学习的小样本图像分类算法进行了详细综述。从问题的描述出发对基于深度元学习的小样本图像分类算法进行概括，并介绍了常用小样本图像分类数据集及评价准则；分别从基于模型的深度元学习方法、基于优化的深度元学习方法以及基于度量的深度元学习方法三个方面对其中的典型模型以及最新研究进展进行详细阐述。最后，给出了现有算法在常用公开数据集上的性能表现，总结了该课题中的研究热点，并讨论了未来的研究方向。

参考文献 | 相关文章 | 多维度评价

Select

3. 人工神经网络模型发展及应用综述

张驰，郭媛，黎明

计算机工程与应用 2021, 57 (11): 57-69. DOI: 10.3778/j.issn.1002-8331.2102-0256

摘要（2133）

PDF（pc）（781KB）（1912）

人工神经网络与其他学科领域联系日益紧密，人们通过对人工神经网络层结构的探索和改进来解决各个领域的问题。根据人工神经网络相关文献进行分析，综述了人工神经网络算法以及网络模型结构的发展史，根据神经网络的发展介绍了人工神经网络相关概念，其中主要涉及到多层感知器、反向传播神经网络、卷积神经网络以及递归神经网络，描述了卷积神经网络发展当中出现的部分卷积神经网络模型和递归神经网络中常用的相关网络结构，分别综述了各个人工神经网络算法在相关领域的应用情况，总结了人工神经网络的未来发展方向。

相关文章 | 多维度评价

Select

4. 无人机飞控系统故障诊断技术研究综述

安雪, 李少波, 张仪宗, 张安思

计算机工程与应用 2023, 59 (24): 1-15. DOI: 10.3778/j.issn.1002-8331.2305-0137

摘要（279）

PDF（pc）（917KB）（741）

近年来，无人机因其运行成本低、机动性强等独特优势被广泛应用于军民各复杂领域；同时，复杂多样的任务对无人机系统的可靠性和安全性提出了更高的要求。无人机故障诊断技术能够及时准确地提供诊断结果，有助于无人机的维护、保养与维修，对提升无人机的作战效能具有重要意义。因此，从无人机的飞控系统剖析各类常见故障的机理，并进行故障归类。主要围绕飞控系统中的传感器、执行器和其他部件的故障诊断技术，分析总结了无人机故障诊断技术的研究方法和现状。探讨了无人机故障诊断技术面临的主要挑战，并指出了未来的发展方向；旨在为无人机故障诊断技术领域研究人员提供一定参考，促进我国无人机故障诊断技术水平的提升。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于深度学习的对话情绪生成研究综述

周钰童, 马志强, 许璧麒, 贾文超, 吕凯, 刘佳

计算机工程与应用 2024, 60 (7): 13-25. DOI: 10.3778/j.issn.1002-8331.2304-0131

摘要（89）

PDF（pc）（573KB）（144）

情绪生成是人工情感计算研究中的子任务，在对话系统中情绪生成任务旨在生成待回复话语中的情绪类别。对话情绪生成可以推动对话情绪理解和对话表达研究，同时在智能闲聊机器人、情绪安慰、推荐系统和人机情感交互等诸多智能化领域具有重要的理论意义和实际应用价值。得益于深度神经网络在自然语言处理领域的优异表现，基于深度学习的对话系统情绪生成受到越来越多研究人员的关注。总结目前基于深度学习的对话情绪生成相关工作，现阶段利用深度学习的对话系统情绪生成相关研究主要包含三方面内容：情绪感知、情绪预测和情绪决策。简要介绍了一些常用的情绪对话数据集，最后对该任务当前问题进行了归纳概况并展望未来发展趋势。

参考文献 | 相关文章 | 多维度评价

Select

6. 多模态方面级情感分析的多视图交互学习网络

王旭阳, 庞文倩, 赵丽婕

计算机工程与应用 2024, 60 (7): 92-100. DOI: 10.3778/j.issn.1002-8331.2210-0288

摘要（80）

PDF（pc）（591KB）（136）

以往的多模态方面级情感分析方法只利用预训练模型的一般文本和图片表示，对方面和观点词相关性的识别不敏感，且不能动态获取图片信息对单词表示的贡献，因而不能充分识别多模态与方面之间的相关性。针对上述问题，提出一种多视图交互学习网络模型。将句子从上下文和句法两个视图上分别提取特征，以便在多模态交互时充分利用到文本的全局特征；对文本、图片和方面之间的关系进行建模，使模型实现多模态交互；同时融合不同模态的交互表示，动态获取视觉信息对文本中每个单词的贡献程度，充分提取模态与方面之间的相关性。最后通过全连接层和Softmax层获取情感分类结果。在两个数据集上进行实验，实验结果表明该模型能够有效增强多模态方面级情感分类的效果。

参考文献 | 相关文章 | 多维度评价

Select

7. 融合改进YOLOv5及Mediapipe的手势识别研究

倪广兴, 徐华, 王超

计算机工程与应用 2024, 60 (7): 108-118. DOI: 10.3778/j.issn.1002-8331.2308-0097

摘要（98）

PDF（pc）（686KB）（119）

针对现有手势识别算法计算量大、鲁棒性差等问题，提出一种基于IYOLOv5-Med（improved YOLOv5 Mediapipe）算法的手势识别方法。该算法将改进的YOLOv5算法和Mediapipe方法结合，包括手势检测和手势分析两部分，算法有效降低了训练的时间成本，增加了识别的鲁棒性。手势检测部分，改进了传统YOLOv5算法，利用FastNet重构C3模块，将CBS模块替换为GhostNet中GhostConv模块，在Backbone网络末端加入SE注意力机制模块，改进后的算法，模型体积更小，更适用于资源有限的边缘设备。手势分析部分，提出了一种基于Mediapipe的方法，对手势检测部分定位到的手势区域进行手部关键点检测，并提取相关特征，然后通过朴素贝叶斯分类器进行识别。实验结果证实了提出的IYOLOv5-Med算法的有效性，与传统YOLOv5算法相比，参数量下降34.5%，计算量减少34.9%，模型权重降低33.2%，最终平均识别率达到0.997，且实现方法相对简单，有较好的应用前景。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于改进YOLOX的轻量化交通监控目标检测算法

胡伟超, 郭宇阳, 张奇, 陈艳艳

计算机工程与应用 2024, 60 (7): 167-174. DOI: 10.3778/j.issn.1002-8331.2308-0081

摘要（87）

PDF（pc）（630KB）（114）

交通目标检测技术是道路交通管理部门进行交通流量监测、安全管控等核心工作的重要技术之一。面对大量的交通监控视频数据，需要使用检测速度更快、精度更高、占用计算资源更少的交通目标检测技术。为了满足这一需求，根据YOLOX算法和PP-LCNet网络，提出了一种面向交通监控场景的轻量型交通目标检测算法PL-YOLO。使用基于PP-LCNet改进的网络作为目标检测器的主干特征网络，使用深度可分离卷积代替YOLOX中的普通卷积，降低模型运算过程中的复杂度；根据交通监控场景下的车辆分布密集且尺寸小的特点，添加SimAM注意力机制模块，聚焦于更有意义的特征图像。实验结果表明，相对于YOLOX-s模型，改进后的PL-YOLO检测精度提升1.89个百分点，模型大小降低了54%，FPS从20.88?帧/s提升到26.68?帧/s。

参考文献 | 相关文章 | 多维度评价

Select

9. 深度学习在骨质疏松辅助诊断中的应用

姜良, 张程, 魏德健, 曹慧, 杜昱峥

计算机工程与应用 2024, 60 (7): 26-40. DOI: 10.3778/j.issn.1002-8331.2305-0030

摘要（75）

PDF（pc）（844KB）（111）

骨质疏松症是一种由于骨密度下降引起骨折危险性增加的全身性疾病，临床上以影像学检查作为诊断依据。近几年深度学习方法在骨骼医学图像处理领域取得突破性进展，针对骨质疏松辅助诊断中所采用的深度学习方法进行了梳理总结。介绍了常用的影像学数据集，系统阐述了卷积神经网络、循环神经网络、深度置信网络、生成对抗网络在骨质疏松分类中的应用，阐述了全卷积网络、U-Net在骨质疏松病灶区域分割中的应用，同时介绍了最新AI模型ChatGPT的潜在应用，比较不同模型的性能，指出该领域目前存在的难点并提出相应的展望。

参考文献 | 相关文章 | 多维度评价

Select

10. 混合多项自适应权重的混沌麻雀搜索算法

杜云, 周志奇, 贾科进, 丁力, 卢孟杨林

计算机工程与应用 2024, 60 (7): 70-83. DOI: 10.3778/j.issn.1002-8331.2307-0254

摘要（77）

PDF（pc）（1361KB）（108）

麻雀搜索算法具有原理简单、搜索能力强、快速寻优等优点，但是存在全局搜索不足、易陷入局部最优等缺点，针对其缺点提出了混合多项自适应权重的混沌麻雀搜索算法。增加改进Circle混沌映射提高种群多样性；在发现者引入自适应权重策略，提高发现者的全局搜索能力和搜索范围；在加入者引入改进鲸鱼优化算法的气泡网捕食策略，提高算法的局部搜索性能和跳出局部最优的能力；结合反向学习策略机制，对所有的个体进行最优选择，使每次迭代后的个体质量得到提升，以提高算法的寻优效率和寻优精度。将混合多项自适应权重的混沌麻雀搜索算法与4种经典基本算法和9种改进的麻雀搜索算法在12种测试函数和CEC2022测试函数上进行对比，改进算法有更好的寻优性能和收敛速度。

参考文献 | 相关文章 | 多维度评价

Select

11. DY-YOLOv5：基于多重注意力机制的航拍图像目标检测

赵鑫, 陈里里, 杨维川, 张程旺

计算机工程与应用 2024, 60 (7): 183-191. DOI: 10.3778/j.issn.1002-8331.2309-0419

摘要（102）

PDF（pc）（1074KB）（99）

针对无人机航拍图像中目标小、尺度不一和背景复杂等导致检测精度低的问题，提出一种基于改进YOLOv5的无人机航拍图像目标检测算法DY-YOLOv5。该算法在检测头部分利用具有多重注意力机制的目标检测头方法Dynamic Head，提升检测头在复杂背景下的检测表现。在原模型neck部分增加一次上采样和Concat操作，并执行一个包含极小、小、中目标的多尺度特征检测，提升模型对中、小目标的特征提取能力。引入密集卷积网络DenseNet，将其与YOLOv5s主干网络的C3模块进行融合，提出C3_DenseNet模块，以加强特征传递并预防模型过拟合。在VisDrone2019数据集上应用DY-YOLOv5算法，平均精度均值（mAP）达到了43.9%，较原YOLOv5算法提升了11.4个百分点。召回率（Recall）为41.7%，较原算法提升了9.0个百分点。实验结果证明，改进算法显著提高了无人机航拍图像目标检测的精度。

参考文献 | 相关文章 | 多维度评价

Select

12. 文本情感分析方法研究综述

王婷，杨文忠

计算机工程与应用 2021, 57 (12): 11-24. DOI: 10.3778/j.issn.1002-8331.2101-0022

摘要（1653）

PDF（pc）（906KB）（1504）

文本情感分析是自然语言处理领域的一个重要分支，广泛应用于舆情分析和内容推荐等方面，是近年来的研究热点。根据使用的不同方法，将其划分为基于情感词典的情感分析方法、基于传统机器学习的情感分析方法、基于深度学习的情感分析方法。通过对这三种方法进行对比，分析其研究成果，并对不同方法的优缺点进行归纳总结，介绍相关数据集和评价指标及应用场景，对情感分析子任务进行简单概括，发现将来的情感分析问题的研究趋势及应用领域，并为研究者在相关领域方面提供一定的帮助和指导。

相关文章 | 多维度评价

Select

13. 道路交通流数据预测方法研究综述

孟闯, 王慧, 林浩, 李科岑, 王鑫鹏

计算机工程与应用 2023, 59 (14): 51-61. DOI: 10.3778/j.issn.1002-8331.2209-0458

摘要（928）

PDF（pc）（605KB）（439）

道路交通流预测作为智能交通系统中的重要分支，在道路拥堵预测、路径规划等方面起着重要作用。道路交通流数据时空多态、关联性复杂的特性迫使大数据时代下的道路交通流预测方法转型和升级。为了深入挖掘交通流时空性的特征，学者们相继提出各类方法，包括模型融合、模型算法改进、数据定义转换等方式，以求提高模型的预测精度。为了合理综述各类交通流的预测方法，根据所用方法的种类分为三大类：基于统计学的方法、基于机器学习的方法、基于深度学习的方法。通过综述各类交通流预测方法，对近年来新出现的模型与算法进行概括与分析，旨在为相关研究学者提供研究思路。对交通流预测方法进行了总结及展望，给出未来交通流预测领域的探索方向。

参考文献 | 相关文章 | 多维度评价

Select

14. 2024年第7期目次

计算机工程与应用 2024, 60 (7): 0-0.

摘要（66）

PDF（pc）（761KB）（96）

相关文章 | 多维度评价

Select

15. 改进YOLOv7的木材表面缺陷检测算法

江兴旺, 赵兴强

计算机工程与应用 2024, 60 (7): 175-182. DOI: 10.3778/j.issn.1002-8331.2309-0185

摘要（76）

PDF（pc）（599KB）（95）

优质木材深受人们喜爱，但木材存在多种缺陷导致优质木材产量少，木材利用率低。运用深度学习的目标检测算法可以实现木材表面缺陷的快速稳定检测，以此提高木材的优质化和利用率。针对目前木材表面缺陷目标小、密集和复杂等特点导致检测精度较差的问题，提出了一种基于改进YOLOv7的木材表面缺陷检测模型YOLOv7-ESS。针对木材的裂缝缺陷存在极端长宽比例而影响检测效果的问题，嵌入注意力模块ECBAM，通过加强对极端长宽比例缺陷的注意力，提高模型的特征提取能力。针对在提取特征时木材表面小缺陷特征信息丢失严重的问题，引入浅层加权特征融合网络SFPN，以深层特征图作为输出，同时有效利用浅层特征信息，提高小缺陷的识别准确率。引入SIoU损失函数，提升模型收敛速度及模型精度。结果表明，YOLOv7-ESS模型平均检测精度为94.7%，较YOLOv7检测精度提高了11.2个百分点，满足木材生产加工时的缺陷检测要求。

参考文献 | 相关文章 | 多维度评价

Select

16. Transformer在计算机视觉领域的研究综述

李翔, 张涛, 张哲, 魏宏杨, 钱育蓉

计算机工程与应用 2023, 59 (1): 1-14. DOI: 10.3778/j.issn.1002-8331.2204-0207

摘要（883）

PDF（pc）（1285KB）（568）

Transformer是一种基于自注意力机制的深度神经网络。近几年，基于Transformer的模型已成为计算机视觉领域的热门研究方向，其结构也在不断改进和扩展，比如局部注意力机制、金字塔结构等。通过对基于Transformer结构改进的视觉模型，分别从性能优化和结构改进两个方面进行综述和总结；也对比分析了Transformer和CNN各自结构的优缺点，并介绍了一种新型的CNN+Transformer的混合结构；最后，对Transformer在计算机视觉上的发展进行总结和展望。

参考文献 | 相关文章 | 多维度评价

Select

17. 图像边缘检测综述

肖扬, 周军

计算机工程与应用 2023, 59 (5): 40-54. DOI: 10.3778/j.issn.1002-8331.2209-0122

摘要（787）

PDF（pc）（921KB）（397）

边缘检测的任务是将亮度变化明显的像素点识别为目标边缘，是计算机视觉低层级问题，并且边缘检测在对象识别和检测、对象提议生成、图像分割有着重要应用。如今，边缘检测已经产生了多类方法，如基于梯度的传统检测方法、基于深度学习的边缘检测算法，还有结合新兴技术的检测方法等。对这些方法进行更精细的分类，让研究者更清楚地了解边缘检测的发展趋势。对传统边缘检测的理论依据及实现方法做出介绍；详细介绍近年来主要的深度学习边缘检测方法，根据使用的方法进行分类，并对其中所使用的创新技术进行说明，如分支结构、特征融合和损失函数。衡量算法性能采用评估指标：单图最佳阈值（ODS）和帧数（FPS），在基础数据集（BSDS500）上进行对比。对边缘检测的研究现状进行分析和总结，对未来可能的研究方向进行展望。

参考文献 | 相关文章 | 多维度评价

Select

18. YOLO系列目标检测算法研究进展

王琳毅, 白静, 李文静, 蒋金哲

计算机工程与应用 2023, 59 (14): 15-29. DOI: 10.3778/j.issn.1002-8331.2301-0081

摘要（946）

PDF（pc）（1009KB）（569）

YOLO算法是目标检测中研究的热点方向之一。近几年，随着YOLO系列算法及其改进模型的不断提出，使其在目标检测领域取得了优异的成绩，被广泛应用于现实中各个领域。针对YOLO系列目标检测算法，整理了目标检测典型数据集及评价指标；回顾了YOLO整体框架以及YOLOv1~YOLOv7目标检测算法的发展历程；总结了在输入、特征提取和预测这三个阶段下的数据增强、轻量化网络构建和IOU损失优化等八个改进方向的模型及性能；介绍了YOLO算法应用领域；结合目标检测目前存在的实际问题，总结并展望了YOLO算法的发展方向。

参考文献 | 相关文章 | 多维度评价

Select

19. 水果采摘机器人视觉系统与机械手研究进展

苟园旻, 闫建伟, 张富贵, 孙成宇, 徐勇

计算机工程与应用 2023, 59 (9): 13-26. DOI: 10.3778/j.issn.1002-8331.2209-0183

摘要（1395）

PDF（pc）（787KB）（1010）

水果采摘机器人对实现水果装备自动化智能化具有重要意义。对近年国内外水果采摘机器人领域关键技术研究工作进行总结，根据水果采摘机器人的重要组成结构与关键技术，对水果采摘机器人视觉系统的关键技术：传统基于水果特征的图像分割方法如阈值法、边缘检测法、基于颜色特征的聚类算法与基于区域的图像分割算法，基于深度学习的目标识别算法以及目标果实的定位等进行分析和对比；总结了水果采摘机器人机械臂与末端执行器的技术发展现状，指出水果采摘机器人存在的问题；对未来水果采摘机器人的发展趋势及方向进行了展望，可为水果采摘机器人相关研究提供参考。

参考文献 | 相关文章 | 多维度评价

Select

20. 多模态数据融合综述

任泽裕，王振超，柯尊旺，李哲，吾守尔·斯拉木

计算机工程与应用 2021, 57 (18): 49-64. DOI: 10.3778/j.issn.1002-8331.2104-0237

摘要（1830）

PDF（pc）（1214KB）（1835）

随着当今信息技术的飞速发展，信息的存在形式多种多样，来源也十分广泛。不同的存在形式或信息来源均可被称之为一种模态，由两种或两种以上模态组成的数据称之为多模态数据。多模态数据融合负责将多个模态的信息进行有效的整合，汲取不同模态的优点，完成对信息的整合。自然现象具有十分丰富的特征，单一模态很难提供某个现象的完整信息。面对保持融合后具有各个模态信息的多样性以及完整性、使各个模态的优点最大化、减少融合过程造成的信息损失等方面的融合要求，如何对各个模态的信息进行融合成为了多个领域广泛存在的一个新挑战。简要阐述了常见的多模态融合方法、融合架构，总结了三个常见的融合模型，简要分析协同、联合、编解码器三大架构的优缺点以及多核学习、图像模型等具体融合方法。在多模态的应用方面，对多模态视频片段检索、综合多模态信息生成内容摘要、多模态情感分析、多模态人机对话系统进行了分析与总结。指出了当前多模态融合出现的问题，并提出未来的研究方向。

相关文章 | 多维度评价

Select

21. 基于深度学习的目标检测算法研究与应用综述

张阳婷, 黄德启, 王东伟, 贺佳佳

计算机工程与应用 2023, 59 (18): 1-13. DOI: 10.3778/j.issn.1002-8331.2305-0310

摘要（628）

PDF（pc）（662KB）（386）

随着深度学习的不断发展，深度卷积神经网络在目标检测领域中的应用愈加广泛，现已被应用于农业、交通和医学等众多领域。与基于特征的传统手工方法相比，基于深度学习的目标检测方法可以学习低级和高级图像特征，有更好的检测精度和泛化能力。为了概括和总结目标检测领域的最新进展和技术，通过分析近年来基于深度学习的目标检测技术，对基于深度学习的目标检测算法与应用现状进行综述。归纳了两阶段与单阶段两种目标检测网络架构的发展及优缺点；从骨干网络、数据集和评价指标等方面进行叙述，对比了经典算法的检测精度，总结经典目标检测算法的改进策略；讨论了现阶段目标检测应用，并提出了目标检测领域今后的研究重点。

参考文献 | 相关文章 | 多维度评价

Select

22. 激光雷达SLAM算法综述

刘铭哲, 徐光辉, 唐堂, 钱晓健, 耿明

计算机工程与应用 2024, 60 (1): 1-14. DOI: 10.3778/j.issn.1002-8331.2308-0455

摘要（449）

PDF（pc）（854KB）（279）

即时定位与地图构建（simultaneous localization and mapping，SLAM）是自主移动机器人和自动驾驶的关键技术之一，而激光雷达则是支撑SLAM算法运行的重要传感器。基于激光雷达的SLAM算法，对激光雷达SLAM总体框架进行介绍，详细阐述前端里程计、后端优化、回环检测、地图构建模块的作用并总结所使用的算法；按由2D到3D，单传感器到多传感器融合的顺序，对经典的具有代表性的开源算法进行描述和梳理归纳；介绍常用的开源数据集，以及精度评价指标和测评工具；从深度学习、多传感器融合、多机协同和鲁棒性研究四个维度对激光雷达SLAM技术的发展趋势进行展望。

参考文献 | 相关文章 | 多维度评价

Select

23. 可解释人工智能研究综述

赵延玉, 赵晓永, 王磊, 王宁宁

计算机工程与应用 2023, 59 (14): 1-14. DOI: 10.3778/j.issn.1002-8331.2208-0322

摘要（668）

PDF（pc）（683KB）（434）

随着机器学习和深度学习的发展，人工智能技术已经逐渐应用在各个领域。然而采用人工智能的最大缺陷之一就是它无法解释预测的依据。模型的黑盒性质使得在医疗、金融和自动驾驶等关键任务应用场景中人类还无法真正信任模型，从而限制了这些领域中人工智能的落地应用。推动可解释人工智能（explainable artificial intelligence，XAI）的发展成为实现关键任务应用落地的重要问题。目前，国内外相关领域仍缺少有关可解释人工智能的研究综述，也缺乏对因果解释方法的关注以及对可解释性方法评估的研究。从解释方法的特点出发，将主要可解释性方法分为三类：独立于模型的方法、依赖于模型的方法和因果解释方法，分别进行总结分析，对解释方法的评估进行总结，列举出可解释人工智能的应用，讨论当前可解释性存在的问题并进行展望。

参考文献 | 相关文章 | 多维度评价

Select

24. 基于改进蚁群优化算法的船舶管路布局设计

董宗然, 陈恒, 卞璇屹, 楼偶俊

计算机工程与应用 2024, 60 (7): 344-354. DOI: 10.3778/j.issn.1002-8331.2212-0298

摘要（45）

PDF（pc）（729KB）（70）

为了实现在多种约束和目标限制下，能以较短时间为工程师提供多种优质船舶布管方案，提出一种基于改进蚁群优化算法的新型船舶管路布局设计方法。该方法基于网格空间分解模型，将适应度函数中的优化目标进行规范化，对蚁群优化算法的关键步骤，如：蚂蚁行进方向选择、信息素更新机制、蚂蚁寻路过程等进行改进，采用最优解集合保存适应度相同但管路布局效果不同的多个优解，引入辅助点策略和并行计算机制提升算法整体寻优能力和效率。通过仿真算例验证了算法的有效性和先进性。

参考文献 | 相关文章 | 多维度评价

Select

25. 钢材表面缺陷检测的YOLOv5s算法优化研究

徐洪俊, 唐自强, 张锦东, 朱沛华

计算机工程与应用 2024, 60 (7): 306-314. DOI: 10.3778/j.issn.1002-8331.2307-0275

摘要（73）

PDF（pc）（805KB）（69）

针对YOLOv5对钢材缺陷复杂特征提取能力不足且检测结果易受背景环境干扰等问题，提出一种基于YOLOv5s的钢材表面缺陷检测算法。该算法在Backbone的核心特征提取模块C3中引入CBAM注意力，提升Backbone层对于关键信息的关注度；利用CARAFE替换最近邻插值算法，降低了上采样操作对于特征信息造成的损失；提出用融合跨阶段局部网络的金字塔池化结构SPPCPSC替换YOLOv5中的SPPF，提升网络的表达能力和感知能力。实验结果表明，提出YOLOv5s改进模型在NEU-DET数据集上的mAP@0.5达到了76.6%，比YOLOv5s提升2.3个百分点，模型参数量与基线模型基本一致，而CARAFE是导致改进模型检测速度降低的主要原因。除此，实验结果还发现CARAFE与SPPCSPC_group组合使用，对于模型的检测准确度有良好的提升作用。

参考文献 | 相关文章 | 多维度评价

Select

26. 深度学习在糖尿病视网膜病变分类领域的研究进展

孙石磊, 李明, 刘静, 马金刚, 陈天真

计算机工程与应用 2024, 60 (8): 16-30. DOI: 10.3778/j.issn.1002-8331.2307-0330

摘要（57）

PDF（pc）（655KB）（68）

糖尿病视网膜病变是导致糖尿病患者视力受损的主要原因之一，早期的分类诊断对于病情的治疗与控制具有重要意义。深度学习方法能够自动提取视网膜病变的特征并进行分类，因此成为糖尿病视网膜病变分类的重要工具。介绍常用的糖尿病视网膜病变数据集及评价指标，总结了深度学习在糖尿病视网膜病变二分类中的应用；综述了不同的经典深度学习模型在糖尿病视网膜病变严重程度分类中的应用，重点阐述卷积神经网络的分类诊断方法，并对不同方法进行综合对比分析；最后讨论该领域面临的挑战，并对未来发展方向进行了展望。

参考文献 | 相关文章 | 多维度评价

Select

27. 时空图神经网络在交通流预测研究中的构建与应用综述

汪维泰, 王晓强, 李雷孝, 陶乙豪, 林浩

计算机工程与应用 2024, 60 (8): 31-45. DOI: 10.3778/j.issn.1002-8331.2307-0133

摘要（50）

PDF（pc）（827KB）（67）

交通流量预测是城市交通管理和规划中的关键问题，而传统预测方法在面对数据稀疏性、非线性关系和复杂动态性等挑战时表现不佳。图神经网络是一种基于非欧结构数据的深度学习方法，近年来在各种复杂网络建模和预测任务中得到广泛应用。为了应用于交通流量预测领域，提出了时空图神经网络，其能够捕捉空间和时间相关性，相较之前的预测模型有显著进步。对近年来使用时空图神经网络进行交通流量预测的模型进行分析，概述和比较了多种邻接阵的构造方式，然后从空间相关性和时间相关性的角度列举了构建交通流预测模型的常用组件，并对不同的时空融合方式进行了分类和对比；在应用方面，根据时间尺度的不同将时空图神经网络模型分为长期预测、短期预测与兼顾长短期的预测三类，分析了各自的目标与要求，并列举比较了近年来较为突出的新模型。最后，讨论了现有研究的局限性，对相关模型的未来研究做出展望。

参考文献 | 相关文章 | 多维度评价

Select

28. 2024年第8期目次

计算机工程与应用 2024, 60 (8): 0-0.

摘要（43）

PDF（pc）（748KB）（67）

相关文章 | 多维度评价

Select

29. 改进YOLOv7算法的钢材表面缺陷检测研究

高春艳, 秦燊, 李满宏, 吕晓玲

计算机工程与应用 2024, 60 (7): 282-291. DOI: 10.3778/j.issn.1002-8331.2308-0414

摘要（70）

PDF（pc）（1101KB）（65）

当前，基于深度学习的智能检测技术逐步应用于钢材表面缺陷检测领域，针对钢材表面缺陷检测精度低的问题，提出一种高精度实时的缺陷检测算法CDN-YOLOv7。加入CARAFE轻量化上采样算子来改善网络特征融合能力，融合级联注意力机制和解耦头重新设计YOLOv7检测头网络，旨在解决原始头网络特征利用效率不高的问题，使其充分利用各尺度、通道、空间的多维度信息，提升复杂场景下模型表征能力。引入归一化Wasserstein距离重新设计Focal-EIoU损失函数，提出NF-EIoU替换CIoU损失，平衡各尺度缺陷样本对Loss的贡献，降低各尺度缺陷的漏检率。实验结果表明，CDN-YOLOv7的检测精度可达80.3%，较于原YOLOv7精度提升了6.0个百分点，模型推理速度可达60.8帧/s，满足实时性需求，CDN-YOLOv7在提升各尺度缺陷检测精度的同时显著降低了缺陷的漏检率。

参考文献 | 相关文章 | 多维度评价

Select

30. 特征注意力Transformer模块在3D唇语序列身份识别中的应用

骈鑫洋, 王瑜, 张洁

计算机工程与应用 2024, 60 (7): 141-146. DOI: 10.3778/j.issn.1002-8331.2211-0295

摘要（41）

PDF（pc）（598KB）（64）

唇语行为是一种新兴起的生物特征识别技术，三维（three-dimensional，3D）唇语点云序列因包含真实嘴唇空间结构和运动信息，已成为个体身份识别的重要生物特征。但是，3D点云的无序与非结构化的特点导致时空特征的提取非常困难。为此，提出一种深度学习网络模型，用于3D唇语序列身份识别。该网络采用四层改进的PointNet++作为网络骨干，以分层方式抽取特征，为了学习到更多包含身份信息的时空特征，设计一种动态唇特征注意力Transformer模块，连接于PointNet++网络每一层之后，可以学习到不同特征图之间的相关信息，有效捕捉视频序列不同帧的上下文信息。与其他注意力机制构建的Transformer相比，提出的Transformer模块具有较少的参数，在S3DFM-FP和S3DFM-VP数据集上进行的实验表明，提出网络模型在3D唇语点云序列的身份识别任务中效果显著，即使在不受姿态约束的S3DFM-VP数据集中也表现出良好的性能。

参考文献 | 相关文章 | 多维度评价

Select

31. 基于深度学习的图像中无人机与飞鸟检测研究综述

谢威宇, 张强

计算机工程与应用 2024, 60 (8): 46-55. DOI: 10.3778/j.issn.1002-8331.2305-0372

摘要（69）

PDF（pc）（613KB）（64）

随着民用无人机产业的发展，无人机已经成为一项影响公共安全的重要问题。目前针对低空无人机的监视手段主要是采用雷达探测结合图像识别的方法，然而在图像检测识别中易受到与无人机同属“低、慢、小”目标的飞鸟的干扰。为了能够在基于可见光图像的无人机检测中排除飞鸟目标的干扰，利用深度神经网络对可见光图像中无人机与飞鸟进行精确的检测与分类，有效地排除飞鸟对无人机检测的干扰。系统阐释了目标检测技术的发展历程，讨论了各类基于深度学习网络目标检测算法的差异，对比了各类算法的优缺点。对可用于无人机与飞鸟检测的图像数据集进行了梳理与介绍，对相关研究的已有成果进行分析；再从实际应用出发，对无人机与飞鸟检测当中可能会存在的问题进行梳理，阐述与分析了能解决相应检测问题的卷积神经网络的相关研究。最后，针对该研究后续可能的发展方向进行展望。

参考文献 | 相关文章 | 多维度评价

Select

32. 改进YOLOv7的航拍图像目标检测

邹振涛, 李泽平

计算机工程与应用 2024, 60 (8): 173-181. DOI: 10.3778/j.issn.1002-8331.2305-0264

摘要（49）

PDF（pc）（745KB）（64）

航拍图像目标检测对于高效解译航拍图像，并用于地图绘制、资源普查、城乡规划等领域有着重大现实意义。针对无人机航拍图像中的物体尺度变化大、易受到背景干扰和微小目标容易错检漏检的问题，提出一种基于YOLOv7进行改进的航拍图像目标检测算法（AirYOLOv7）。AirYOLOv7通过在原网络的特征提取阶段结合三维注意力机制，在特征融合阶段结合通道注意力机制，以帮助模型更好地聚焦于图像中的关键信息。考虑到航拍图像中存在许多微小物体，算法额外增加了一个用于检测微小物体的预测头，并在每个预测头前引入C3STB，以增强算法对不同尺度目标的检测能力。针对IoU损失对微小物体的位置偏差非常敏感，通过在原边框回归损失中引入Wasserstein距离来衡量微小物体之间的差异，以提高算法对微小物体的检测能力。实验结果表明，AirYOLOv7在DOTA和VisDrone这两个公开的光学航拍数据集上的mAP分别达到78.65%和51.79%，相较于原始的YOLOv7分别提高了1.92个百分点和2.28个百分点，证明了改进方法在光学航拍图像上的有效性。

参考文献 | 相关文章 | 多维度评价

Select

33. 改进YOLOv8的轻量化无人机目标检测算法

胡峻峰, 李柏聪, 朱昊, 黄晓文

计算机工程与应用 2024, 60 (8): 182-191. DOI: 10.3778/j.issn.1002-8331.2310-0063

摘要（41）

PDF（pc）（813KB）（63）

针对无人机目标检测算法计算复杂难以部署，且长尾分布的无人机数据导致检测精度较低的问题，提出了基于改进YOLOv8的轻量化无人机目标检测算法（PC-YOLOv8-n），可均衡网络检测精度与计算量，并对长尾分布数据有一定泛化能力。使用部分卷积层（PConv）替换YOLOv8中的3×3卷积层，对网络进行轻量化处理，解决网络冗余和计算量复杂的问题；融合双通道特征金字塔，增加自上而下的路径，将深层信息与浅层信息进行融合，同层引入轻量化注意力机制，提升网络的特征提取能力；采用均衡焦点损失（EFL）作为类别损失函数，通过均衡尾部类别在网络训练时的梯度权重，增加网络的类别检测能力。实验结果表明，PC-YOLOv8-n在VisDrone2019数据集中具有良好的表现，在mAP50精度上比原始YOLOv8-n算法提高了1.6个百分点，同时模型的参数和计算量分别降低为2.6×106和7.6 GFLOPs，检测速度达到77.2 FPS。

参考文献 | 相关文章 | 多维度评价

Select

34. 改进YOLOv8的道路交通标志目标检测算法

田鹏, 毛力

计算机工程与应用 2024, 60 (8): 202-212. DOI: 10.3778/j.issn.1002-8331.2309-0415

摘要（49）

PDF（pc）（937KB）（63）

虽然，当前检测技术日趋成熟，但对于复杂环境下的小目标检测仍然是研究的重难点。针对道路交通场景中普遍存在的交通标志小目标比例较高，环境干扰因素较大的问题，提出了一种基于YOLOv8改进的道路交通标志目标检测算法。由于小目标检测中容易出现漏检的现象，利用BRA（bi-level routing attention）注意力机制提高网络对小目标的感知能力。此外，还利用可形变卷积模块DCNv3（deformable convolution v3），针对特征图中的不规则形状具有更好的特征提取能力，使骨干网络更好地适应不规则的空间结构，更精准地关注重要目标，从而提高模型对遮挡重叠目标的检测能力。DCNv3和BRA模块均在基本不增加模型权重大小的情况下提高模型准确性。同时引入基于辅助边框的Inner-IOU损失函数。在RoadSign、CCTSDB、TSDD、GTSDB四个数据集上，分别进行了小样本训练、大样本训练、单目标检测和多目标检测，实验结果均有所提高。其中，在RoadSign数据集上的实验结果最佳，YOLOv8改进模型的均值平均精度mAP50与mAP50：95分别达到了90.7%和75.1%，相较于基线模型，mAP50与mAP50：95分别提升了5.9和4.8个百分点。实验结果表明，YOLOv8改进模型有效地实现了在复杂道路场景下的交通标志检测。

参考文献 | 相关文章 | 多维度评价

Select

35. 聚类集成研究综述

邵超, 润清晨

计算机工程与应用 2024, 60 (7): 41-57. DOI: 10.3778/j.issn.1002-8331.2307-0050

摘要（54）

PDF（pc）（851KB）（61）

聚类分析作为数据研究领域的基本技术，旨在从无标签数据集中发现有意义的簇结构。由Kleinberg定理可知不存在能够学习任何数据集的基本聚类算法，即没有一种聚类方法能够正确地找到所有数据集的簇结构。聚类集成解决了这一固有挑战，通过组合多个聚类结果来探索高稳定性和鲁棒性的最终聚类。近些年来，提出了许多聚类集成技术，产生了解决实际问题的新方法以及新应用领域。从基聚类生成机制和共识函数设计两个维度对聚类集成技术进行了综述，分析了各种方法的优缺点并进行实验比较。最后针对当前的研究现状，讨论了未来的研究方向。

参考文献 | 相关文章 | 多维度评价

Select

36. 基于Transformer的目标检测算法综述

李建, 杜建强, 朱彦陈, 郭永坤

计算机工程与应用 2023, 59 (10): 48-64. DOI: 10.3778/j.issn.1002-8331.2211-0133

摘要（983）

PDF（pc）（875KB）（560）

深度学习框架Transformer具有强大的建模能力和并行计算能力，目前基于Transformer的目标检测算法已经成为研究的热点。为了进一步探索目标检测的新思路、新方向，对基于Transformer的目标检测算法进行了归纳总结。概述了多种目标检测数据集及其应用场景，从特征学习、目标估计、标签匹配策略和算法应用四方面梳理了Transformer目标检测的相关算法，并与基于卷积神经网络的目标检测算法进行对比，分析了Transformer在目标检测任务中的优点和局限性，并提出了Transformer目标检测模型的一般性框架。对Transformer在目标检测领域中的发展趋势进行了展望。

参考文献 | 相关文章 | 多维度评价

Select

37. 基于ATO-YOLO的小目标检测算法

苏佳, 秦一畅, 贾泽, 王静

计算机工程与应用 2024, 60 (6): 68-77. DOI: 10.3778/j.issn.1002-8331.2308-0385

摘要（172）

PDF（pc）（795KB）（191）

小目标检测在计算机视觉领域具有重要意义，但现有方法在应对小目标的尺度变化、目标密集和无规则排列等挑战时经常出现漏检和误检的问题。为解决这些问题，提出基于改进YOLOv5算法的ATO-YOLO。为提升检测模型的特征表达能力，提出一种结合注意力机制的自适应特征提取模块（adaptive feature extraction，AFE），通过动态调整权重分配突出关键目标的特征表示，提高目标检测任务在不同场景下的准确性和鲁棒性。设计一种三重特征融合机制（triple feature fusion，TFF），能够在不同尺度下充分利用多尺度信息，将多个尺度的特征图融合，以获取更全面的目标特征，提升对小目标的检测效果。引入一种输出重构模块（output reconstruction，ORS），通过去除大目标检测层并增加小目标检测层，实现精确定位和识别小目标，并且相对于原模型复杂度更低，检测速度更快。实验结果表明，ATO-YOLO算法在VisDrone数据集上的mAP@0.5达到了38.2%，较原YOLOv5提升了6.1个百分点，且FPS较改进前提升了4.4%，能够快速准确地对小目标进行检测。

参考文献 | 相关文章 | 多维度评价

Select

38. E-TUP：融合E-CP与TUP的联合知识图谱学习推荐方法

赵博, 王宇嘉, 倪骥

计算机工程与应用 2024, 60 (8): 99-109. DOI: 10.3778/j.issn.1002-8331.2211-0464

摘要（32）

PDF（pc）（635KB）（59）

目前，大部分将知识图谱引入推荐系统的方法只是将已知的表层知识图谱实体进行引入，没有对图谱的内在关系进行预测和挖掘，因此无法利用知识图谱中的隐藏关系。针对上述问题，提出联合学习推荐模型E-TUP（enhance towards understanding of user preference），使用E-CP（enhance canonical polyadic）进行知识图谱补全并将完整信息进行传递。利用储存空间负采样方法，将优质负例三元组进行存储，并随训练过程进行更新，以提高知识图谱补全中负例三元组的质量。链接预测实验结果显示，储存空间方法使E-TUP模型链接预测准确率对比现有模型最高提升10.3%。在MovieLens-1m和DBbook2014数据集上进行推荐实验，在多个评价指标上取得最佳结果，对比现有模型实现最高5.5%的提升，表明E-TUP可以有效利用知识图谱中的隐藏关系提高模型推荐准确率。基于汽车维修数据进行推荐实验，结果表明E-TUP可以有效推荐相关知识。

参考文献 | 相关文章 | 多维度评价

Select

39. 完全合作类多智能体深度强化学习综述

赵立阳, 常天庆, 褚凯轩, 郭理彬, 张雷

计算机工程与应用 2023, 59 (12): 14-27. DOI: 10.3778/j.issn.1002-8331.2209-0186

摘要（412）

PDF（pc）（661KB）（282）

作为机器学习和人工智能领域的重要分支之一，完全合作类多智能体深度强化学习以一种通用的方式将深度强化学习的表达决策能力和多智能体系统的分布协作能力有效结合，为完全合作类多智能体系统中的无模型序贯决策问题提供了一种端对端的解决方案。对深度强化学习的基本原理进行阐述，并从基于值函数、基于策略梯度和基于演员-评论家三个主要方向对单智能体深度强化学习的发展进行了总结。分析了多智能体深度强化学习面临的主要挑战和主要的训练框架。依据实现最大团队联合奖励方式的不同，将完全合作类的多智能体深度强化学习划分为基于独立学习、基于通信学习、基于协作学习和基于奖励函数塑造四大类，并分别进行了总结分析。从解决实际问题的角度出发，对完全合作类多智能体深度强化学习算法的未来发展方向进行了展望。

参考文献 | 相关文章 | 多维度评价

Select

40. 基于深度学习的相机位姿估计方法综述

王静, 金玉楚, 郭苹, 胡少毅

计算机工程与应用 2023, 59 (7): 1-14. DOI: 10.3778/j.issn.1002-8331.2209-0280

摘要（848）

PDF（pc）（702KB）（430）

相机位姿估计是指在已知环境下精确地估计相机在世界坐标系中六自由度位姿的技术，该技术是机器人技术和自动驾驶中的关键技术。随着深度学习的飞速发展，使用深度学习来优化相机位姿估计算法已经成为了当前的研究热点之一。为了掌握目前相机位姿估计算法的研究现状与趋势，对基于深度学习的相机位姿估计的主流算法进行了综述。简单介绍了传统的基于特征点的相机位姿估计方法。重点介绍了基于深度学习的方法：根据核心算法的不同，从端到端的相机位姿估计、场景坐标回归、基于检索的相机位姿估计、层级结构、多信息融合和跨场景的相机位姿估计六个方面进行了详细的阐述和分析。对研究现状进行了总结，并基于深入的性能分析指出了相机位姿估计领域面临的挑战，展望了其发展动向。

参考文献 | 相关文章 | 多维度评价

全文下载排行