计算机工程与应用

Select

1. 激光雷达SLAM算法综述

刘铭哲, 徐光辉, 唐堂, 钱晓健, 耿明

计算机工程与应用 2024, 60 (1): 1-14. DOI: 10.3778/j.issn.1002-8331.2308-0455

摘要（913）

PDF（pc）（854KB）（610）

即时定位与地图构建（simultaneous localization and mapping，SLAM）是自主移动机器人和自动驾驶的关键技术之一，而激光雷达则是支撑SLAM算法运行的重要传感器。基于激光雷达的SLAM算法，对激光雷达SLAM总体框架进行介绍，详细阐述前端里程计、后端优化、回环检测、地图构建模块的作用并总结所使用的算法；按由2D到3D，单传感器到多传感器融合的顺序，对经典的具有代表性的开源算法进行描述和梳理归纳；介绍常用的开源数据集，以及精度评价指标和测评工具；从深度学习、多传感器融合、多机协同和鲁棒性研究四个维度对激光雷达SLAM技术的发展趋势进行展望。

参考文献 | 相关文章 | 多维度评价

Select

2. 农村电商物流下无人机与车辆协同配送路径优化研究

许菱, 杨林超, 朱文兴, 钟少君

计算机工程与应用 2024, 60 (1): 310-318. DOI: 10.3778/j.issn.1002-8331.2306-0115

摘要（861）

PDF（pc）（666KB）（722）

无人机配送正在成为解决物流末端配送难题的重要手段。无人机与车辆协同配送模式克服了无人机配送能力不足、安全性不高的弊端，是无人机参与配送的重要途径之一。针对农村电商物流“最后一公里”配送难、配送贵问题，考虑无人机与车辆协同方式、多无人机多包裹配送等约束，以配送成本最小化为目标构建混合整数规划模型并提出一种两阶段算法对无人机与车辆协同配送路径优化问题进行求解。第一阶段通过带约束的自适应K-means算法确定车辆停靠点范围，第二阶段设计爬山算子与分裂算子改进遗传算法，求得无人机与车辆配送路径。最后，通过算例实验验证了模型和算法的可行性与有效性。研究成果有望为农村电商物流末端配送降本增效提供新思路和参考价值。

参考文献 | 相关文章 | 多维度评价

Select

3. 公交辅助无人机的城市物流配送模式研究

彭勇, 任志

计算机工程与应用 2024, 60 (7): 335-343. DOI: 10.3778/j.issn.1002-8331.2212-0252

摘要（659）

PDF（pc）（755KB）（547）

电子商务迅猛发展倒逼物流行业不断转型升级，针对各地政府鼓励公共交通发展，倡导绿色低碳的物流配送方式，研究了一种公交辅助无人机的配送模式。对问题做出说明后，构建了以配送成本最小的数学模型，并设计了智能通用变邻域搜索算法对问题求解，同时为提高算法求解效率，引入K-means分簇与贪婪算法生成初始解。针对不同规模算例，进行多种局部搜索策略、多种算法对比实验，验证了算法有效性；选取标准CVRP算例，将单卡车配送、卡车无人机协同配送与公交辅助无人机配送模式进行对比，证明其成本、时间优势；选取北京快速公交2号线及周边客户点，通过改变公交站点间距、发车间隔做出敏感度分析，实验结果证明增大站点间距的影响大于发车间隔的改变。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于多模态融合的情感分析算法研究综述

郭续, 买日旦·吾守尔, 古兰拜尔·吐尔洪

计算机工程与应用 2024, 60 (2): 1-18. DOI: 10.3778/j.issn.1002-8331.2305-0439

摘要（657）

PDF（pc）（954KB）（481）

情感分析是一项新兴技术，其旨在探索人们对实体的态度，可应用于各种领域和场景，例如产品评价分析、舆情分析、心理健康分析和风险评估。传统的情感分析模型主要关注文本内容，然而一些特殊的表达形式，如讽刺和夸张，则很难通过文本检测出来。随着技术的不断进步，人们现在可以通过音频、图像和视频等多种渠道来表达自己的观点和感受，因此情感分析正向多模态转变，这也为情感分析带来了新的机遇。多模态情感分析除了包含文本信息外，还包含丰富的视觉和听觉信息，利用融合分析可以更准确地推断隐含的情感极性（积极、中性、消极）。多模态情感分析面临的主要挑战是跨模态情感信息的整合，因此，重点介绍了不同融合方法的框架和特点，并对近几年流行的融合算法进行了阐述，同时对目前小样本场景下的多模态情感分析进行了讨论，此外，还介绍了多模态情感分析的发展现状、常用数据集、特征提取算法、应用领域和存在的挑战。期望此综述能够帮助研究人员了解多模态情感分析领域的研究现状，并从中得到启发，开发出更加有效的模型。

参考文献 | 相关文章 | 多维度评价

Select

5. 改进YOLOv7的小目标检测算法研究

李安达, 吴瑞明, 李旭东

计算机工程与应用 2024, 60 (1): 122-134. DOI: 10.3778/j.issn.1002-8331.2307-0004

摘要（408）

PDF（pc）（884KB）（240）

随着深度学习在国内目标检测的不断应用，常规的大、中目标检测已经取得惊人的进步，但由于卷积网络本身的局限性，针对小目标检测依然会出现漏检、误检的问题，以数据集Visdrone2019和数据集FloW-Img为例，对YOLOv7模型进行研究，在网络结构上对骨干网的ELAN模块进行改进，将Focal NeXt block加入到ELAN模块的长短梯度路径中融合来强化输出小目标的特征质量和提高输出特征包含的上下文信息含量，在头部网络引入RepLKDeXt模块，该模块不仅可以取代SPPCSPC模块来简化模型整体结构还可以利用多通道、大卷积核和Cat操作来优化ELAN-H结构，最后引入SIOU损失函数取代CIOU函数以此提高该模型的鲁棒性。结果表明改进后的YOLOv7模型参数量减少计算复杂性降低并在小目标密度高的Visdrone 2019数据集上的检测性能近似不变，在小目标稀疏的FloW-Img数据集上涨幅9.05个百分点，进一步简化了模型并增加了模型的适用范围。

参考文献 | 相关文章 | 多维度评价

Select

6. 无人机飞控系统故障诊断技术研究综述

安雪, 李少波, 张仪宗, 张安思

计算机工程与应用 2023, 59 (24): 1-15. DOI: 10.3778/j.issn.1002-8331.2305-0137

摘要（404）

PDF（pc）（917KB）（1488）

近年来，无人机因其运行成本低、机动性强等独特优势被广泛应用于军民各复杂领域；同时，复杂多样的任务对无人机系统的可靠性和安全性提出了更高的要求。无人机故障诊断技术能够及时准确地提供诊断结果，有助于无人机的维护、保养与维修，对提升无人机的作战效能具有重要意义。因此，从无人机的飞控系统剖析各类常见故障的机理，并进行故障归类。主要围绕飞控系统中的传感器、执行器和其他部件的故障诊断技术，分析总结了无人机故障诊断技术的研究方法和现状。探讨了无人机故障诊断技术面临的主要挑战，并指出了未来的发展方向；旨在为无人机故障诊断技术领域研究人员提供一定参考，促进我国无人机故障诊断技术水平的提升。

参考文献 | 相关文章 | 多维度评价

Select

7. 面向无人机视角下小目标检测的YOLOv8s改进模型

潘玮, 韦超, 钱春雨, 杨哲

计算机工程与应用 2024, 60 (9): 142-150. DOI: 10.3778/j.issn.1002-8331.2312-0043

摘要（379）

PDF（pc）（5858KB）（547）

从无人机视角进行目标检测，面临图像目标小、分布密集、类别不均衡等难点，且由于无人机的硬件条件限制了模型的规模，导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型，在骨干网络中引入感受野注意力卷积和CBAM（concentration-based attention module）注意力机制改进卷积模块，解决注意力权重参数在感受野特征中共享问题的同时，在通道和空间维度加上注意力权重，增强特征提取能力；通过引入大型可分离卷积注意力思想，改造空间金字塔池化层，增加不同层级特征间的信息交融；优化颈部结构，增加具有丰富小目标语义信息的特征层；使用inner-IoU损失函数的思想改进MPDIoU（minimum point distance based IoU）函数，以inner-MPDIoU代替原损失函数，提升对困难样本的学习能力。实验结果表明，改进后的YOLOv8s模型在VisDrone数据集上mAP、P、R分别提升了16.1%、9.3%、14.9%，性能超过YOLOv8m，可以有效应用于无人机平台上的目标检测任务。

参考文献 | 相关文章 | 多维度评价

Select

8. CNN-Transformer特征融合多目标跟踪算法

张英俊, 白小辉, 谢斌红

计算机工程与应用 2024, 60 (2): 180-190. DOI: 10.3778/j.issn.1002-8331.2211-0028

摘要（376）

PDF（pc）（787KB）（221）

在卷积神经网络（CNN）中，卷积运算能高效地提取目标的局部特征，却难以捕获全局表示；而在视觉Transformer中，注意力机制可以捕获长距离的特征依赖，但会忽略局部特征细节。针对以上问题，提出一种基于CNN-Transformer双分支主干网络进行特征提取和融合的多目标跟踪算法CTMOT（CNN-transformer multi-object tracking）。使用基于CNN和Transformer双分支并行的主干网络分别提取图像的局部和全局特征。使用双向桥接模块（two-way braidge module，TBM）对两种特征进行充分融合。将融合后的特征输入两组并行的解码器进行处理。将解码器输出的检测框和跟踪框进行匹配，完成多目标跟踪任务。在多目标跟踪数据集MOT17、MOT20、KITTI以及UA-DETRAC上进行评估，CTMOT算法的MOTP和IDs指标在四个数据集上均达到了SOTA效果，MOTA指标分别达到了76.4%、66.3%、92.36%和88.57%，在MOT数据集上与SOTA方法效果相当，在KITTI数据集上达到SOTA效果。由于同时完成目标检测和关联，能够端到端进行目标跟踪，跟踪速度可达35?FPS，表明CTMOT算法在跟踪的实时性和准确性上达到了较好的平衡，具有较大潜力。

参考文献 | 相关文章 | 多维度评价

Select

9. 改进YOLOv8的道路损伤检测算法

李松, 史涛, 井方科

计算机工程与应用 2023, 59 (23): 165-174. DOI: 10.3778/j.issn.1002-8331.2306-0205

摘要（355）

PDF（pc）（671KB）（287）

道路损伤检测是保障道路安全、实现道路损伤及时修复的一项重要任务。针对现有的道路损伤检测算法中检测效率低、成本高昂、难以应用于移动终端设备问题，提出了一种改进YOLOv8的轻量型道路损伤检测算法YOLOv8-Road Damage（YOLOv8-RD）。结合CNN和Transformer的优势，提出了一种能够提取道路损伤图像全局特征信息和局部特征信息的BOT模块，以适应裂纹对象的大跨度与细长特征。在骨干网络末端和颈部网络中引入坐标注意力机制（coordinate attention，CA），将位置信息嵌入到通道注意力中，强化特征提取能力，并抑制无关特征的干扰。在YOLOv8颈部网络中使用C2fGhost模块，以减少特征通道融合过程中的浮点运算量，降低模型参数量，同时提高特征表达性能。实验结果表明，在RDD2022数据集和Road Damage数据集上，改进算法与原算法相比mAP50分别提高了2个百分点和3.7个百分点，而模型参数量仅为2.8×106，计算量仅为7.3×109，分别降低了6.7%和8.5%。算法检测速度达到88?FPS，能够实时准确检测道路损伤目标。通过与其他主流目标检测算法比较，验证了该方法的有效性和优越性。

参考文献 | 相关文章 | 多维度评价

Select

10. 改进YOLOv8的道路交通标志目标检测算法

田鹏, 毛力

计算机工程与应用 2024, 60 (8): 202-212. DOI: 10.3778/j.issn.1002-8331.2309-0415

摘要（336）

PDF（pc）（937KB）（269）

虽然，当前检测技术日趋成熟，但对于复杂环境下的小目标检测仍然是研究的重难点。针对道路交通场景中普遍存在的交通标志小目标比例较高，环境干扰因素较大的问题，提出了一种基于YOLOv8改进的道路交通标志目标检测算法。由于小目标检测中容易出现漏检的现象，利用BRA（bi-level routing attention）注意力机制提高网络对小目标的感知能力。此外，还利用可形变卷积模块DCNv3（deformable convolution v3），针对特征图中的不规则形状具有更好的特征提取能力，使骨干网络更好地适应不规则的空间结构，更精准地关注重要目标，从而提高模型对遮挡重叠目标的检测能力。DCNv3和BRA模块均在基本不增加模型权重大小的情况下提高模型准确性。同时引入基于辅助边框的Inner-IOU损失函数。在RoadSign、CCTSDB、TSDD、GTSDB四个数据集上，分别进行了小样本训练、大样本训练、单目标检测和多目标检测，实验结果均有所提高。其中，在RoadSign数据集上的实验结果最佳，YOLOv8改进模型的均值平均精度mAP50与mAP50：95分别达到了90.7%和75.1%，相较于基线模型，mAP50与mAP50：95分别提升了5.9和4.8个百分点。实验结果表明，YOLOv8改进模型有效地实现了在复杂道路场景下的交通标志检测。

参考文献 | 相关文章 | 多维度评价

Select

11. 改进YOLOv8的多尺度轻量型车辆目标检测算法

张利丰, 田莹

计算机工程与应用 2024, 60 (3): 129-137. DOI: 10.3778/j.issn.1002-8331.2309-0145

摘要（316）

PDF（pc）（713KB）（306）

针对传统车辆目标检测模型设备需求高、检测精度低、重叠目标漏检率高等问题，提出了一种改进YOLOv8的车辆目标检测算法RBT-YOLO。采用多尺度融合的方式对主干网络进行重构。对BiFPN进行改进，增加卷积操作以及调整输入输出通道个数以适应YOLOv8，加强其特征融合能力。在Neck部分输出的特征图之后加入轻量型注意力机制Triplet Attention，提升模型的特征提取能力。针对真实情况下车辆目标重叠度较高的问题，使用SoftNMS（soft non-maximum suppression）替换原有NMS，使模型对候选框的处理方式更为温和，增强了模型对目标的检测能力，提升了召回率。在Pascal VOC和MS COCO数据集上进行实验，结果表明提出的RBT-YOLO性能超越原始模型，参数量和计算量下降60%左右，mAP分别提高了2.6和3.0个百分点，并在体积和精度上优于其他经典检测模型，具有很强的实用性。

参考文献 | 相关文章 | 多维度评价

Select

12. 图卷积神经网络及其在图像识别领域的应用综述

李文静, 白静, 彭斌, 杨瞻源

计算机工程与应用 2023, 59 (22): 15-35. DOI: 10.3778/j.issn.1002-8331.2302-0273

摘要（311）

PDF（pc）（803KB）（286）

卷积神经网络被广泛应用于图像识别领域并且展现出强大的特征提取能力，但它只能处理欧氏空间的结构化数据，无法适用于非结构化数据的处理。为应对该限制，图卷积神经网络利用谱域和空域方法，拓展了卷积运算的范围，使其能够在非欧几里德空间中进行特征学习，具备图数据的平移不变性，可以实现对非结构化图数据的表征学习。首先阐述了基于频域和空域的两种类型图卷积神经网络的基本原理，并且介绍了相关的改进工作；然后围绕图像识别领域，重点介绍了图卷积神经网络在多标签图像识别、基于骨架的动作识别和高光谱图像分类中的具体应用，总结其研究的最新进展，并对相关的模型进行了性能对比与分析；最后对全文内容进行总结，并对未来的发展方向进行展望。

参考文献 | 相关文章 | 多维度评价

Select

13. 深度学习在结肠息肉分割中的应用综述

孙福艳, 王琼, 吕宗旺, 龚春艳

计算机工程与应用 2023, 59 (23): 15-27. DOI: 10.3778/j.issn.1002-8331.2303-0124

摘要（305）

PDF（pc）（626KB）（212）

大部分结直肠癌起源于结肠息肉的恶性病变，使用计算机辅助诊断系统实现结肠息肉的自动精准分割具有重要的临床意义，能够在结肠镜检查过程中辅助医生提高息肉检出率。目前深度学习技术在医学图像分割领域应用广泛，基于深度学习的结肠息肉分割算法也取得了重大进展。简要介绍了传统息肉分割算法及其优点和局限性。重点从三个方面对深度学习息肉分割算法进行综述：基于经典CNN结构、基于U-Net结构和基于多模型融合的分割模型，并总结算法改进策略及其优势和局限性。归纳结肠息肉图像公开数据集及数据预处理方法，最后总结基于深度学习的息肉分割研究面临的挑战，并对该领域未来的研究方向做出展望。

参考文献 | 相关文章 | 多维度评价

Select

14. 视频文本跨模态检索研究综述

陈磊, 习怡萌, 刘立波

计算机工程与应用 2024, 60 (4): 1-20. DOI: 10.3778/j.issn.1002-8331.2306-0382

摘要（297）

PDF（pc）（3662KB）（280）

模态代表着数据特定的存在形式，不同模态数据的快速增长，使得多模态学习受到广泛关注。跨模态检索作为多模态学习的一个重要分支，在图文方面已得到显著发展。然而视频相对于图像而言承载了更多模态的数据，也包含更广泛的信息，能够满足用户对信息检索全面性、灵活性的要求，近年来逐渐成为跨模态检索的研究热点。为全面认识和理解视频文本跨模态检索及其前沿工作，对现有代表性方法进行了梳理和综述。首先归纳分析了当前基于深度学习的单向、双向视频文本跨模态检索方法，对每类方法中的经典工作进行了详细分析并阐述了优缺点。接着从实验的角度给出视频文本跨模态检索的基准数据集和评价指标，并在多个常用基准数据集上比较了一些典型方法的性能。最后讨论了视频文本跨模态检索的应用前景、待解决问题及未来研究挑战。

参考文献 | 相关文章 | 多维度评价

Select

15. 轻量化YOLOv8的小样本钢板缺陷检测算法

窦智, 高浩然, 刘国奇, 常宝方

计算机工程与应用 2024, 60 (9): 90-100. DOI: 10.3778/j.issn.1002-8331.2311-0070

摘要（289）

PDF（pc）（5010KB）（345）

钢板的表面积较大，表面缺陷非常常见，且呈现多类少量的特点。深度学习很难有效应用于此类小样本缺陷的检测中。为了解决此问题，提出一种基于轻量化YOLOv8的小样本钢板缺陷检测算法，提出一种基于模糊搜索的交互式数据增强算法，可有效解决训练样本缺失导致网络模型无法得到有效训练的问题，使深度学习应用于该领域成为可能。设计LMSRNet（lightweight multi-scale residual networks）网络替换YOLOv8的主干，以实现网络模型的轻量化，并提高其可移植性。提出CBFPN（context bidirectional feature pyramid network）和ECSA（efficient channel spatial attention）模块，使网络能更有效地提取并融合伤痕特征，同时采用Wise-IoU损失函数以提高检测性能。对比实验结果表明，与原YOLOv8算法相比，改进后的网络参数量只有原网络的30%，计算量是原网络的49%，FPS提高了9?帧/s，精确率、召回率、mAP分别提高了2.9、6.5、5.5个百分点，实验结果充分验证了该算法的优势。

参考文献 | 相关文章 | 多维度评价

Select

16. 农业知识图谱研究综述

唐闻涛, 胡泽林

计算机工程与应用 2024, 60 (2): 63-76. DOI: 10.3778/j.issn.1002-8331.2305-0203

摘要（287）

PDF（pc）（629KB）（225）

知识图谱是大数据时代下知识工程的关键技术。利用知识图谱强大的语义理解和知识组织能力，可以解决现代化农业建设中农业知识分散无序、知识覆盖范围不足等问题针对农业领域数据复杂、专业性强等特点，给出了农业知识图谱的构建方法与框架；综述了农业知识图谱构建中本体构建、知识抽取、知识融合以及知识推理四个关键技术的国内外研究现状；系统梳理了农业知识图谱在决策支持、智能问答与推荐系统的应用；最后，介绍了几个具体的农业知识图谱实例。根据农业知识图谱的研究现状，对其未来的研究方向进行了展望。

参考文献 | 相关文章 | 多维度评价

Select

17. 医学CT影像超分辨率深度学习方法综述

田苗苗, 支力佳, 张少敏, 晁代福

计算机工程与应用 2024, 60 (3): 44-60. DOI: 10.3778/j.issn.1002-8331.2303-0224

摘要（287）

PDF（pc）（867KB）（236）

图像超分辨率（SR）是计算机视觉领域提高图像分辨率的重要处理方法之一，在医学图像领域有重要的研究意义和应用价值。高质量和高分辨率的医学CT影像在当前的临床过程中非常重要。近年来，基于深度学习的医学CT影像超分辨率重建技术取得了显著的进展，对该领域内的代表性方法进行了梳理，系统回顾了医学CT影像超分辨率重建技术的发展。介绍了SR基本理论，给出常用的评价指标；重点阐述基于深度学习的医学CT影像超分辨率重建方向的创新与进展，对各个方法的主要特点和性能进行了综合比较分析。最后，讨论了医学CT影像超分辨率重建方向上存在的困难和挑战，并对未来的发展趋势进行了总结与展望，希望能为相关研究提供参考。

参考文献 | 相关文章 | 多维度评价

Select

18. 优化改进YOLOv8实现实时无人机车辆检测的算法

史涛, 崔杰, 李松

计算机工程与应用 2024, 60 (9): 79-89. DOI: 10.3778/j.issn.1002-8331.2312-0291

摘要（282）

PDF（pc）（4614KB）（369）

针对现有无人机车辆检测算法精度低、易受背景环境干扰、难以检测微小目标车辆问题，提出了一种改进YOLOv8的无人机车辆检测算法YOLOv8-CX。结合Deformable Convolutional Networks v1-3的优点，提出一种能够灵活采样特征的C2f-DCN模块，以更好地提取不同尺寸大小车辆之间的特征。利用Large Separable Kernel Attention的思想，提出了具有长程依赖性和自适应能力的SPPF-LSKA模块，可以有效减少背景对于车辆检测的干扰。在颈部网络，采用CF-FPN（ment network for tiny object deteciton）特征融合结构，通过结合上下文信息和抑制不同尺度特征之间的冲突信息，提升了对小目标的检测精度。最后，将原始YOLOv8的头部替换为Dynamic Head检测头。通过将尺度、空间和任务三种注意力机制结合统一，进一步提升了模型的检测性能。实验结果表明，在Mapsai数据集上，改进算法与原算法相比准确率（P）、召回率（R）、平均精度（mAP）分别提升了8.5、11.2和6.2个百分点，且算法检测速度达到72.6?FPS，满足无人机车辆检测实时性的要求。通过与其他主流目标检测算法比较，验证了该方法的有效性和卓越性。

参考文献 | 相关文章 | 多维度评价

Select

19. 在线课程推荐系统综述

余鹏, 刘星雨, 程颢, 杨佳琦, 陈国华, 贺超波

计算机工程与应用 2023, 59 (22): 1-14. DOI: 10.3778/j.issn.1002-8331.2305-0162

摘要（273）

PDF（pc）（692KB）（227）

在线教育的快速发展使得在线课程数量爆炸式增长，学习者很容易陷入“课程过载”带来的课程信息获取效率低下的问题，这推动了在线课程推荐系统的产生和发展。目前在线课程推荐系统已成为研究热点，并且在该领域中提出了大量方法，有必要对最新的研究进展进行系统的梳理分析。首先归纳总结在线课程推荐系统的基本框架和相关概念。然后重点对比分析现有在线课程推荐系统采用的各类核心推荐方法，其中包括基于关联规则挖掘、基于矩阵分解、基于概率模型、基于深度学习、基于智能优化、基于语义计算等类型的方法。最后介绍在线课程系统的各种评价指标和公开可用的数据集，并展望未来的发展方向。

参考文献 | 相关文章 | 多维度评价

Select

20. 改进YOLOv8的航拍图像小目标检测算法

付锦燚, 张自嘉, 孙伟, 邹凯鑫

计算机工程与应用 2024, 60 (6): 100-109. DOI: 10.3778/j.issn.1002-8331.2311-0281

摘要（271）

PDF（pc）（771KB）（244）

针对在航拍图像检测任务中，物体和整体图像尺寸都比较小，尺度特征不一和细节信息不清晰，会造成漏检和误检等问题，提出了一种改进小目标检测算法CA-YOLOv8。设计了一种通道特征部分卷积模块CFPConv（channel feature partial convolution），基于此重新构造了C2f中的Bottleneck结构，命名为CFP_C2f，从而替换YOLOv8头部和颈部的部分C2f模块，增强有效通道特征权值，提升多尺度细节特征的获取能力。嵌入一种用以提升上下文聚合能力的模块CAM（context aggregated module），优化特征通道的响应，强化对深层特征的细节感知能力。添加NWD损失函数，将其与CIoU结合作为定位回归损失函数，降低位置偏差的敏感性。充分运用多重注意力机制的优势，把原有检测头替换为DyHead（dynamic head）。在VisDrone2019数据集的实验中，改进的算法较YOLOv8s原模型参数量降低了33.3%，检测精度mAP50值和mAP50：95分别提升了8.7和5.7个百分点，表现出良好的性能，验证了其有效性。

参考文献 | 相关文章 | 多维度评价

Select

21. 基于多模态数据的人体行为识别方法研究综述

王彩玲, 闫晶晶, 张智栋

计算机工程与应用 2024, 60 (9): 1-18. DOI: 10.3778/j.issn.1002-8331.2310-0090

摘要（259）

PDF（pc）（8541KB）（388）

人体行为识别广泛应用于智能安防、自动驾驶和人机交互等领域。随着拍摄设备和传感器技术的发展，可获取用于人体行为识别的数据不再局限于RGB数据，还有深度、骨骼和红外等多模态数据。详细介绍了基于RGB和骨骼数据模态的人体行为识别任务中特征提取方法，包括基于手工标注和基于深度学习的方法。对于RGB数据模态，重点分析了基于双流卷积神经网络、3D卷积神经网络和混合网络的特征提取算法。对于骨骼数据模态，介绍了目前流行的单人和多人姿态评估算法；重点分析了基于卷积神经网络、循环神经网络和图卷积神经网络的分类算法；进一步全面展示了两种数据模态的通用数据集。此外，基于RGB和骨骼各自的数据结构特征，探讨了目前面临的挑战，最后对未来基于深度学习的人体行为识别方法的研究方向进行了展望。

参考文献 | 相关文章 | 多维度评价

Select

22. 深度学习优化器进展综述

常禧龙, 梁琨, 李文涛

计算机工程与应用 2024, 60 (7): 1-12. DOI: 10.3778/j.issn.1002-8331.2307-0370

摘要（257）

PDF（pc）（1327KB）（287）

优化器是提高深度学习模型性能的关键因素，通过最小化损失函数使得模型的参数和真实参数接近从而提高模型的性能。随着GPT等大语言模型成为自然语言处理领域研究焦点，以梯度下降优化器为核心的传统优化器对大模型的优化效果甚微。因此自适应矩估计类优化器应运而生，其在提高模型泛化能力等方面显著优于传统优化器。以梯度下降、自适应梯度和自适应矩估计三类优化器为主线，分析其原理及优劣。将优化器应用到Transformer架构中，选取法-英翻译任务作为评估基准，通过实验深入探讨优化器在特定任务上的效果差异。实验结果表明，自适应矩估计类优化器在机器翻译任务上有效提高模型的性能。同时，展望优化器的发展方向并给出在具体任务上的应用场景。

参考文献 | 相关文章 | 多维度评价

Select

23. 机器视觉在农作物种子检测中的研究进展

王昊, 祝玉华, 李智慧, 甄彤

计算机工程与应用 2023, 59 (22): 69-83. DOI: 10.3778/j.issn.1002-8331.2303-0166

摘要（253）

PDF（pc）（858KB）（156）

农作物种子是农业生产的基础。种子检测作为一种重要的手段，在种子生产、贸易和利用的各个环节都扮演着不可或缺的角色。然而传统的农作物种子识别方法效率低，需要人力以及专业检测设备的支持。相比之下，机器视觉技术能够通过模拟人的视觉功能来实现对目标的无损检测，效率高、准确度高，有助于实现农作物种子的品种识别、分级、分类的自动化、智能化。首先简单叙述了机器视觉技术中图像采集、预处理的方法，并以玉米种子为例给出了目前主流的处理流程，然后具体叙述了机器视觉技术中传统机器学习和深度学习两种检测方式在农作物种子检测中的应用，最后针对玉米不完善粒的研究，在分为以上两种检测方式进行具体叙述的同时，指出了目前存在的问题以及玉米不完善粒检测未来的研究方向。

参考文献 | 相关文章 | 多维度评价

Select

24. 基于深度元学习的小样本图像分类研究综述

周伯俊, 陈峙宇

计算机工程与应用 2024, 60 (8): 1-15. DOI: 10.3778/j.issn.1002-8331.2308-0271

摘要（250）

PDF（pc）（1091KB）（309）

深度元学习是解决小样本分类问题的流行范式。对近年来基于深度元学习的小样本图像分类算法进行了详细综述。从问题的描述出发对基于深度元学习的小样本图像分类算法进行概括，并介绍了常用小样本图像分类数据集及评价准则；分别从基于模型的深度元学习方法、基于优化的深度元学习方法以及基于度量的深度元学习方法三个方面对其中的典型模型以及最新研究进展进行详细阐述。最后，给出了现有算法在常用公开数据集上的性能表现，总结了该课题中的研究热点，并讨论了未来的研究方向。

参考文献 | 相关文章 | 多维度评价

Select

25. 融合改进YOLOv5及Mediapipe的手势识别研究

倪广兴, 徐华, 王超

计算机工程与应用 2024, 60 (7): 108-118. DOI: 10.3778/j.issn.1002-8331.2308-0097

摘要（244）

PDF（pc）（686KB）（197）

针对现有手势识别算法计算量大、鲁棒性差等问题，提出一种基于IYOLOv5-Med（improved YOLOv5 Mediapipe）算法的手势识别方法。该算法将改进的YOLOv5算法和Mediapipe方法结合，包括手势检测和手势分析两部分，算法有效降低了训练的时间成本，增加了识别的鲁棒性。手势检测部分，改进了传统YOLOv5算法，利用FastNet重构C3模块，将CBS模块替换为GhostNet中GhostConv模块，在Backbone网络末端加入SE注意力机制模块，改进后的算法，模型体积更小，更适用于资源有限的边缘设备。手势分析部分，提出了一种基于Mediapipe的方法，对手势检测部分定位到的手势区域进行手部关键点检测，并提取相关特征，然后通过朴素贝叶斯分类器进行识别。实验结果证实了提出的IYOLOv5-Med算法的有效性，与传统YOLOv5算法相比，参数量下降34.5%，计算量减少34.9%，模型权重降低33.2%，最终平均识别率达到0.997，且实现方法相对简单，有较好的应用前景。

参考文献 | 相关文章 | 多维度评价

Select

26. 联邦学习中的攻击手段与防御机制研究综述

张世文, 陈双, 梁伟, 李仁发

计算机工程与应用 2024, 60 (5): 1-16. DOI: 10.3778/j.issn.1002-8331.2306-0243

摘要（241）

PDF（pc）（792KB）（265）

联邦学习的攻防技术是联邦学习系统安全的核心问题。联邦学习的攻防技术能大幅降低联邦学习系统被攻击的风险，明显提升联邦学习系统的安全性。深入了解联邦学习的攻防技术，可以推进联邦学习领域的研究，实现联邦学习的广泛应用。因此，对联邦学习的攻防技术进行研究具有十分重要的意义。简要地介绍了联邦学习的概念、基本工作流程、类型及可能存在的安全问题；介绍联邦学习系统可能遭受到的攻击，梳理了相关研究；从联邦学习系统有无目标性的防御措施出发，将防御措施分为通用性防御措施及针对性防御措施两类，并对其进行了针对性的总结；对联邦学习安全性未来的研究方向进行了梳理与分析，为相关研究者在联邦学习安全性方面的研究工作提供了参考。

参考文献 | 相关文章 | 多维度评价

Select

27. 中文命名实体识别研究综述

赵继贵, 钱育蓉, 王魁, 侯树祥, 陈嘉颖

计算机工程与应用 2024, 60 (1): 15-27. DOI: 10.3778/j.issn.1002-8331.2304-0398

摘要（239）

PDF（pc）（606KB）（164）

命名实体识别（named entity recognition，NER）是自然语言处理中最基本的任务之一，其主要内容是识别自然语言文本中具有特定意义的实体类型和边界。然而，中文命名实体识别（Chinese named entity recognition，CNER）的数据样本存在词边界模糊、语义多样化、形态特征模糊以及中文语料库内容较少等问题，导致中文命名实体识别性能难以大幅提升。介绍了CNER的数据集、标注方案和评价指标。按照CNER的研究进程，将CNER方法分为基于规则的方法、基于统计的方法和基于深度学习的方法三类，并对近五年来基于深度学习的CNER主要模型进行总结。探讨CNER的研究趋势，为新方法的提出和未来研究方向提供一定参考。

参考文献 | 相关文章 | 多维度评价

Select

28. 基于改进YOLOv8的交通监控车辆检测算法

周飞, 郭杜杜, 王洋, 王庆庆, 秦音, 杨卓敏, 贺海军

计算机工程与应用 2024, 60 (6): 110-120. DOI: 10.3778/j.issn.1002-8331.2310-0101

摘要（239）

PDF（pc）（817KB）（247）

针对目前复杂交通监控场景下车辆检测精度不足、检测速度慢的问题，提出一种基于YOLOv8模型的轻量级车辆检测算法。采用FasterNet替换YOLOv8的骨干特征提取网络，减少了冗余计算和内存访问，提高了模型的检测精度和推理速度；在Backbone和Neck部分添加SimAM注意力模块，在不增加原始网络参数的同时增强了目标车辆的重要特征，提高了模型的特征融合能力；针对密集车流下小尺寸车辆检测效果不佳的问题，添加小目标检测头，更好地捕获小尺寸车辆的特征和上下文信息；使用可自适应调整权重系数的Wise-IoU作为改进模型的损失函数，提升了边界框的回归性能和检测的鲁棒性。在UA-DETRAC数据集的实验结果表明，相较于原模型，改进方法在交通监控系统中能够达到较好的检测精度和速度，mAP和FPS分别提高了3.06个百分点和3.36%，有效改善了复杂交通场景下小目标车辆检测效果不佳的问题，并在精度和速度之间取得了很好的平衡。

参考文献 | 相关文章 | 多维度评价

Select

29. 基于ATO-YOLO的小目标检测算法

苏佳, 秦一畅, 贾泽, 王静

计算机工程与应用 2024, 60 (6): 68-77. DOI: 10.3778/j.issn.1002-8331.2308-0385

摘要（236）

PDF（pc）（795KB）（225）

小目标检测在计算机视觉领域具有重要意义，但现有方法在应对小目标的尺度变化、目标密集和无规则排列等挑战时经常出现漏检和误检的问题。为解决这些问题，提出基于改进YOLOv5算法的ATO-YOLO。为提升检测模型的特征表达能力，提出一种结合注意力机制的自适应特征提取模块（adaptive feature extraction，AFE），通过动态调整权重分配突出关键目标的特征表示，提高目标检测任务在不同场景下的准确性和鲁棒性。设计一种三重特征融合机制（triple feature fusion，TFF），能够在不同尺度下充分利用多尺度信息，将多个尺度的特征图融合，以获取更全面的目标特征，提升对小目标的检测效果。引入一种输出重构模块（output reconstruction，ORS），通过去除大目标检测层并增加小目标检测层，实现精确定位和识别小目标，并且相对于原模型复杂度更低，检测速度更快。实验结果表明，ATO-YOLO算法在VisDrone数据集上的mAP@0.5达到了38.2%，较原YOLOv5提升了6.1个百分点，且FPS较改进前提升了4.4%，能够快速准确地对小目标进行检测。

参考文献 | 相关文章 | 多维度评价

Select

30. 医学图像分割的无监督域适应研究综述

呼伟, 徐巧枝, 葛湘巍, 于磊

计算机工程与应用 2024, 60 (6): 10-26. DOI: 10.3778/j.issn.1002-8331.2307-0421

摘要（227）

PDF（pc）（756KB）（208）

医学图像分割在医学图像处理领域中具有广泛的应用前景，通过定位和分割出感兴趣的器官、组织或病变区域，为诊断和治疗提供辅助信息。但不同模态医学图像之间存在域偏移问题，这会导致在实际部署时分割模型的性能大幅下降。域适应技术是解决该问题的有效途径，尤其是无监督域适应，因其不需要目标域标签信息而成为医学图像处理领域的研究热点。目前，针对医学图像分割的无监督域适应研究的综述报告相对较少，对近年医学图像分割的无监督域适应的相关研究进行了整理、分析和总结，并对未来进行了展望，希望帮助相关研究人员快速了解并熟悉该领域的研究现状及趋势。

参考文献 | 相关文章 | 多维度评价

Select

31. 视觉Transformer在低级视觉领域的研究综述

朱凯, 李理, 张彤, 江晟, 别一鸣

计算机工程与应用 2024, 60 (4): 39-56. DOI: 10.3778/j.issn.1002-8331.2304-0139

摘要（227）

PDF（pc）（3488KB）（173）

Transformer是一种革命性的神经网络模型架构，最初为自然语言处理而设计，但其由于卓越的性能，在计算机视觉领域获得了广泛的应用。虽然关于Transformer在自然语言处理领域的应用有大量的研究和文献，但针对低级视觉任务的综述相对匮乏。简要介绍了Transformer的原理并分析归纳了几种变体。在低级视觉任务的应用方面，将重点放在图像恢复、图像增强和图像生成这三个关键领域。通过详细分析不同模型在这些任务中的表现，探讨了它们在常用数据集上的性能差异。对Transformer在低级视觉领域的发展趋势进行了总结和展望，提出了未来的研究方向，以进一步推动Transformer在低级视觉任务中的创新和发展。这一领域的迅猛发展将为计算机视觉和图像处理领域带来更多的突破，为实际应用提供更加强大和高效的解决方案。

参考文献 | 相关文章 | 多维度评价

Select

32. 基于YOLOv5的轻量级雾天目标检测方法

赖镜安, 陈紫强, 孙宗威, 裴庆祺

计算机工程与应用 2024, 60 (6): 78-88. DOI: 10.3778/j.issn.1002-8331.2308-0029

摘要（222）

PDF（pc）（1220KB）（231）

针对雾天场景下目标检测算法精度较低、模型复杂度较高，提出一种基于YOLOv5的轻量级雾天目标检测方法。采用感受野注意力模块(RFAblock)通过交互感受野特征信息，对感受野添加注意力机制，提高特征提取能力；采用轻量化网络Slimneck作为颈部结构，在保持精度的同时降低模型参数和复杂度；在损失函数中引入真实框与预测框之间的角度向量，提高训练速度和推理的准确性；采用PNMS(precise non-maximum suppression)改进候选框选择机制，降低车辆遮挡情况下的漏检率。在真实雾天数据集RTTS和合成雾天数据集Foggy Cityscapes上进行测试，实验结果表明，与YOLOv5l相比mAP50分别提高了4.9和3.5个百分点，模型参数量仅为YOLOv5l的54.6%。

参考文献 | 相关文章 | 多维度评价

Select

33. 人工智能在中医诊疗领域的研究综述

苏尤丽, 胡宣宇, 马世杰, 张雨宁, 阿布都克力木·阿布力孜, 哈里旦木·阿布都克里木

计算机工程与应用 2024, 60 (16): 1-18. DOI: 10.3778/j.issn.1002-8331.2312-0400

摘要（219）

PDF（pc）（6171KB）（250）

中医诊疗领域正逐步迈向标准化、客观化、现代化与智能化。在此过程中，人工智能的融入极大地推动了中医诊疗、科学研究及中医传承的发展。从人工智能在中医领域的研究现状出发，梳理了从最初的专家系统和规则引擎，到逐渐成熟的传统机器学习算法，再到如今引领潮流的深度学习三个阶段，人工智能在中医领域的应用发展情况。总结了近年来涌现出的中医知识管理工具和大型模型，这些工具和模型为中医诊疗的智能化提供了坚实的支持。最后针对现阶段人工智能在中医领域中存在的数据公平性、多模态数据理解、模型鲁棒性、个性化医疗及可解释性等多重挑战进行分析。为应对这些挑战，需要持续探索并提出可能的解决方案，以推动中医诊疗智能化的深入发展，更好地满足人民健康需求。

参考文献 | 相关文章 | 多维度评价

Select

34. 图着色问题的算法研究综述

宋家欢, 王晓峰, 胡思敏, 贾璟伟, 颜冬

计算机工程与应用 2024, 60 (18): 66-77. DOI: 10.3778/j.issn.1002-8331.2403-0434

摘要（219）

PDF（pc）（4612KB）（182）

图着色问题（graph coloring problem，GCP）是一个经典的组合优化问题，已广泛应用于数学、计算机科学和生物科学等多个领域。由于图着色问题的NP难特性，目前还没有多项式时间内的精确算法求解该问题，为了给出求解该问题的高效算法，需要对现有算法进行梳理。主要分为智能优化算法、启发式算法、强化学习算法等，从算法原理、改进思路、性能和精度等方面进行对比分析，归纳出算法的优缺点，并指出GCP的研究方向和算法设计路径，对于相关问题的研究有指导意义。

参考文献 | 相关文章 | 多维度评价

Select

35. 基于改进YOLO v8的行李追踪技术

曹超, 顾幸生

计算机工程与应用 2024, 60 (9): 151-158. DOI: 10.3778/j.issn.1002-8331.2310-0238

摘要（214）

PDF（pc）（6479KB）（315）

在机场行李分拣场景下，传统多目标追踪算法存在目标ID切换率高和目标轨迹误报率高的问题。提出一种基于改进YOLO v8和ByteTrack算法的行李追踪技术。增加了CBAM模块，替换ADH解耦头以及改变训练时的损失函数，增加了检测精度，加强了目标特征的判别性，降低目标的ID切换率。在Byte数据关联中进行了GSI插值后处理，不仅利用了高分框和低分框，也使得长时间遮挡后的追踪效果得到保证，降低了因遮挡产生的ID错误切换。在机场行李分拣数据集上，MOTA和IDF1分别达到了89.9%和90.3%，有了较为明显的提升，能稳定地实现对行李箱ID的追踪。

参考文献 | 相关文章 | 多维度评价

Select

36. 掌静脉识别的深度学习方法综述

谭振林, 刘子良, 黄蔼权, 陈荟慧, 钟勇

计算机工程与应用 2024, 60 (6): 55-67. DOI: 10.3778/j.issn.1002-8331.2306-0168

摘要（212）

PDF（pc）（664KB）（127）

掌静脉识别作为一种新兴的红外生物识别技术，因其高安全性、活体检测性等优势已成为当前生物特征识别领域中的研究热点之一。近年来，该领域的大量研究通过引入深度学习方法推动了掌静脉识别技术的发展。为了掌握掌静脉识别领域最新研究现状及发展方向，对数据采集和数据预处理的主流算法进行了分类和总结，并针对基于深度学习的掌静脉识别的最新进展按照掌脉特征表征、网络设计与优化、轻量级网络进行了分类和详细阐述。针对当前单模态识别达到瓶颈等问题，分析并对比了多模态和多特征融合识别相关算法；探讨了当前掌静脉识别的研究难点挑战，并对未来的发展趋势进行了展望与总结。

参考文献 | 相关文章 | 多维度评价

Select

37. 无人机视角下基于深度学习的多目标跟踪研究进展

杨洋, 宋品德, 钟春来, 曹立佳

计算机工程与应用 2023, 59 (23): 48-62. DOI: 10.3778/j.issn.1002-8331.2307-0355

摘要（212）

PDF（pc）（649KB）（149）

基于无人机平台的多目标跟踪在智慧城市、农业生产、灾害预警与搜救等多个领域有广泛的应用前景。与普通视角下的多目标跟踪相对成熟不同，无人机视角下的多目标跟踪面临一系列尚未完全解决的问题，主要包括目标尺度变化、相似目标干扰、目标被遮挡和重叠以及目标分布不均等。梳理了近年来在普通视角下的经典多目标跟踪算法，并以基于检测的跟踪框架为主，综合分析了无人机视角下多目标跟踪领域的主要技术路线和最新方法。统计了性能评估方法和主流数据集，分析了当前无人机视角下多目标跟踪所面临的主要挑战，并对未来的研究趋势进行展望，旨在为后续相关研究提供参考。

参考文献 | 相关文章 | 多维度评价

Select

38. 深度学习的工人多种不安全行为识别方法综述

苏晨阳, 武文红, 牛恒茂, 石宝, 郝旭, 王嘉敏, 高勒, 汪维泰

计算机工程与应用 2024, 60 (5): 30-46. DOI: 10.3778/j.issn.1002-8331.2307-0168

摘要（211）

PDF（pc）（808KB）（205）

随着深度学习的发展，目标检测和行为识别方法在工人不安全行为识别领域取得了较大进展，对近年来国内外相关研究工作进行系统性归纳，详细阐述了目标检测方法和行为识别方法中的常用模型和效果，重点评述了两类方法在不安全行为识别上的应用和两类方法结合使用的相关研究，对各种方法的优势、局限性、识别行为类别及适用场景进行了全面分析对比。在此基础上，针对近年来目标检测和行为识别的优化措施，总结了常用的优化方向和手段，归纳了在不安全行为识别上成功应用的改进方法，梳理了该研究领域的难点和问题，并给出建议和未来发展趋势展望，为该领域的研究提供参考和借鉴。

参考文献 | 相关文章 | 多维度评价

Select

39. 情感分析中的多传感器数据融合研究综述

金叶磊, 古兰拜尔·吐尔洪, 买日旦·吾守尔

计算机工程与应用 2023, 59 (23): 1-14. DOI: 10.3778/j.issn.1002-8331.2303-0254

摘要（209）

PDF（pc）（862KB）（196）

多传感器数据融合技术下的情感分析技术是人机交互领域的热门研究方向。随着深度学习技术的发展，情感分析技术的研究也从传统的基于单一传感器数据的方法转向了基于多传感器数据融合的方法。从多传感器数据融合以及情感分析技术的定义和发展历程出发，介绍多传感器数据融合技术下的情感分析技术的研究现状和挑战；介绍了多传感器数据融合的经典模型和传统方法。阐述了目前国内外情感分析技术研究的主要方向和研究成果，其中包括基于如语音、视觉、文本和生理信息等数据的情感分析相关研究。介绍了基于多传感器数据融合技术的多模态情感分析方法，通过实验对比多模态情感分析与单模态的情感分类效果，并展望了多传感器数据融合技术下的情感分析技术的发展前景和可能的研究方向，其中包括跨语种情感分析及多模态情感分析技术的进一步应用和发展等。

参考文献 | 相关文章 | 多维度评价

Select

40. 改进YOLOv8的轻量化无人机目标检测算法

胡峻峰, 李柏聪, 朱昊, 黄晓文

计算机工程与应用 2024, 60 (8): 182-191. DOI: 10.3778/j.issn.1002-8331.2310-0063

摘要（200）

PDF（pc）（813KB）（279）

针对无人机目标检测算法计算复杂难以部署，且长尾分布的无人机数据导致检测精度较低的问题，提出了基于改进YOLOv8的轻量化无人机目标检测算法（PC-YOLOv8-n），可均衡网络检测精度与计算量，并对长尾分布数据有一定泛化能力。使用部分卷积层（PConv）替换YOLOv8中的3×3卷积层，对网络进行轻量化处理，解决网络冗余和计算量复杂的问题；融合双通道特征金字塔，增加自上而下的路径，将深层信息与浅层信息进行融合，同层引入轻量化注意力机制，提升网络的特征提取能力；采用均衡焦点损失（EFL）作为类别损失函数，通过均衡尾部类别在网络训练时的梯度权重，增加网络的类别检测能力。实验结果表明，PC-YOLOv8-n在VisDrone2019数据集中具有良好的表现，在mAP50精度上比原始YOLOv8-n算法提高了1.6个百分点，同时模型的参数和计算量分别降低为2.6×106和7.6 GFLOPs，检测速度达到77.2 FPS。

参考文献 | 相关文章 | 多维度评价

摘要点击排行