计算机工程与应用

2024年第24期目次

2024, 60(24): 0-0.

摘要 ( )

PDF (699KB) ( )

相关文章 | 计量指标

因果学习方法和应用概述

龙享福, 李少波, 张仪宗, 杨磊, 李传江

2024, 60(24): 1-19. DOI: 10.3778/j.issn.1002-8331.2405-0407

摘要 ( )

PDF (6887KB) ( )

参考文献 | 相关文章 | 计量指标

机器学习是人工智能和数据科学的核心所在，被广泛应用于教育、交通运输和制造业等领域；随着机器学习的发展及应用领域的延伸，模型在可解释性和公平性等方面显现了一些需要解决的问题。因果学习作为一种将因果关系和机器学习技术相结合的方法，可以增强模型的可解释性，解决公平性等问题，其研究已逐渐成为学术界的热点。因此，在介绍因果学习的相关理论知识的基础上，根据因果学习所能解决的问题对因果解释、因果监督学习、因果公平、因果强化学习等技术进行了全方位的分析概述；从多角度归纳了因果学习在医学、农业和智能制造等领域的应用。最后，总结了因果学习存在的一些开放性问题和挑战，并给出了未来的研究方向，旨在推动因果学习的不断发展。

泛函映射及其在非刚性三维形状对应领域应用综述

王宁, 张丹, 徐辰昊, 宋美华, 张建鹏, 彭泉鸿

2024, 60(24): 20-43. DOI: 10.3778/j.issn.1002-8331.2403-0405

摘要 ( )

PDF (9107KB) ( )

参考文献 | 相关文章 | 计量指标

随着三维形状研究的不断发展，非刚性三维形状对应的问题变得愈加重要，这一问题的应用涵盖了计算机图形学、计算机视觉和模式识别等多个领域。泛函映射框架在非刚性三维形状对应中取得了先进的效果，其能够捕捉形状之间的复杂关系，对非刚性形状的拓扑噪声具有鲁棒性。说明了三维形状对应的基本概念以及其研究方向；阐述了泛函映射的基本框架；在此基础上系统地梳理了相关领域内的经典工作，包括传统泛函映射方法和深度泛函映射方法，突出说明了不同方法在处理非刚性形状对应上的优势和局限性；介绍了非刚性三维形状对应领域常用的数据集，对不同方法进行了实验对比与分析；对非刚性三维形状对应的发展趋势进行了展望。

基于扩散模型的文本图像生成对比研究综述

高欣宇, 杜方, 宋丽娟

2024, 60(24): 44-64. DOI: 10.3778/j.issn.1002-8331.2405-0048

摘要 ( )

PDF (809KB) ( )

参考文献 | 相关文章 | 计量指标

随着深度学习的不断发展，人工智能生成内容成为了一个热门话题，特别是扩散模型作为一种新兴的生成模型，在文本图像生成领域取得了显著进展。全面描述了扩散模型在文本图像生成任务中的应用，并与生成对抗网络和自回归模型的对比分析，揭示了扩散模型的优势和局限性。同时深入探讨了扩散模型在提升图像质量、优化模型效率以及多语言文本图像生成方面的具体方法，通过在CUB、COCO和T2I-CompBench数据集上进行了实验分析，不仅验证了扩散模型零样本生成的能力，还凸显了其根据复杂文本提示生成高质量图像的能力。介绍了扩散模型在文本图像编辑、3D生成、视频及医学图像生成等领域的应用前景。总结了扩散模型在文本图像生成任务上面临的挑战以及未来的发展趋势，有助于研究者更深入地推进这一领域的研究。

基于深度学习的医学实体和关系联合抽取研究综述

叶青, 张晓凤, 彭琳, 程春雷

2024, 60(24): 65-78. DOI: 10.3778/j.issn.1002-8331.2403-0457

摘要 ( )

PDF (5069KB) ( )

参考文献 | 相关文章 | 计量指标

命名实体识别与关系抽取作为医学领域信息抽取的核心任务，能够从非结构化或半结构化的文本中自动识别实体边界、实体类型以及实体之间的关系。不仅能够促进知识的发现与整合，应用于临床决策，加强药物的发现和再利用，还可以助力公共卫生监测和疾病预防。回顾了实体识别和关系抽取的发展历程，介绍了常用评价指标和医学领域实体关系联合抽取数据集，指出目前联合抽取领域存在医学文本结构比较复杂、实体关系重叠句子抽取率低等问题。根据这些问题，进一步探讨了基于深度学习的实体关系联合抽取方法在医学领域上的应用。这些方法根据模型解码的方式主要分为基于共享参数的联合抽取模型和基于联合解码的联合抽取模型，从问题解决角度对不同的模型的优缺点进行探讨分析和总结。讨论了医学领域实体关系抽取面临的挑战和未来的研究方向。

SDN中DDoS攻击检测研究综述

郑承蔚, 王海凤, 刘瑞

2024, 60(24): 79-96. DOI: 10.3778/j.issn.1002-8331.2405-0367

摘要 ( )

PDF (6106KB) ( )

参考文献 | 相关文章 | 计量指标

软件定义网络（SDN）的出现弥补了传统网络的不足并为网络管理带来技术革新。分布式拒绝服务（DDoS）攻击作为网络安全领域的主要威胁之一，严重影响着SDN这一新兴网络架构。随着SDN技术的部署及发展，如何在SDN中检测DDoS攻击成为当前研究领域的热点与难点。为了对相关研究工作进行合理综述，根据所使用的核心技术或理论的不同，将DDoS攻击检测方法划分为基于信息熵、基于机器学习、基于深度学习三大类。介绍SDN体系架构并分析SDN中的DDoS攻击，同时介绍一些常用的公开数据集和评估指标，从四个角度归纳和分析近年来相关研究人员提出的模型或算法，总结了SDN中的DDoS攻击检测研究领域的未来研究方向并进行展望，为该领域的相关研究人员提供研究思路。

混合多策略改进的蜣螂优化算法

娄革伟, 郑永煌, 陈均, 谌廷政, 索相波, 刘旭亮

2024, 60(24): 97-109. DOI: 10.3778/j.issn.1002-8331.2405-0187

摘要 ( )

PDF (6974KB) ( )

参考文献 | 相关文章 | 计量指标

针对原始蜣螂优化算法全局探索能力不足、易陷入局部最优以及收敛精度不理想等问题，提出了一种混合多策略改进的蜣螂优化算法。采用混沌映射结合随机反向学习策略初始化种群提高多样性，扩大解空间搜索范围，增强全局寻优能力；通过黄金正弦策略实现个体动态搜索，提高算法遍历性；引入竞争机制增强信息交互，平衡全局探索与局部开发，加快算法收敛速度；最后在迭代后期利用自适应[t]分布变异对个体进行扰动，避免算法陷入局部最优。在23个基准测试函数中，将该算法与其他优化算法进行对比测试，结果表明，改进后的算法具有更强的寻优性能、更高的收敛精度和更好的稳定性。在具体工程设计实例中的应用验证了该算法在处理实际优化问题上的有效性。

含噪中型量子计算机的量子比特映射算法

黄泓凯, 张雪松

2024, 60(24): 110-118. DOI: 10.3778/j.issn.1002-8331.2404-0196

摘要 ( )

PDF (3606KB) ( )

参考文献 | 相关文章 | 计量指标

由于量子硬件约束，能够实现双量子比特门的物理量子比特对是有限的。大多数量子程序需要插入额外量子门，通过改变逻辑量子比特到物理量子比特的映射关系实现在含噪中型量子计算机上执行。为了提高量子线路初始映射质量，降低算法复杂度及运行时间，提出一种基于交换门的优化双向启发式搜索算法。利用最近邻策略筛选出交换门候选队列，通过改进启发式成本函数评估候选交换门，减少交换门搜索空间和附加门数。结合量子线路结构特性，使用反向遍历方法更新初始映射策略，提高映射质量。该算法还适用于量子比特任意耦合的硬件设备。实验结果表明，与主流的IBM_QX算法、SPBHA算法和SAHA算法相比，该算法分别减少约73%、28%和20%的附加门数，执行时间减少约300%、80%和19%，提高了量子线路映射效率。

面向知识场景的图片类教育资源知识点自动标注算法

王静, 杜旭, 李浩, 胡壮

2024, 60(24): 119-130. DOI: 10.3778/j.issn.1002-8331.2308-0102

摘要 ( )

PDF (5856KB) ( )

参考文献 | 相关文章 | 计量指标

针对图片资源的视觉特征与高级知识语义不一致的挑战，提出一种新的知识点自动标注算法，称为基于知识场景的情境超图卷积网络（SHGCN），以便高效组织管理教育领域中的图片数据，促进知识理解与有效利用，实现教育智能化。该算法在提取图片资源显性视觉特征的同时，又挖掘了隐含在细粒度区域的隐性知识信息。利用Faster R-CNN和OCR技术来识别知识对象和坐标文本等知识实体，这些知识实体特征融合后作为该图片的知识向量；提出双筛选机制来生成不同类型的知识场景，并将知识场景作为超边来构建情境超图，建模蕴含相似情境信息的图片间高阶知识相关性。利用超图卷积实现知识相似图片的情境信息聚合，实现“视觉-语义”到“视觉-语义-知识”的转化。还构建了一个物理学科的图片数据集来训练和验证SHGCN。实验结果表明，SHGCN在提取图片显性视觉信息的基础上，进一步挖掘隐性知识信息，其性能优于基线方法。

属性多路异构网络的哈希表示方法

苏惠敏, 李倩, 郭红钰, 刘玉龙

2024, 60(24): 131-139. DOI: 10.3778/j.issn.1002-8331.2406-0061

摘要 ( )

PDF (4306KB) ( )

参考文献 | 相关文章 | 计量指标

异构网络在诸多领域中得到广泛应用和研究，然而，现有的网络表示方法在处理异构网络时常常遇到挑战。其中之一是未充分利用节点属性信息，导致表示结果缺乏表征力。另一个挑战是网络结构的复杂性，使得现有表示方法往往无法捕捉到网络的重要特征，从而影响了下游任务的效果。属性多路异构网络的哈希表示方法旨在解决上述问题。该方法通过将节点的属性特征和网络结构信息整合到节点表示中，采用深度哈希层来学习节点的紧凑表示，从而获得网络的哈希表示。与传统的表示方法相比，该方法能够更好地保留节点的重要属性特征，并且通过哈希技术将节点表示压缩为固定长度的二进制编码，提高了表示的效率和可扩展性。充分的实验结果表明，属性多路异构网络的哈希表示方法能够在保持表示质量的同时大幅降低表示的维度，从而为后续的下游任务提供了更加高效的网络表示。

结合路径掩蔽和双解码器的图自编码器框架

赵韶辉, 马晓, 王建霞

2024, 60(24): 140-148. DOI: 10.3778/j.issn.1002-8331.2308-0124

摘要 ( )

PDF (4936KB) ( )

参考文献 | 相关文章 | 计量指标

图自编码器作为一种自监督学习方法，在图神经网络领域得到广泛应用。然而，最近的研究表明，现有的图自编码器通常重构整个图结构，容易产生过拟合数据。此外，这些方法过度强调邻居信息而忽略了结构信息，导致在节点分类任务中表现不佳。针对以上问题，提出了基于路径掩蔽和双解码器的图自编码器框架，用于图表示学习。通过路径掩蔽方法扰动输入图，避免产生过拟合数据。将图神经网络作为编码器，在剩余的图结构上进行消息传递，提高了对图数据的学习能力。提出双解码器对掩蔽边重构，既包含了邻居信息又捕获了结构信息。模型在5个公开的图数据集上进行了实验，并与当前具有代表性的图表示学习方法进行了对比。实验结果表明，提出的方法在5个数据集上均取得了相似或更好的效果，并且在链接预测和节点分类任务上优于基线方法。

MBRNet：融合残差连接的多分支手写字符识别网络

李钢, 陈太兵, 杨之博, 范屹, 张玲

2024, 60(24): 149-157. DOI: 10.3778/j.issn.1002-8331.2308-0161

摘要 ( )

PDF (4224KB) ( )

参考文献 | 相关文章 | 计量指标

脱机手写中文字符识别（handwritten Chinese character recognition，HCCR）在计算机视觉领域一直是一个巨大的挑战。相比传统方法，基于深度学习的网络通过训练大量数据在识别任务中取得了差异化的效果，但识别效果依旧处于发展过程中。基于此，结合DW卷积和残差连接设计了一种多分支残差模块，该模块通过DW卷积以较小的内存和参数量为代价来加深网络深度，增强网络的特征提取能力；再通过残差连接抑制网络梯度问题和退化问题；另外，提出了一种多分支权重算法，来改善多分支残差模块中各分支的权重分配问题；并将六个以多分支残差模块为主的结构线性连接，组成HCCR识别网络。该模型在CASIA-HWDB1.0、CASIA-HWDB1.1、ICDAR2013数据集上的识别准确率分别达到了97.77%、97.30%、97.64%，表现出高精度的识别效果。

融合动作退出和软奖励的强化学习知识推理方法

孙崇, 王海荣, 荆博祥, 马赫

2024, 60(24): 158-165. DOI: 10.3778/j.issn.1002-8331.2308-0215

摘要 ( )

PDF (3097KB) ( )

参考文献 | 相关文章 | 计量指标

针对深度强化学习推理方法中存在的过拟合以及稀疏奖励的问题，提出了一种融合动作退出和软奖励的强化学习知识推理方法（knowledge reasoning method of reinforcement learning integrating action withdrawal and soft reward，AS-KRL）。AS-KRL使用门控循环神经网络（GRU）对历史路径信息进行编码，为智能体的动作选择提供当前节点的全局信息；引入动作退出策略随机隐藏部分神经元后再构建策略网络，提高模型路径搜索的成功率，还避免了可能出现的过拟合问题；通过策略网络指导智能体进行动作选择，调用评分函数计算智能体所选三元组的相似度得分，并将所得分数作为智能体的奖励，有效解决稀疏奖励问题。为验证该方法的有效性，在FB15K-237和NELL-995数据集上进行实验，将实验结果与TransE、MINERVA、HRL等9种主流方法进行对比分析，结果表明该方法在链接预测任务上的Hits@k平均提升了0.027，MRR平均提升了0.056。

融合大模型微调与图神经网络的知识图谱问答

陈俊臻, 王淑营, 罗浩然

2024, 60(24): 166-176. DOI: 10.3778/j.issn.1002-8331.2406-0301

摘要 ( )

PDF (4536KB) ( )

参考文献 | 相关文章 | 计量指标

传统知识图谱问答系统在处理自然语言问句时，常因语义解析不精确而导致错误。为解决这一问题，提出一种融合大模型微调和图神经网络的知识图谱问答方法。收集问题并定义问题的逻辑形式；利用大型预训练语言模型的强大语义解析能力，通过对问题及其对应逻辑形式构成的问答对进行微调，提升问题解析的精度；采用模糊集方法增强微调后的逻辑形式，提高其检索精度；利用图神经网络对这些逻辑形式进行关系投影和逻辑运算获取最终答案。在通用领域标准数据集WebQSP和ComplexWebQuestions上的实验验证表明，该方法在F1、Hit@1和ACC这三个指标上均优于基准模型。同时，方法也在垂直领域风电装备数据集、高速列车数据集上进行了应用和验证。

LOL-YOLO：融合多注意力机制的低照度目标检测

蒋畅江, 何旭颖, 向杰

2024, 60(24): 177-187. DOI: 10.3778/j.issn.1002-8331.2406-0424

摘要 ( )

PDF (7039KB) ( )

参考文献 | 相关文章 | 计量指标

针对低照度图像中目标检测面临的夜间模糊场景、边界不明显场景、明暗差异较大场景等挑战，提出了一种动态特征融合的的检测方法LOL-YOLO（low-light YOLO）。引入了自校正照明模块改善低光照图片的质量，应对低照度下的目标不明显问题；提出了动态特征提取模块，采用结合了大卷积核和可变形卷积的注意力机制，广泛灵活的捕捉图像的上下文信息；设计动态检测头增强对不同尺度、空间位置和任务的感知能力，进一步提升目标检测的精度和鲁棒性。采用ExDark、DarkFace、NPD（nighttime pedestrian detection）数据集进行实验验证，实验结果表明，提出的方法与主流算法相比检测精度明显提升，充分验证了该方法的有效性。

边界感知SegFormer网络的阵列目标图像分割方法

吕扬, 吴静静, 庄祉珊, 安聪颖

2024, 60(24): 188-199. DOI: 10.3778/j.issn.1002-8331.2308-0091

摘要 ( )

PDF (8873KB) ( )

参考文献 | 相关文章 | 计量指标

针对工业场景下阵列目标图像存在非均匀背景、缺陷干扰和弱边缘导致目标分割精度低的问题，提出边界感知SegFormer网络的阵列目标图像分割方法。针对固定种子易受背景和缺陷干扰的问题，提出自适应种子搜索策略。该策略利用种子位置与目标定位精度的相关性构建种子分布热力图，并在热力图的引导下自适应搜索理想种子目标，实现阵列目标的高精度全局分割。设计边界感知SegFormer网络进行局部分割，利用递归门控卷积强调特征的长距离和高阶空间交互，改进的门控残差边界细化模块能够学习更丰富的边缘信息，同时引入混合损失函数加强对区域内部和边缘像素的监督，引导网络更好地学习目标边缘特征，提高边界分割精度。在自建晶粒数据集和语义分割数据集Cityscapes上的验证实验表明，提出的分割方法能在背景不均、缺陷污染、边缘对比度低的高分辨率阵列目标图像中完整精确地分割目标，并具有较高的实时性。

基于YOLOv8n的航拍图像小目标检测算法

齐向明, 严萍萍, 姜亮

2024, 60(24): 200-210. DOI: 10.3778/j.issn.1002-8331.2405-0019

摘要 ( )

PDF (5703KB) ( )

参考文献 | 相关文章 | 计量指标

针对航拍图像小目标检测中存在目标密集和相互遮挡问题，提出一种基于YOLOv8n的航拍图像小目标检测算法。在主干网络末段，置换C2f中Bottleneck为改进后的FasterNet，保持通道数并提升收敛速度；替换SPPF中 CBS激活函数SiLU为ReLU使输入负值置零，在CBS后引入SE注意力机制扩张感受野，保留更多小目标特征。输出端检测头前嵌入高效多尺度注意力机制EMA获取更多细节信息，进一步提高小目标关注度。将基线网络损失函数CIoU替换成Wise IoU，提供增益分配策略，专注普通质量锚框，提高网络泛化能力。在数据集VisDrone2021和RSOD上做消融实验和对比实验，相较于基线算法，mAP@0.5分别提升5.1和7.2个百分点，mAP@0.5：0.95分别提升4.4和2.1个百分点，表明检测精度指标显著提升；在公开数据集VOC2007+2012上做泛化实验，mAP@0.5提升3.8个百分点，表明具有良好的鲁棒性。

YOLOv8-FD：YOLOv8改进的钢板表面缺陷检测方法

马磊, 李晔, 王宇翔

2024, 60(24): 211-221. DOI: 10.3778/j.issn.1002-8331.2406-0223

摘要 ( )

PDF (6876KB) ( )

参考文献 | 相关文章 | 计量指标

钢材表面缺陷检测是缺陷检测领域中的一个重要挑战，当前仍存在漏检误检严重情况，其检测准确度直接关系到产品质量，甚至可能危及生命安全。同时，将这项技术应用到实际生产中需要考虑资源节约和成本降低。为了解决这些问题，引入了一种基于轻量化检测模型YOLOv8-FD的方法。该算法采用了三大策略：（1）在C2f中增加特征提取模块，以更好地理解和利用输入图像信息，并引入DCN以增强特征提取能力，提升目标检测性能；（2）提出了DUFPN来更有效地融合上下文特征，大幅减少参数量和计算量，实现网络的轻量化；（3）引入W-CIOU（Weight-CIOU）作为边界框损失函数，更好地衡量目标之间的相似性，加速收敛，提高目标检测精度。实验结果显示，与基线相比，该模型的mAP提高了5个百分点，R提高了3.3个百分点，参数量减少了27%，计算量减少了35%。此外，通过在APSPC和VOC2007数据集上的验证，证实该算法具有良好的鲁棒性。

改进YOLOv8的学生课堂行为识别算法：DMS-YOLOv8

陈晨, 保文星, 陈旭, 景永俊, 李卫军

2024, 60(24): 222-234. DOI: 10.3778/j.issn.1002-8331.2407-0132

摘要 ( )

PDF (989KB) ( )

参考文献 | 相关文章 | 计量指标

针对智慧教室中存在前后排学生图像尺寸差异较大、后排小目标检测困难的问题，提出了一种改进YOLOv8的学生课堂行为识别方法：DMS-YOLOv8。结合CA注意力机制与深度卷积，提出了动态通道注意力卷积（DCAConv），能够动态调整通道权重，更灵敏地捕获关键特征；引入多尺度卷积注意力（MSCA），通过元素乘法最大化挖掘多尺度卷积特征，增强对空间细节的关注；同时，构建了多尺度上下文融合（LCD）模块，通过卷积和自注意力机制，增强多尺度特征融合。增加小目标检测层，通过较大尺寸特征图的局部特征提取，显著提高模型对后排学生行为的识别能力。与基线模型YOLOv8n相比，该方法在自制学生行为数据集上的mAP50值提高了4.6个百分点，在VOC数据集上提高了18.7个百分点。该方法在学生课堂行为识别方面表现突出，可显著提高智慧教室学生课堂行为识别的准确率。

基于多级特征提取的低光照目标检测算法

谭豪, 张惊雷, 贾鑫

2024, 60(24): 235-242. DOI: 10.3778/j.issn.1002-8331.2308-0093

摘要 ( )

PDF (3952KB) ( )

参考文献 | 相关文章 | 计量指标

自然环境下普遍存在着低光照场景，导致目标检测任务精度降低。提出了一种低光照目标检测算法MLFE-YOLOX。引入轻量级图像增强算法IAT，还原低照度图像更多的细节。设计了一种多级特征提取的CSP-M模块，加强模型在低光照条件下图像的特征提取能力。引入卷积注意力机制CBAM，自适应测量目标位置与背景信息的相关程度，降低背景信息带来的干扰。设计了多级特征融合模块CSP-MC，增强模型融合多级特征和发掘并融合静态和动态上下文信息的能力。采用ExDark、UFDD数据集进行实验验证，实验结果表明，该方法有效克服了光照不足带来的影响，与主流算法相比检测精度明显提升。

改进的自适应学习注意力网络的水下图像增强

许袁, 李锋, 闫家祥

2024, 60(24): 243-249. DOI: 10.3778/j.issn.1002-8331.2308-0173

摘要 ( )

PDF (4222KB) ( )

参考文献 | 相关文章 | 计量指标

针对水下图像噪声大、色偏严重和细节模糊等问题，提出了一种基于监督学习的自适应学习注意力网络的水下图像增强算法。利用多尺度融合加强通道之间空间信息的联系；通过并行注意力机制平衡照明特征和颜色信息；采用自适应学习保留浅层信息，学习重要特征信息；构造多项损耗函数，改善网络性能。实验结果表明，相对于已有算法，该算法的峰值信噪比（peak signal-to-noise ratio，PSNR）指标提高了8.99%，结构相似性（structural similarity index，SSIM）指标提高了15.39%，水下彩色图像评价（underwater color image quality evaluation，UCIQE）指标提高了1.92%，具有更好的视觉效果。

融合坐标注意力与混联采样的烟叶主脉轻量级语义分割

苏帅林, 甘博敏, 龙杰, 刘宇晨, 盖小雷, 张冀武

2024, 60(24): 250-259. DOI: 10.3778/j.issn.1002-8331.2308-0228

摘要 ( )

PDF (5851KB) ( )

参考文献 | 相关文章 | 计量指标

针对目前烟叶主脉的分析过程自动化低，难以应对复杂烟叶主脉提取与识别的问题，提出一种基于坐标注意力（coordinate attention，CA）与混合联接空洞空间金字塔池化（mixed-connections atrous spatial pyramid pooling，MASPP）的烟叶主脉轻量级语义分割方法。该算法以DeepLabV3+网络模型为框架，采用轻量级MobileNetV2替换原始框架中的Xception网络，以“扩充-提取-压缩”方式进行主干特征提取，减少网络模型参数量；引入坐标注意力机制加强对烟叶主脉细微特征的学习能力，改善分割主脉时与主脉真实分布相比较所存在的区域错分情况；采用“混联密接采样”的MASPP结构替代原始网络模型中的空洞空间卷积池化金字塔，改善烟叶主脉分割存在的断续分割情况。实验结果表明，与原始的DeepLabV3+语义分割算法相比较，训练时间从635?min缩减为311?min，平均交互比（mIOU）达到80.66%，平均像素精度（mPA）达到91.96%，网络模型参数量压缩85.32%，储存空间降为30.63?MB。在保证分割精度的同时减少模型训练时间，为烟叶主脉分割提供了新的思路和方法。

DB-YOLO：特征增强融合的双骨干YOLOv8道路缺陷检测模型

叶发茂, 张立, 袁燎, 李大军

2024, 60(24): 260-269. DOI: 10.3778/j.issn.1002-8331.2404-0019

摘要 ( )

PDF (4906KB) ( )

参考文献 | 相关文章 | 计量指标

虽然已经提出了许多基于深度学习的道路缺陷检测方法，但这些方法通常忽略了一些道路缺陷检测任务中非常重要的道路缺陷相关的边缘特征信息。为了充分利用这些边缘特征信息，提出了一种改进的双骨干YOLOv8模型（dual backbone YOLOv8 model，DB-YOLO）用于道路缺陷检测。设计了边缘特征提取模块（edge feature extraction model，EFEM）用于过滤图像低频信息，提取图像高频边缘信息。设计了双骨干网络来提取特征，在原模型基础上增加一个边缘特征骨干网络（edge feature backbone，EFB），对EFEM提取的图像高频边缘信息进行处理，提取边缘特征，为道路缺陷检测提供更丰富的特征。提出了一种新的特征增强融合模块（feature enhancement fusion module，FEFM）用于融合各种特征，并采用多个FEFM模块将边缘特征、不同级别的图像特征进行有机融合。引入Label smoothing策略减弱了数据集中标签质量的影响，增强了模型的泛化能力，进一步提升模型的检测精度。实验结果表明，在GRDDC2020数据集上，DB-YOLO_v8s的mAP和F1分别取得56.42%、56.13%，较YOLO_v8s分别提升了1.3和1.96个百分点，检测速度达到了64.94帧/s，满足实时检测要求。此外，DB-YOLO_v8s在官方测试集Test_1和Test_2上的F1分数分别为58.79%和58.52%，与其他方法相比，在两个测试数据集中F1分别高了0.65和1.37个百分点。因此，提出的模型可以提升道路缺陷检测精度。

针对Tor暗网流量的MorViT指纹识别模型

朱懿, 蔡满春, 姚利峰, 张溢文, 陈咏豪

2024, 60(24): 270-281. DOI: 10.3778/j.issn.1002-8331.2308-0104

摘要 ( )

PDF (6123KB) ( )

参考文献 | 相关文章 | 计量指标

网络攻击日趋频繁，为保护用户隐私，匿名通信系统不断涌现。但这也被不法分子利用，进行各类违法活动而形成暗网。监测和识别暗网流量对维护网络安全具有重要意义。针对上述问题，提出了用于Tor暗网流量的MorViT指纹识别模型。该模型将流量数据转换为图像以便于可视化和模型输入，并融合一维倒残差结构、二维倒残差结构和MobileViT模块，用以同时提取流量局部特征以及整体流量的全局特征和长距离依赖关系。为弥补Transformer在小数据集上的不足，引入可学习的温度系数和对角掩码增强局部归纳能力。实验结果表明，MorViT模型在封闭世界和开放世界场景下的分类准确率、召回率、AUC等指标上均优于既有模型，能够有效完成Tor暗网流量指纹识别任务。

推荐信誉模型与聚类分析协同优化的拜占庭算法

李合计, 王传华, 徐欣

2024, 60(24): 282-290. DOI: 10.3778/j.issn.1002-8331.2310-0150

摘要 ( )

PDF (3506KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统PBFT（practical Byzantine fault tolerance）共识算法主节点随机选择、通信复杂度和共识时延高等问题，提出了一种基于推荐信誉模型和聚类分析的改进拜占庭容错算法。根据推荐信誉模型，利用节点之间的交易行为计算出节点的全局信任值。在此基础上，利用全局信任值将节点划分为共识节点，非共识节点以及主组节点，并使全局信任值最高的节点成为主节点，可以大大降低恶意节点成为主节点的概率，从而提高了系统的效率。在每一轮共识结束后，对共识节点根据其特征进行聚类划分，进一步更新节点的全局信任值。通过仿真实验分析得出，改进后的TK-PBFT算法的共识时延降低了25%，通信开销成本减少超过50%，且具有更高的吞吐量。

聚焦形状特征的路面病害检测算法

邓天民, 陈月田, 余洋, 谢鹏飞, 李庆营

2024, 60(24): 291-305. DOI: 10.3778/j.issn.1002-8331.2404-0259

摘要 ( )

PDF (7064KB) ( )

参考文献 | 相关文章 | 计量指标

路面病害自动化检测是实现道路智慧化管养的关键技术之一，针对路面病害图像中病害目标占比小、不同类型病害尺度差异大、背景环境复杂等特性，基于YOLOv8架构，提出聚焦形状特征的路面病害检测算法FSF-YOLO（focusing on shape features YOLO）。构建一种无信息丢失的加强特征提取模块，通过保留多维度空间特征信息，增强骨干网络对低分辨率图像和细小病害目标的特征提取能力；引入可形变注意力特征融合模块，利用病害细长形状特征拓展目标识别区域，提高模型对于长距离病害目标的特征表达能力；运用分组卷积空间金字塔池化模块，强化不同尺寸病害目标特征识别；采用轻量级共享卷积检测头，减少网络参数量和计算量。实验结果表明，提出的方法对不同类别的路面病害目标均获得了较好的效果，在RDD2022数据集上的平均精度达到67.3%，与原算法相比提升了5.3个百分点，整体性能优于其他路面病害检测算法。

改进U-Net的路面裂缝检测方法

张明星, 徐健, 刘秀平, 张勇进, 张闯, 宁小鸽

2024, 60(24): 306-313. DOI: 10.3778/j.issn.1002-8331.2307-0358

摘要 ( )

PDF (5175KB) ( )

参考文献 | 相关文章 | 计量指标

针对基础U-Net对路面裂缝分割效果不强，裂缝轮廓分割精细度不够、难以识别狭窄裂缝、分割精度低等问题，提出一种改进U-Net的路面裂缝分割方法。使用改进的ResNet50作为主干网络提取路面裂缝特征，设计了基于注意力机制的特征融合模块改进U-Net的跳跃连接，在解码部分添加特征细化头得到改进的模型。使用自建的路面裂缝数据集对提出的模型与目前先进模型进行比较，并对优化前后的模型做消融实验。实验结果表明，该模型在自建的路面裂缝数据集上的mIoU、Precision、mPA分别达到0.838 1、0.892 8、0.916 9，相比于基线U-Net分别提高0.019、0.016 8、0.023 2，推理速度为40.02?FPS能够满足工程应用的需求。在开源的Crack500数据集中验证了该模型相比于U-Net、DeepLabV3+等网络模型具有更强的性能和泛化能力。

目标检测下的车型对交通流速度影响研究

徐慧智, 常梦莹, 陈祎楠, 郝东升

2024, 60(24): 314-321. DOI: 10.3778/j.issn.1002-8331.2307-0389

摘要 ( )

PDF (3624KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统目标检测跟踪算法识别精度低，实时性差等缺点，提出了一种基于YOLOv5s和DeepSort算法模型的视频车辆实时车流量和速度检测方法。构建了包含25?877个目标样本的数据集，采用YOLOv5s算法模型实现视频车辆的检测，利用DeepSort算法对车辆进行跟踪计数与测速，实现了路段监控对车辆的实时检测。基于深度学习获取的速度与交通量数据，构建了不同车型对交通流速度影响模型，探究畅通状态、稳定状态、拥挤状态下车型的速度与交通量之间的关系，结果表明：算法模型对视频车辆的检测效果良好，平均准确度达到91.4%；不同状态下，车型对交通量速度的影响程度不同；畅通状态和稳定状态下，出租车的速度对交通量影响较大；拥挤状态下，私家车的车速受交通量影响较大。

动态异质网络表征学习的车险理赔反欺诈识别研究

潘怡君, 梁变, 张泷, 那崇宁

2024, 60(24): 322-330. DOI: 10.3778/j.issn.1002-8331.2308-0078

摘要 ( )

PDF (4414KB) ( )

参考文献 | 相关文章 | 计量指标

针对车险理赔数据呈现多源异构形态及历史数据量较大的问题，提出一种基于动态异质网络表征学习的车险理赔反欺诈识别方法。利用图结构将车险理赔案件中不同结构多种属性的节点统一表示成向量形式，再利用传统的机器学习方法实现欺诈识别。根据车险理赔案件的欺诈类型，设计五条相应的随机游走规则，从多个角度描述车险欺诈事件；提出一种动态异质网络节点选择方法，辨识与新采集车险案件相关的节点，并计算历史案件中出现频次较高的节点，在新的时间戳动态更新这部分节点的随机游走路径及节点的向量表示。利用真实的车险理赔数据验证所提出算法的有效性，分别从欺诈的识别率、误报率、准确率、模型运行时间、节点选择数量以及模型窗口大小方面实现。

融合选择核注意力的无纺布缺陷检测

陆芸婷, 康绍鹏, 吴双, 何川

2024, 60(24): 331-339. DOI: 10.3778/j.issn.1002-8331.2308-0182

摘要 ( )

PDF (4687KB) ( )

参考文献 | 相关文章 | 计量指标

针对无纺布缺陷检测算法实时性差，检测准确率低的问题，设计了一种基于改进YOLOv5的无纺布缺陷检测算法N-YOLO。该算法结合产线实际情况和产品特性运用视觉检测技术，在YOLOv5算法的基础上引入FasterNet网络作为主干特征提取网络进行轻量化改进，利用部分卷积进行特征提取减少模型计算量。同时在C3模块中增加SK注意力机制提高模型检测精度，并采用WIoUv1损失函数计算边界框回归损失，提高边界框定位精度。实验结果表明N-YOLO算法与YOLOv5s相比浮点计算量减少85.4%，参数量由7?020?913减少到3?368?105，减少了52%，模型大小为6.63?MB，平均检测精度能达到99.2%，召回率达到99.2%，与Faster R-CNN和SSD等目标检测算法相比具有明显优势，无需昂贵的硬件设备即可在高速生产情况下对无纺布缺陷进行实时检测。

改进YOLOv7的无明火森林烟雾检测算法

王灏文, 朴燕, 王鈅, 姜品依

2024, 60(24): 340-350. DOI: 10.3778/j.issn.1002-8331.2308-0349

摘要 ( )

PDF (6010KB) ( )

参考文献 | 相关文章 | 计量指标

快速准确判断森林火情对森林防火有着重要意义。然而，现有的森林烟雾检测模型提取的烟雾特征较为单一。因此，现有模型在图像中只有烟雾未见明火时的火情检测任务中表现并不理想。针对该问题，提出一种基于改进YOLOv7的无明火森林烟雾检测算法。该算法在主干网络中引入注意力机制CA和全卷积掩码自编码器框架FCMAE，使模型在提取语义特征的同时可以获取更为丰富的局部信息，解决了现有模型存在的特征崩溃问题。同时在预测网络中引入集中式特征金字塔CFP以加强特征的层内调节能力。另外，模型使用动态非单调调频的损失函数Wise-IoU以加强对低质量烟雾样本的检测能力。实验结果表明，相较于其他模型，该模型在检测无明火烟雾时表现上佳，精确率达到98.1%且mAP@50%达到99.1%。

当期目录