当期目录

    2024年 第60卷 第8期 刊出日期:2024-04-15
    全选:
    目次
    2024年第8期目次
    2024, 60(8):  0-0. 
    摘要 ( )   PDF (748KB) ( )  
    相关文章 | 计量指标
    热点与综述
    基于深度元学习的小样本图像分类研究综述
    周伯俊, 陈峙宇
    2024, 60(8):  1-15.  DOI: 10.3778/j.issn.1002-8331.2308-0271
    摘要 ( )   PDF (1091KB) ( )  
    参考文献 | 相关文章 | 计量指标
    深度元学习是解决小样本分类问题的流行范式。对近年来基于深度元学习的小样本图像分类算法进行了详细综述。从问题的描述出发对基于深度元学习的小样本图像分类算法进行概括,并介绍了常用小样本图像分类数据集及评价准则;分别从基于模型的深度元学习方法、基于优化的深度元学习方法以及基于度量的深度元学习方法三个方面对其中的典型模型以及最新研究进展进行详细阐述。最后,给出了现有算法在常用公开数据集上的性能表现,总结了该课题中的研究热点,并讨论了未来的研究方向。
    深度学习在糖尿病视网膜病变分类领域的研究进展
    孙石磊, 李明, 刘静, 马金刚, 陈天真
    2024, 60(8):  16-30.  DOI: 10.3778/j.issn.1002-8331.2307-0330
    摘要 ( )   PDF (655KB) ( )  
    参考文献 | 相关文章 | 计量指标
    糖尿病视网膜病变是导致糖尿病患者视力受损的主要原因之一,早期的分类诊断对于病情的治疗与控制具有重要意义。深度学习方法能够自动提取视网膜病变的特征并进行分类,因此成为糖尿病视网膜病变分类的重要工具。介绍常用的糖尿病视网膜病变数据集及评价指标,总结了深度学习在糖尿病视网膜病变二分类中的应用;综述了不同的经典深度学习模型在糖尿病视网膜病变严重程度分类中的应用,重点阐述卷积神经网络的分类诊断方法,并对不同方法进行综合对比分析;最后讨论该领域面临的挑战,并对未来发展方向进行了展望。
    时空图神经网络在交通流预测研究中的构建与应用综述
    汪维泰, 王晓强, 李雷孝, 陶乙豪, 林浩
    2024, 60(8):  31-45.  DOI: 10.3778/j.issn.1002-8331.2307-0133
    摘要 ( )   PDF (827KB) ( )  
    参考文献 | 相关文章 | 计量指标
    交通流量预测是城市交通管理和规划中的关键问题,而传统预测方法在面对数据稀疏性、非线性关系和复杂动态性等挑战时表现不佳。图神经网络是一种基于非欧结构数据的深度学习方法,近年来在各种复杂网络建模和预测任务中得到广泛应用。为了应用于交通流量预测领域,提出了时空图神经网络,其能够捕捉空间和时间相关性,相较之前的预测模型有显著进步。对近年来使用时空图神经网络进行交通流量预测的模型进行分析,概述和比较了多种邻接阵的构造方式,然后从空间相关性和时间相关性的角度列举了构建交通流预测模型的常用组件,并对不同的时空融合方式进行了分类和对比;在应用方面,根据时间尺度的不同将时空图神经网络模型分为长期预测、短期预测与兼顾长短期的预测三类,分析了各自的目标与要求,并列举比较了近年来较为突出的新模型。最后,讨论了现有研究的局限性,对相关模型的未来研究做出展望。
    基于深度学习的图像中无人机与飞鸟检测研究综述
    谢威宇, 张强
    2024, 60(8):  46-55.  DOI: 10.3778/j.issn.1002-8331.2305-0372
    摘要 ( )   PDF (613KB) ( )  
    参考文献 | 相关文章 | 计量指标
    随着民用无人机产业的发展,无人机已经成为一项影响公共安全的重要问题。目前针对低空无人机的监视手段主要是采用雷达探测结合图像识别的方法,然而在图像检测识别中易受到与无人机同属“低、慢、小”目标的飞鸟的干扰。为了能够在基于可见光图像的无人机检测中排除飞鸟目标的干扰,利用深度神经网络对可见光图像中无人机与飞鸟进行精确的检测与分类,有效地排除飞鸟对无人机检测的干扰。系统阐释了目标检测技术的发展历程,讨论了各类基于深度学习网络目标检测算法的差异,对比了各类算法的优缺点。对可用于无人机与飞鸟检测的图像数据集进行了梳理与介绍,对相关研究的已有成果进行分析;再从实际应用出发,对无人机与飞鸟检测当中可能会存在的问题进行梳理,阐述与分析了能解决相应检测问题的卷积神经网络的相关研究。最后,针对该研究后续可能的发展方向进行展望。
    监督式主题模型及其应用综述
    王振彪, 徐贞顺, 刘纳, 张文豪, 唐增金, 王正安
    2024, 60(8):  56-68.  DOI: 10.3778/j.issn.1002-8331.2309-0030
    摘要 ( )   PDF (856KB) ( )  
    参考文献 | 相关文章 | 计量指标
    主题模型是一种数据挖掘的方法,可以自动地从大量文件或数据中提取潜在的模式或主题,并将对应的数据分配到相应的模式或主题中。主题模型已广泛应用于文本聚类或分类、主题抽取、主题演变、情感分析和摘要总结等领域。监督式主题模型和非监督主题模型的区别在于是否依赖标注信息。近年来,监督式主题模型在数据挖掘任务中逐渐兴起,使得越来越多的任务倾向于采用监督式方法进行优化。陈述了监督式主题模型相关内容,介绍常用的数据集和评价指标;分别从模型和应用的角度对各种类型的监督式主题模型进行了深入对比分析。最后,阐述了主题模型当前研究所面临的挑战,并对未来监督式主题模型的研究方向进行展望。
    理论与研发
    随机多属性子空间的ReliefF加权邻域粗糙集与属性约简
    王莉
    2024, 60(8):  69-77.  DOI: 10.3778/j.issn.1002-8331.2307-0232
    摘要 ( )   PDF (572KB) ( )  
    参考文献 | 相关文章 | 计量指标
    属性约简是一种重要的数据降维预处理方法,然而现有的属性约简方法大多没有考虑信息系统中属性权重的信息。ReliefF算法是一种实现简单且运算效率高的属性权重评估方法,提出一种随机多属性子空间的ReliefF加权邻域粗糙集和属性约简算法。该方法生成了多组具有相同大小随机子空间的属性集划分,并对每组划分的随机子空间利用ReliefF算法计算得到属性的局部权重,将所有组得到的属性局部权重求取平均值,得到了信息系统每个属性最终的全局权重;基于属性权重的结果,提出一种新的加权邻域粗糙集模型,并证明了相关理论和性质;在该模型的基础上通过加权邻域依赖度提出一种信息系统的属性约简算法。在公开数据集上的属性约简实验结果表明,所提出的属性约简算法比已有的同类型算法整体上具有更优的约简性能。
    混合驱动的粒子群算法
    陈峰, 丁泉, 吴乐, 刘爱萍, 陈勋, 张云飞
    2024, 60(8):  78-89.  DOI: 10.3778/j.issn.1002-8331.2307-0368
    摘要 ( )   PDF (656KB) ( )  
    参考文献 | 相关文章 | 计量指标
    粒子群优化(particle swarm optimization,PSO)算法是一种在机器人运动规划、信号处理等领域有广泛应用的优化算法。然而该算法易陷入局部最优解,从而导致早熟问题。出现早熟问题的原因之一是粒子群仅依靠适应度值选择学习范例。为了克服上述问题,提出了一种基于适应度值、改进率和新颖性混合驱动的PSO算法(particle swarm optimization algorithm based on hybrid driven by fitness values,improvement rate,and novelty,FINPSO)。在该算法中,引入的新指标和遗传算法会平衡种群的探索与开发,降低粒子群早熟的可能性。适应度值、改进率和新颖性会作为粒子的评价指标。各指标独立地选择学习范例并保存到不同的档案中。粒子每一次速度更新都要确定各个指标的权重,并从每个档案中选择一个范例学习。该算法采用了遗传算法进行粒子间的信息交流。遗传算法中的交叉互换和突变会给种群带来更多的随机性,提升种群的全局搜索能力。以八个PSO算法变体作为对比算法,两个CEC测试套件作为基准函数进行实验。实验结果表明,FINPSO算法优于已有的PSO算法变体达到最先进水平。
    模式识别与人工智能
    基元库构建思想的机器人动作与策略演示学习方法
    李铁军, 刘家奇, 刘今越, 贾晓辉
    2024, 60(8):  90-98.  DOI: 10.3778/j.issn.1002-8331.2211-0261
    摘要 ( )   PDF (1099KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为解决机器人演示学习过程中演示数据优化、动作与任务策略的存储调用问题,提出一种利用基元库思想的演示学习方法。动作学习采用专家拖动机械臂执行动作获取演示数据,利用高斯混合模型与高斯混合回归提升数据质量,由动态运动基元算法转换为基函数的权重值。策略学习将任务步骤创建为动作基元,向基元内添加得到的权重值并构建包含任务执行策略的基元名片,由基元组成基元库完成存储。执行任务时从基元库中有序调用基元,利用YOLOv5目标检测网络和AlexNet图像分类网络检测目标信息,匹配动作并泛化出具有原动作特征的新动作。该方法实现了从演示中学习动作与策略存储,根据实际目标组合合适动作完成任务。钢筋绑扎实验创建5个动作基元,通过专家演示学习10个动作,机器人利用动作基元库成功完成水平面与竖直面钢筋交叉点绑扎任务说明其有效性。
    E-TUP:融合E-CP与TUP的联合知识图谱学习推荐方法
    赵博, 王宇嘉, 倪骥
    2024, 60(8):  99-109.  DOI: 10.3778/j.issn.1002-8331.2211-0464
    摘要 ( )   PDF (635KB) ( )  
    参考文献 | 相关文章 | 计量指标
    目前,大部分将知识图谱引入推荐系统的方法只是将已知的表层知识图谱实体进行引入,没有对图谱的内在关系进行预测和挖掘,因此无法利用知识图谱中的隐藏关系。针对上述问题,提出联合学习推荐模型E-TUP(enhance towards understanding of user preference),使用E-CP(enhance canonical polyadic)进行知识图谱补全并将完整信息进行传递。利用储存空间负采样方法,将优质负例三元组进行存储,并随训练过程进行更新,以提高知识图谱补全中负例三元组的质量。链接预测实验结果显示,储存空间方法使E-TUP模型链接预测准确率对比现有模型最高提升10.3%。在MovieLens-1m和DBbook2014数据集上进行推荐实验,在多个评价指标上取得最佳结果,对比现有模型实现最高5.5%的提升,表明E-TUP可以有效利用知识图谱中的隐藏关系提高模型推荐准确率。基于汽车维修数据进行推荐实验,结果表明E-TUP可以有效推荐相关知识。
    改进Deeplabv3+的双注意力融合作物分类方法
    郭金, 宋廷强, 孙媛媛, 巩传江, 刘亚林, 马兴录, 范海生
    2024, 60(8):  110-120.  DOI: 10.3778/j.issn.1002-8331.2211-0468
    摘要 ( )   PDF (850KB) ( )  
    参考文献 | 相关文章 | 计量指标
    近年来,卷积神经网络(convolutional neural networks,CNN)在农作物分类研究中不断取得新进展,但在建模长期依赖关系方面表现出一定的局限性,对农作物全局特征的捕获存在不足。针对以上问题,将Transformer引入Deeplab v3+模型,提出了一种用于无人机影像农作物分类的并行分支结构——DeepTrans(Deeplab v3+with Transformer)模型。DeepTrans以一种并行的方式将Transformer和CNN结合在一起,利于全局特征与局部特征的有效捕获。通过引入Transformer来增强图像中信息的远距离依赖关系,提高了作物全局信息的提取能力;加入通道注意力机制和空间注意力机制加强Transformer对通道信息的敏感度及ASPP(atrous spatial pyramid pooling)对作物空间信息捕获能力。实验结果表明,DeepTrans模型在MIoU指标上可达0.812,相较于Deeplab v3+模型提高了3.9%,该模型在五类作物的分类中精度均有提升,对于容易错分的甘蔗、玉米和香蕉三种作物,其IoU分别提高了2.9%、4.7%、13%。由此可见,DeepTrans模型在农作物分类图像的内部填充和全局预测方面有着更好的分割效果,有助于更准确地监测农田作物的种植结构及规模。
    融合Lasso的近似马尔科夫毯特征选择方法
    刘明, 杜建强, 李郅琴, 罗计根, 聂斌, 张梦婷
    2024, 60(8):  121-130.  DOI: 10.3778/j.issn.1002-8331.2212-0094
    摘要 ( )   PDF (597KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在特征选择问题中,近似马尔科夫毯常用于判断冗余特征,但所得到的冗余特征并不完全相同,因此,在直接使用近似马尔科夫毯删除冗余特征时,存在可能导致信息丢失的情况,影响模型精度。为此,提出一种用于中药代谢组学高维小样本数据的融合Lasso的近似马尔科夫毯特征选择方法。方法分为两个阶段,第一阶段,通过最大信息系数对特征的相关度分析过滤无关特征;第二阶段,采用近似马尔科夫毯构建相似特征组,使用Lasso评估相似特征组中特征影响力,迭代去除冗余特征。通过实验对比表明,该算法可以在一定程度上减少有用信息丢失,去除无关特征和冗余特征,提高模型精度和稳定性。
    结合数据增强的跨模态行人重识别轻量网络
    曹钢钢, 王帮海, 宋雨
    2024, 60(8):  131-139.  DOI: 10.3778/j.issn.1002-8331.2212-0100
    摘要 ( )   PDF (714KB) ( )  
    参考文献 | 相关文章 | 计量指标
    现有的跨模态行人重识别方法中,轻量化网络的相关研究较少。考虑到硬件部署对轻量化网络的需求,提出新的跨模态行人重识别轻量网络。以Osnet为基础,进行特征提取器和特征嵌入器的拆分。同时使用数据增强操作,利用有限的数据集,最大程度提高了网络的鲁棒性。改进难样本三元组损失函数,在减少计算量的同时缩小模态间差异,提升网络识别准确率。提出的轻量化网络结构简单且效果显著,在SYSU-MM01数据集的全搜索模式下rank-1/mAP分别达到65.56%、61.36%,参数量仅为1.92×106。
    尺度不变的条件数约束的模型鲁棒性增强算法
    徐杨宇, 高宝元, 郭杰龙, 邵东恒, 魏宪
    2024, 60(8):  140-147.  DOI: 10.3778/j.issn.1002-8331.2212-0114
    摘要 ( )   PDF (605KB) ( )  
    参考文献 | 相关文章 | 计量指标
    深度神经网络容易受到对抗样本的攻击,这一直威胁着其在安全关键的场景中的应用。基于对抗样本是由神经网络的高度线性行为产生的这一解释,提出了一种基于尺度不变的条件数约束的模型鲁棒性增强算法。在对抗训练过程中利用权重矩阵计算其范数,并通过对数函数获得尺度不变的约束项。将尺度不变的条件数约束项纳入到对抗训练优化的外层框架中,经过反向传播迭代降低权重矩阵的条件数值,从而在良态的高维权重空间中进行神经网络的线性变换,以提高防御对抗扰动的鲁棒性。该算法适用于卷积和Transformer两种架构的视觉模型,不仅在防御PGD、AutoAttack等白盒攻击时可以显著提高鲁棒精度,在防御黑盒攻击square attack等算法时也能有效增强对抗鲁棒性。在基于Transformer架构的图像分类模型上进行对抗训练时结合所提出的约束,权重矩阵的条件数值平均下降了20.7%,防御PGD攻击时可提高1.16个百分点的鲁棒精度。与Lipschitz约束等同类方法相比,提出的算法还能提高干净样本的精度,缓解对抗训练造成的模型泛化性低的问题。
    脑电信号多特征融合与卷积神经网络算法研究
    宋世林, 张学军
    2024, 60(8):  148-155.  DOI: 10.3778/j.issn.1002-8331.2212-0301
    摘要 ( )   PDF (707KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对脑电信号(electroencephalogram,EEG)运动想象中单一特征无法多维表征信号中的信息导致的分类准确率不高的问题,提出一种基于样本熵和共空间模式特征融合的特征提取算法。算法先对原始脑电信号进行小波包分解,从中选择包含μ和β节律的分量进行重构,然后分别提取重构信号的样本熵和CSP(common spatial pattern,CSP)特征,将两者融合组成新的特征向量,使用所设计的一维卷积神经网络对其进行识别获得分类结果。所提方法在2003年BCI Dataset III中获得了91.66%的分类准确率,在2008年BCI Dataset A中获得了85.29%的平均分类准确率。与近年来文献中提出的多特征融合算法相比,准确率提高了7.96个百分点。
    融合交互注意力网络的实体和关系联合抽取模型
    郝小芳, 张超群, 李晓翔, 王大睿
    2024, 60(8):  156-164.  DOI: 10.3778/j.issn.1002-8331.2301-0154
    摘要 ( )   PDF (609KB) ( )  
    参考文献 | 相关文章 | 计量指标
    实体关系三元组的抽取效果直接影响后期知识图谱构建的质量,而传统流水线式和联合式抽取的模型,并没有对句子级别和关系级别的语义特征进行有效建模,从而导致模型性能的缺失。为此,提出一种融合句子级别和关系级别的交互注意力网络的实体和关系联合抽取模型RSIAN,该模型通过交互注意力网络来学习句子级别和关系级别的高阶语义关联,增强句子和关系之间的交互,辅助模型进行抽取决策。在构建的中文旅游数据集(TDDS)的Precision、Recall和F1值分别为0.872、0.760和0.812,其性能均优于其他对比模型;为了进一步验证该模型在英文联合抽取上的性能,在公开英文数据集NYT和Webnlg上进行实验,该模型的F1值相比基线模型RSAN模型分别提高了0.014和0.013,并且该模型在重叠三元组的分析实验也均取得了优于基线模型的性能且更稳定。
    双元双模态下二次门控融合的多模态情感分析
    刘青文, 买日旦·吾守尔, 古兰拜尔·吐尔洪
    2024, 60(8):  165-172.  DOI: 10.3778/j.issn.1002-8331.2302-0088
    摘要 ( )   PDF (567KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了平衡情感信息在不同模态中分布的不均匀性,获得更深层次的多模态情感表征,提出了一种基于双元双模态二次门控融合的多模态情感分析方法。对文本、视觉模态,文本、语音模态分别融合,充分考虑文本模态在三个模态中的优势地位。同时为了获得更深层次的多模态交互信息,使用二次融合。在第一次融合中,使用融合门决定向主模态添加多少补充模态的知识,得到两个双模态混合知识矩阵。在第二次融合中,考虑到两个双模态混合知识矩阵中存在冗余、重复的信息,使用选择门从中选择有效、精简的情感信息作为双模态融合后的知识。在公开数据集CMU-MOSEI上,情感二分类的准确率和F1值分别达到了86.2%、86.1%,表现出良好的健壮性和先进性。
    图形图像处理
    改进YOLOv7的航拍图像目标检测
    邹振涛, 李泽平
    2024, 60(8):  173-181.  DOI: 10.3778/j.issn.1002-8331.2305-0264
    摘要 ( )   PDF (745KB) ( )  
    参考文献 | 相关文章 | 计量指标
    航拍图像目标检测对于高效解译航拍图像,并用于地图绘制、资源普查、城乡规划等领域有着重大现实意义。针对无人机航拍图像中的物体尺度变化大、易受到背景干扰和微小目标容易错检漏检的问题,提出一种基于YOLOv7进行改进的航拍图像目标检测算法(AirYOLOv7)。AirYOLOv7通过在原网络的特征提取阶段结合三维注意力机制,在特征融合阶段结合通道注意力机制,以帮助模型更好地聚焦于图像中的关键信息。考虑到航拍图像中存在许多微小物体,算法额外增加了一个用于检测微小物体的预测头,并在每个预测头前引入C3STB,以增强算法对不同尺度目标的检测能力。针对IoU损失对微小物体的位置偏差非常敏感,通过在原边框回归损失中引入Wasserstein距离来衡量微小物体之间的差异,以提高算法对微小物体的检测能力。实验结果表明,AirYOLOv7在DOTA和VisDrone这两个公开的光学航拍数据集上的mAP分别达到78.65%和51.79%,相较于原始的YOLOv7分别提高了1.92个百分点和2.28个百分点,证明了改进方法在光学航拍图像上的有效性。
    改进YOLOv8的轻量化无人机目标检测算法
    胡峻峰, 李柏聪, 朱昊, 黄晓文
    2024, 60(8):  182-191.  DOI: 10.3778/j.issn.1002-8331.2310-0063
    摘要 ( )   PDF (813KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对无人机目标检测算法计算复杂难以部署,且长尾分布的无人机数据导致检测精度较低的问题,提出了基于改进YOLOv8的轻量化无人机目标检测算法(PC-YOLOv8-n),可均衡网络检测精度与计算量,并对长尾分布数据有一定泛化能力。使用部分卷积层(PConv)替换YOLOv8中的3×3卷积层,对网络进行轻量化处理,解决网络冗余和计算量复杂的问题;融合双通道特征金字塔,增加自上而下的路径,将深层信息与浅层信息进行融合,同层引入轻量化注意力机制,提升网络的特征提取能力;采用均衡焦点损失(EFL)作为类别损失函数,通过均衡尾部类别在网络训练时的梯度权重,增加网络的类别检测能力。实验结果表明,PC-YOLOv8-n在VisDrone2019数据集中具有良好的表现,在mAP50精度上比原始YOLOv8-n算法提高了1.6个百分点,同时模型的参数和计算量分别降低为2.6×106和7.6 GFLOPs,检测速度达到77.2 FPS。
    轻量化YOLO-v7的数显仪表检测及读数
    章芮宁, 闫坤, 叶进
    2024, 60(8):  192-201.  DOI: 10.3778/j.issn.1002-8331.2304-0401
    摘要 ( )   PDF (712KB) ( )  
    参考文献 | 相关文章 | 计量指标
    由于较大的参数体量和较高的计算复杂度,通用检测及识别模型直接在移动端部署的难度较高。为解决这个困难,研究了移动设备上使用计算机视觉的仪表检测及读数方法。针对实际工业生产环境下检测及识别的需求,基于YOLO-v7重新设计了轻量化的仪表检测网络以及字符检测及识别网络。利用深度可分离卷积进一步降低计算复杂度,压缩模型大小。采用K-means++聚类算法加遗传算法自动产生初始锚框。使用通道剪枝,再一次压缩模型。实验结果证明,专用网络模型设计、深度可分离卷积以及通道剪枝对减少模型参数体量和降低算力需求具有显著效果。参数数量相较于原始YOLO-v7模型均下降了99.67%,模型算力需求均降至0.3?GFLOPs,下降了99.71%。实验中平均图片检测时间为10.7?ms。各网络的平均精准度(mAP0.5)达到了99.63%和99.53%。系统整体读数精确度达98.44%。
    改进YOLOv8的道路交通标志目标检测算法
    田鹏, 毛力
    2024, 60(8):  202-212.  DOI: 10.3778/j.issn.1002-8331.2309-0415
    摘要 ( )   PDF (937KB) ( )  
    参考文献 | 相关文章 | 计量指标
    虽然,当前检测技术日趋成熟,但对于复杂环境下的小目标检测仍然是研究的重难点。针对道路交通场景中普遍存在的交通标志小目标比例较高,环境干扰因素较大的问题,提出了一种基于YOLOv8改进的道路交通标志目标检测算法。由于小目标检测中容易出现漏检的现象,利用BRA(bi-level routing attention)注意力机制提高网络对小目标的感知能力。此外,还利用可形变卷积模块DCNv3(deformable convolution v3),针对特征图中的不规则形状具有更好的特征提取能力,使骨干网络更好地适应不规则的空间结构,更精准地关注重要目标,从而提高模型对遮挡重叠目标的检测能力。DCNv3和BRA模块均在基本不增加模型权重大小的情况下提高模型准确性。同时引入基于辅助边框的Inner-IOU损失函数。在RoadSign、CCTSDB、TSDD、GTSDB四个数据集上,分别进行了小样本训练、大样本训练、单目标检测和多目标检测,实验结果均有所提高。其中,在RoadSign数据集上的实验结果最佳,YOLOv8改进模型的均值平均精度mAP50与mAP50:95分别达到了90.7%和75.1%,相较于基线模型,mAP50与mAP50:95分别提升了5.9和4.8个百分点。实验结果表明,YOLOv8改进模型有效地实现了在复杂道路场景下的交通标志检测。
    分布统计特征的孪生网络目标跟踪方法
    李俊, 曹林, 张帆, 杜康宁, 郭亚男
    2024, 60(8):  213-224.  DOI: 10.3778/j.issn.1002-8331.2211-0435
    摘要 ( )   PDF (854KB) ( )  
    参考文献 | 相关文章 | 计量指标
    尽管基于孪生网络的跟踪器取得了巨大成功,但在边界模糊这类复杂场景下的跟踪性能仍然较差。大多数现有方法对于目标的定位均采用不灵活的狄克拉分布,由于缺少对边界框的不确定性估计,使其在边界模糊下无法准确定位。为了解决上述问题,基于SiamBAN模型进行改进,利用目标边界框的分布统计特征与其实际的定位质量高度相关这一特性,将边界框的回归值由狄克拉分布转为一定范围内的任意概率分布,将分布统计特征经过分布引导质量预测器生成较高的定位质量估计得分,将分类与定位质量估计联合表示,克服了训练和测试阶段分类与回归不一致问题。在VOT2018、VOT2019、OTB100、UAV123、LaSOT、TrackingNet和GOT-10k数据集上的实验结果表明,对比SiamBAN在准确度和EAO指标上提升了3.3%~10%。
    融合双重极化注意力的轻量化半监督语义分割
    马冬梅, 李悦媛, 陈曦
    2024, 60(8):  225-233.  DOI: 10.3778/j.issn.1002-8331.2211-0439
    摘要 ( )   PDF (631KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对目前半监督语义分割方法复杂度高、训练精度低、参数量过大等问题,提出融合双重极化自注意力机制的轻量级半监督语义分割算法。模型使用由位置感知循环卷积构造的Resnet-101残差网络作为分割骨干网络提取深层特征。融合了通道及空间双重极化自注意力机制,在极化通道和空间注意力分支中保持较高内部分辨率。将位置感知循环卷积与通道注意力操作结合起来,提升分割精度并降低计算成本,克服硬件支持等问题。在公开数据集PASCAL VOC 2012上的实验结果显示,该算法其平均交并比可达到76.32%,较基准模型准确率提高了2.52个百分点,参数量减少了9%,模型硬件所占内存减小了61.6%。设计的模型与领域内最新算法相比,该算法在精度、模型复杂度、参数量等方面均展现出了显著的优势。
    改进YOLOv4-Tiny的面向售货柜损害行为人体检测
    殷民, 贾新春, 张学立, 冯江涛, 范晓宇
    2024, 60(8):  234-241.  DOI: 10.3778/j.issn.1002-8331.2212-0057
    摘要 ( )   PDF (778KB) ( )  
    参考文献 | 相关文章 | 计量指标
    无人货柜的安全检测一直是零售领域的热点话题。针对现有人工监控无法及时且有效地捕捉到部分消费者对自助售货柜及其内部商品的损坏行为这一问题,提出了一种改进YOLOv4-Tiny的面向售货柜损害行为人体检测方法。将真实场景采集到的监控视频进行预处理,完成对数据集DMGE-Act的制作,解决场景图像数据源不足的问题。提出了基于YOLOv4-Tiny的改进模型——YOLOv4-TinyX,通过修改神经网络的激活函数进行平滑逼近,分别在主干特征提取网络的最大特征提取层后引入CBAM,在加强特征提取网络中的上采样操作层后引入CA两种不同的注意力机制模块,并且进行了数据不平衡的修正,有效提升了算法的特征提取与检测能力。通过对比实验分析,改进后的模型参数量仅增加2×104的同时,平均精度均值mAP提升了10.29个百分点,结果表明该算法保持轻量化且对损害行为的检测精度有显著提升。
    基于改进Tracktor的行人多目标跟踪算法
    谌海云, 黄忠义, 王海川, 余鸿皓
    2024, 60(8):  242-249.  DOI: 10.3778/j.issn.1002-8331.2212-0096
    摘要 ( )   PDF (765KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在多目标视频跟踪中,针对受交互遮挡等影响导致检测偏差从而致使目标身份丢失的问题,提出一种基于改进Tracktor的行人多目标跟踪算法DUTracktor。在检测框回归中设计一个动态更新模块,利用孪生网络对建议框进一步检测定位;利用时序信息增强模块更新当前帧更适合的模板,建立全局上下文关系;并通过像素相关进行特征融合,从而增强目标边缘信息和尺度信息;利用相机运动补偿和融合相似矩阵构建二级关联跟踪机制,建立检测框和轨迹更强大的关联性,提高目标跟踪的鲁棒性。在公开的MOT16数据集上进行实验测试,并与当前主流算法相比,该算法跟踪精度表现较优,具有良好的鲁棒性,FPS稳定在24帧。
    基于时空特征融合的交通警察手势识别
    杜兵, 赵骥
    2024, 60(8):  250-257.  DOI: 10.3778/j.issn.1002-8331.2212-0110
    摘要 ( )   PDF (740KB) ( )  
    参考文献 | 相关文章 | 计量指标
    近年来,随着人体姿态估计技术的发展,基于骨架关键点的手势识别技术应运而生。提出了一个GCPM-AGRU模型进行交通警察手势识别。为了更准确地定位人体关键点,对卷积姿态机(CPM)进行改进。在特征提取模块中加入残差思想、通道拆分和通道重组,设计后的特征提取模块更好提取图片特征;在CPM第一阶段加入并行多分支Inception4d结构,使CPM网络具有多尺度特征融合思想,有效改进对人体关键点定位的问题;提出基于注意力机制的GRU,通过为每帧分配不同权重来达到对每帧不同程度的关注,从而更好获取时间信息;结合时空特征信息进行交通警察手势识别。交通警察手势识别的准确度达到了93.7%,相比网络改进之前提高了2.95个百分点。
    ConvUCaps:基于卷积胶囊网络的医学图像分割模型
    邓希泉, 陈刚
    2024, 60(8):  258-266.  DOI: 10.3778/j.issn.1002-8331.2302-0002
    摘要 ( )   PDF (679KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在医学影像分割领域,U-Net网络是目前最成功和最受关注的方法之一,但是U-Net本质上是一种经过改造的全卷积神经网络模型,要获得更为全面和准确的局部-整体关系,不但需要增加网络层次从而加大计算量,而且效果也并不明显。胶囊网络提供了一种有效的建模图像的局部与整体关系的方法,可以用更少的参数取得好的性能。但原始的胶囊网络并没有充分考虑图像局部特征的粒度问题,将其应用在医学图像分割领域还需进一步改造。因此,提出一种将U-Net和胶囊网络相结合的医学图像分割模型ConvUCaps。该模型对U-Net的编码器部分进行改进,使用卷积模块学习不同尺度的局部特征,然后通过胶囊模块学习高层特征,并建模局部与整体之间的关系。实验结果表明,相比U-Net、UNet++、SegCaps、Matwo-CapsNet网络,ConvUCaps提高了分割精度和收敛速度,同时,与单纯基于胶囊网络的分割模型相比,显著减少了推理时间。
    面向目标检测的数据集标签遗漏的协同修正技术
    周定威, 扈静, 张良锐, 段飞亚
    2024, 60(8):  267-273.  DOI: 10.3778/j.issn.1002-8331.2302-0056
    摘要 ( )   PDF (663KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对图像标注中疲劳、粗心等因素引起的标签遗漏现象,使得模型训练时难以正确区分正负样本,进而影响模型性能。设计了一种协同修正技术,通过多次迭代更新训练集,将潜在无标签的目标进行对象擦除,降低训练集的错误监督信息,避免人工的重复检查和重复标注。该方法无需进行算法参数调整、不依赖具体网络结构,低成本地减少数据集错误从而提升模型训练精度。在YOLOv5算法的实验基础上表明协同修正操作仅迭代1次即有明显的改善效果,并在多个公共数据集上能够提升0.4%~1.4%的检测精度,当数据集中的标签遗漏率达到40%时依然能够生效。该方法对数据集中样本的数据量和类别数没有限制,可应用于电商、遥感、通用等多种目标检测场景,保持着较好的鲁棒性和泛化性。
    大数据与云计算
    主动式微服务细粒度弹性缩放算法研究
    彭凯, 马芳玲, 徐博, 郭佳璐, 胡梦兰
    2024, 60(8):  274-286.  DOI: 10.3778/j.issn.1002-8331.2303-0543
    摘要 ( )   PDF (876KB) ( )  
    参考文献 | 相关文章 | 计量指标
    微服务架构已成为云数据中心的基本服务架构。但目前关于微服务系统弹性缩放的研究大多是基于服务或实例级别的水平缩放,忽略了能够充分利用单台服务器资源的细粒度垂直缩放,从而导致资源浪费。为此,设计了主动式微服务细粒度弹性缩放算法。算法通过预测请求到达率对系统进行资源预配置。基于预测结果,应用平方根配置规则计算需求资源数量,进而利用垂直缩放的细粒度资源控制特性和水平缩放的高可用性对微服务进行伸缩。应用基于微服务依赖关系的实例迁移算法进一步降低资源开销。实验结果表明,提出的算法在优化微服务系统时延和开销方面取得了显著效果。
    融合自注意力和图卷积的多视图群组推荐
    王永贵, 王芯茹
    2024, 60(8):  287-295.  DOI: 10.3778/j.issn.1002-8331.2304-0035
    摘要 ( )   PDF (604KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了解决大多数现有的群组推荐仅仅从群组和用户的单一交互中学习群组表示,以及固定融合策略难以动态调整权重的问题。提出了一种融合自注意力和图卷积的多视图群组推荐模型(MVGR),设计了成员级、项目级和组级三个不同的视图,来捕捉群组、用户和项目三者之间的高阶交互信息,缓解数据稀疏问题,增强群组表示建模过程;对于项目级视图,利用基于二分图的图卷积神经网络来学习群组偏好向量以及项目嵌入;进一步提出了自适应融合组件来动态调整不同视图权重,得到最终的群组偏好向量。在两个真实数据集上的实验结果表明,与基线模型相比,MVGR模型的命中率(HR)和归一化折损累计增益(NDCG)在Mafengwo数据集上平均提高了8.89个百分点和1.56个百分点,在CAMRa2011数据集上平均提高了2.79个百分点和2.7个百分点。
    工程与应用
    突发公共事件下复杂供应链网络风险传播与干预
    姜林, 梁竞心
    2024, 60(8):  296-308.  DOI: 10.3778/j.issn.1002-8331.2306-0327
    摘要 ( )   PDF (1095KB) ( )  
    参考文献 | 相关文章 | 计量指标
    突发公共事件给供应链网络的稳定运行带来极大冲击,如何提升供应链网络应对突发公共事件的能力,保持其坚韧性与稳定性,具有重要意义。结合突发公共事件的特性,基于改进的SEIR系统动力学传播模型,构建政府干预下复杂供应链网络的风险传播模型,并利用基本再生数的理论方法,分析风险传播的阈值以及平衡点问题,探究政府干预对阻断供应链风险传播的积极作用,从宏观层面分析供应链风险的传播机理以及干预措施,得出政府的风险管控方向。理论研究及仿真实验的结果均表明,政府通过控制基本再生数,能有效遏制风险进一步蔓延与扩散,达到控制风险的目标。
    改进蚁群算法的火灾环境疏散路径规划研究
    杜云, 刘小雨, 贾科进, 丁力, 黄公发
    2024, 60(8):  309-319.  DOI: 10.3778/j.issn.1002-8331.2310-0416
    摘要 ( )   PDF (1036KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对建筑物火灾人员疏散问题,以保证火灾人员安全撤离为目标,提出火灾环境下改进蚁群算法的路径规划模型。构建方向性信息函数,当搜索方向靠近目标节点,方向性信息函数的值增大使信息素差异化;根据火灾影响程度建立火灾等级函数,使转移概率随着火灾等级的增大而减小,减少蚁群寻路的盲目性;通过分析火灾影响因素建立等效长度并构建启发函数,避免陷入局部最优;结合火灾等级函数自适应调整信息素挥发系数,加快了火灾路径信息素挥发速度,提升算法全局搜索能力;同时在信息素更新策略中引入奖惩系数和模糊控制,提升疏散系统的鲁棒性以及路径平滑度,并对全局信息素进行限制,以平衡算法的局部开发与全局搜索能力。经仿真实验验证,改进的蚁群算法在有无火灾的情况下都能高效地规划出疏散路线。
    自然场景下配电线网施工安全帽佩戴检测算法
    许逵, 李鑫卓, 张历, 张俊杰, 杨宁
    2024, 60(8):  320-328.  DOI: 10.3778/j.issn.1002-8331.2301-0057
    摘要 ( )   PDF (690KB) ( )  
    参考文献 | 相关文章 | 计量指标
    对于配电线网施工作业这一类高危行业而言,在施工过程中按照安全守则佩戴安全帽是避免事故发生的有效途径之一。由于配电线网施工环境复杂多变,导致现有的安全帽识别方法在自然场景下常出现误检漏检的问题且不能满足实时性需求。为提高自然场景下的安全帽识别准确率以及识别效率,提出一种面向自然场景下配电线网施工的安全帽佩戴识别检测网络模型YOLO-ACON-Attention。该方法以YOLOv5算法为基础,采用自适应判断激活函数取代原有的激活函数,加强模型检测能力。在骨干网络中使用二轮四向IRNN网络构造自适应注意力模块提升模型的图像信息特征提取能力。实验结果证明,与原YOLOv5算法相比,该算法的精确率和召回率为94.75%和89.29%,分别提高了7.65%和5.17%,检测速度为36.5 FPS。
    室内测绘机器人自主定位与三维建图研究
    周宏毅, 章国宝, 朱宏伟
    2024, 60(8):  329-337.  DOI: 10.3778/j.issn.1002-8331.2301-0073
    摘要 ( )   PDF (873KB) ( )  
    参考文献 | 相关文章 | 计量指标
    室内空间由于低照明、缺少GPS定位辅助和场景特征较少等原因难以利用有限传感器进行高精度三维建图。针对此问题,对FAST-LIO算法进行改进,引入了Lider-IMU参数初始化系统和后端回环检测优化算法,以增加大场景下的建图鲁棒性。采用公开数据集进行实验研究。结果表明,和现有算法相比,该算法轨迹误差精度均有提升。还设计了机器人在东南大学的建筑内部环境进行测试。实验结果表明,机器人能够实现自主移动建图并安全返回,效果良好。
    支持抑制型脉冲神经网络的硬件加速器
    钱平, 韩睿, 谢凌东, 罗旺, 徐华荣, 李松松, 郑振东
    2024, 60(8):  338-347.  DOI: 10.3778/j.issn.1002-8331.2301-0133
    摘要 ( )   PDF (609KB) ( )  
    参考文献 | 相关文章 | 计量指标
    现有脉冲神经网络加速器的设计过多关注于硬件层面的功能完备性,缺少算法层面的相关协同优化以保证硬件计算效率。此外,传统的事件驱动型脉冲神经网络加速器没有考虑到脉冲神经元模型中普遍存在的脉冲抖动现象,因此不能实现对抑制型脉冲神经网络的支持。为解决上述问题,采用软硬件结合的方式,提出了一种支持抑制型脉冲神经网络加速器的设计方法。软件优化层面通过对脉冲神经网络计算冗余性的分析,提出了相应的近似计算方法以大幅降低脉冲神经网络的计算量;硬件设计层面提出了解决脉冲抖动问题的计算模块,并在此基础上设计了与近似计算方法相适应的并行计算结构。为验证设计的合理性,在Xilinx ZC706 FPGA上部署了加速器原型FEAS。在主流数据集上的测试结果显示,相较以往脉冲神经网络的加速器部署,FEAS在保持97.54%原有模型精度的情况下获得超过一个数量级的性能提升。
    田间即时鲜烟叶SPAD值预测和成熟度识别方法
    裴文灿, 孙光伟, 黄金国, 徐丁辉, 刘竞
    2024, 60(8):  348-360.  DOI: 10.3778/j.issn.1002-8331.2301-0153
    摘要 ( )   PDF (840KB) ( )  
    参考文献 | 相关文章 | 计量指标
    成熟程度判定作为烟叶采收时的重要工作,需要满足即时性、科学性和准确性要求。目前烟叶成熟度识别实施存在测量仪器价格昂贵且操作繁琐,无法在田间推广使用;手机摄像头的内嵌图像处理算法干扰图像有效特征,田间复杂天气环境影响图像采集一致性;现存识别算法忽略植物学领域信息,影响模型准确性和普适性等问题。据此提出一种低成本且有效的田间即时鲜烟叶SPAD值预测和成熟度识别方法,通过提高识别准确率保障烟叶后续调制质量。研发便携式拍摄装置,实现田间高质量图片采集;并以CX-26烟叶品种为研究对象,提出一种适配于田间烟叶图像的分割方法,通过提取图像目标区域特征数据,利用XGBoost算法依次搭建鲜烟叶SPAD值预测模型和成熟度识别模型。提出两个模型的集成思路,集成模型能够利用SPAD值和成熟度的强相关关系,通过预测SPAD值提高成熟度识别准确性。该方法在各项评价指标中均表现优秀,其中SPAD值预测平均误差为0.470 3,成熟度识别宏F1-Score为95.27%。研发手机APP完成拍摄装置和云端模型之间烟叶图像和预测结果的传输,实现在田间对烟叶成熟程度快速、客观、准确的即时预测。该成果可为田间农作物精准采收提供有效技术支持。