摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 一年内发表文章
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于深度学习的目标检测算法研究与应用综述
    张阳婷, 黄德启, 王东伟, 贺佳佳
    计算机工程与应用    2023, 59 (18): 1-13.   DOI: 10.3778/j.issn.1002-8331.2305-0310
    摘要1058)      PDF(pc) (662KB)(648)    收藏
    随着深度学习的不断发展,深度卷积神经网络在目标检测领域中的应用愈加广泛,现已被应用于农业、交通和医学等众多领域。与基于特征的传统手工方法相比,基于深度学习的目标检测方法可以学习低级和高级图像特征,有更好的检测精度和泛化能力。为了概括和总结目标检测领域的最新进展和技术,通过分析近年来基于深度学习的目标检测技术,对基于深度学习的目标检测算法与应用现状进行综述。归纳了两阶段与单阶段两种目标检测网络架构的发展及优缺点;从骨干网络、数据集和评价指标等方面进行叙述,对比了经典算法的检测精度,总结经典目标检测算法的改进策略;讨论了现阶段目标检测应用,并提出了目标检测领域今后的研究重点。
    参考文献 | 相关文章 | 多维度评价
    2. 激光雷达SLAM算法综述
    刘铭哲, 徐光辉, 唐堂, 钱晓健, 耿明
    计算机工程与应用    2024, 60 (1): 1-14.   DOI: 10.3778/j.issn.1002-8331.2308-0455
    摘要840)      PDF(pc) (854KB)(548)    收藏
    即时定位与地图构建(simultaneous localization and mapping,SLAM)是自主移动机器人和自动驾驶的关键技术之一,而激光雷达则是支撑SLAM算法运行的重要传感器。基于激光雷达的SLAM算法,对激光雷达SLAM总体框架进行介绍,详细阐述前端里程计、后端优化、回环检测、地图构建模块的作用并总结所使用的算法;按由2D到3D,单传感器到多传感器融合的顺序,对经典的具有代表性的开源算法进行描述和梳理归纳;介绍常用的开源数据集,以及精度评价指标和测评工具;从深度学习、多传感器融合、多机协同和鲁棒性研究四个维度对激光雷达SLAM技术的发展趋势进行展望。
    参考文献 | 相关文章 | 多维度评价
    3. 农村电商物流下无人机与车辆协同配送路径优化研究
    许菱, 杨林超, 朱文兴, 钟少君
    计算机工程与应用    2024, 60 (1): 310-318.   DOI: 10.3778/j.issn.1002-8331.2306-0115
    摘要820)      PDF(pc) (666KB)(667)    收藏
    无人机配送正在成为解决物流末端配送难题的重要手段。无人机与车辆协同配送模式克服了无人机配送能力不足、安全性不高的弊端,是无人机参与配送的重要途径之一。针对农村电商物流“最后一公里”配送难、配送贵问题,考虑无人机与车辆协同方式、多无人机多包裹配送等约束,以配送成本最小化为目标构建混合整数规划模型并提出一种两阶段算法对无人机与车辆协同配送路径优化问题进行求解。第一阶段通过带约束的自适应K-means算法确定车辆停靠点范围,第二阶段设计爬山算子与分裂算子改进遗传算法,求得无人机与车辆配送路径。最后,通过算例实验验证了模型和算法的可行性与有效性。研究成果有望为农村电商物流末端配送降本增效提供新思路和参考价值。
    参考文献 | 相关文章 | 多维度评价
    4. 公交辅助无人机的城市物流配送模式研究
    彭勇, 任志
    计算机工程与应用    2024, 60 (7): 335-343.   DOI: 10.3778/j.issn.1002-8331.2212-0252
    摘要635)      PDF(pc) (755KB)(525)    收藏
    电子商务迅猛发展倒逼物流行业不断转型升级,针对各地政府鼓励公共交通发展,倡导绿色低碳的物流配送方式,研究了一种公交辅助无人机的配送模式。对问题做出说明后,构建了以配送成本最小的数学模型,并设计了智能通用变邻域搜索算法对问题求解,同时为提高算法求解效率,引入K-means分簇与贪婪算法生成初始解。针对不同规模算例,进行多种局部搜索策略、多种算法对比实验,验证了算法有效性;选取标准CVRP算例,将单卡车配送、卡车无人机协同配送与公交辅助无人机配送模式进行对比,证明其成本、时间优势;选取北京快速公交2号线及周边客户点,通过改变公交站点间距、发车间隔做出敏感度分析,实验结果证明增大站点间距的影响大于发车间隔的改变。
    参考文献 | 相关文章 | 多维度评价
    5. 机器人导航的路径规划算法研究综述
    崔炜, 朱发证
    计算机工程与应用    2023, 59 (19): 10-20.   DOI: 10.3778/j.issn.1002-8331.2301-0088
    摘要595)      PDF(pc) (595KB)(319)    收藏
    路径规划算法是机器人导航的关键技术之一,优良的路径规划算法能够快速找出最佳无碰撞行走路径,提高运行效率。大多数现有的分类方法难以表述清楚算法间的区别与联系,根据机器人路径规划算法的设计原理,将其分为基于图搜索、基于仿生、基于势场、基于速度空间和基于采样的规划算法以更清晰地区分不同的路径规划算法。阐述了每类算法的概念、特点和发展现状,并从单查询算法和多查询算法的角度重点分析了应用更为广泛的基于采样的算法,对比总结了不同类型路径规划算法的优缺点,从多机器人协作、多算法融合和自适应规划等方面展望了机器人路径规划算法的未来发展趋势。
    参考文献 | 相关文章 | 多维度评价
    6. 基于多模态融合的情感分析算法研究综述
    郭续, 买日旦·吾守尔, 古兰拜尔·吐尔洪
    计算机工程与应用    2024, 60 (2): 1-18.   DOI: 10.3778/j.issn.1002-8331.2305-0439
    摘要592)      PDF(pc) (954KB)(433)    收藏
    情感分析是一项新兴技术,其旨在探索人们对实体的态度,可应用于各种领域和场景,例如产品评价分析、舆情分析、心理健康分析和风险评估。传统的情感分析模型主要关注文本内容,然而一些特殊的表达形式,如讽刺和夸张,则很难通过文本检测出来。随着技术的不断进步,人们现在可以通过音频、图像和视频等多种渠道来表达自己的观点和感受,因此情感分析正向多模态转变,这也为情感分析带来了新的机遇。多模态情感分析除了包含文本信息外,还包含丰富的视觉和听觉信息,利用融合分析可以更准确地推断隐含的情感极性(积极、中性、消极)。多模态情感分析面临的主要挑战是跨模态情感信息的整合,因此,重点介绍了不同融合方法的框架和特点,并对近几年流行的融合算法进行了阐述,同时对目前小样本场景下的多模态情感分析进行了讨论,此外,还介绍了多模态情感分析的发展现状、常用数据集、特征提取算法、应用领域和存在的挑战。期望此综述能够帮助研究人员了解多模态情感分析领域的研究现状,并从中得到启发,开发出更加有效的模型。
    参考文献 | 相关文章 | 多维度评价
    7. 基于机器学习的信用卡交易欺诈检测研究综述
    蒋洪迅, 江俊毅, 梁循
    计算机工程与应用    2023, 59 (21): 1-25.   DOI: 10.3778/j.issn.1002-8331.2302-0129
    摘要588)      PDF(pc) (674KB)(370)    收藏
    机器学习在信用卡交易检测中有其特殊性,面对的环境更为复杂。由于有人的智力介入,战胜信用卡交易欺诈,其挑战性比人脸识别、无人驾驶等工程问题的难度更高,照搬工程学科的机器学习方法往往会失败。综述了2000年以来基于机器学习的信用卡欺诈检测研究历程,辨析了该领域的研究范畴、应用场景、技术流派等相关概念及其联系;解构了机器学习欺诈识别的一般性研究架构,从特征工程、模型算法、评价指标三个环节归纳总结了领域内研究的最新进展;从数据集是否具备标签角度,着重列举了面向欺诈识别的有监督的、无监督和半监督三类主流机器学习模型,讨论了这些模型的出发点、核心思想、求解方法以及优缺点;还分析了强化学习模型模拟欺诈者与机构之间的动态博弈过程;探讨了机器学习面临的海量数据、样本偏斜和概念漂移三大难点问题,并汇集整理了缓解这些问题的最新进展;总结了面向欺诈检测的机器学习研究目前存在的局限、争议和挑战,并为未来的研究方向提供趋势分析与建议。
    参考文献 | 相关文章 | 多维度评价
    8. 基于深度学习的MRI重建方法综述
    邓戈文, 魏国辉, 马志庆
    计算机工程与应用    2023, 59 (20): 67-76.   DOI: 10.3778/j.issn.1002-8331.2302-0057
    摘要556)      PDF(pc) (580KB)(301)    收藏
    磁共振成像(MRI)是临床中一种常用的成像技术,但过长的成像时间限制了其进一步的发展。从欠采样的k空间数据中进行图像重建是加速MRI成像的重要一环。近年来,深度学习在MRI重建方面显示出巨大的潜力,其重建结果和效率都优于传统的压缩感知方法。为梳理与总结当前基于深度学习的MRI重建方法,介绍了MRI重建问题的定义,分析了深度学习在数据驱动的端到端重建和模型驱动的展开优化重建中的应用,提供重建的评价指标和常用数据集,讨论了当前MRI重建所面临的挑战与未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    9. 低光照图像增强研究方法综述
    彭大鑫, 甄彤, 李智慧
    计算机工程与应用    2023, 59 (18): 14-27.   DOI: 10.3778/j.issn.1002-8331.2210-0143
    摘要506)      PDF(pc) (645KB)(286)    收藏
    低光照图像增强目的是从低光照条件下恢复细节完整的图像,并逐渐成为计算机图像处理研究的热点。图像成像的质量对于智能安防、视频监控等场景至关重要,且在相关行业中有着十分广阔的应用前景。为了深入研究低光照图像增强,对传统低光照图像增强方法进行详细地分类阐述与分析,列举了基于深度学习的图像增强方法,对所用到的各种网络以及所解决的问题进行了详细的梳理,并将所提到的方法进行了细致的对比。又对数据集进行了细致的分析和研究,并对一些常用的评价指标进行了简单梳理。对所述内容做出总结以及指出了当前研究中存在的困难,并指出了未来的研究目标。
    参考文献 | 相关文章 | 多维度评价
    10. 机器学习在影像组学分析中的应用综述
    鲁慧民, 薛涵, 王奕龙, 王贵增, 桑鹏程
    计算机工程与应用    2023, 59 (17): 22-34.   DOI: 10.3778/j.issn.1002-8331.2210-0435
    摘要503)      PDF(pc) (5275KB)(283)    收藏
    影像组学(radiomics)是一种从标准医学影像中定量地提取特征的技术。借助机器学习构建预测或诊断模型,能够在临床决策支持系统中提取和应用数据,以提高诊断的准确性,该技术在肿瘤分期、癌症检测、生存分析等任务中得到了广泛的应用。回顾了机器学习在影像组学分析中的相关应用和研究进展;重点论述了机器学习算法在影像组学分析中各阶段的适用性和局限性,在原理和应用效果上对代表性算法进行了深入梳理与分析;综合介绍了在影像组学分析中对各阶段工作的评估方法;整理了公开的医学影像数据集以及用于影像组学特征提取的软件与工具包;最后讨论了机器学习在影像组学中的未来发展。
    参考文献 | 相关文章 | 多维度评价
    11. 基于深度神经网络的图像修复算法综述
    吕建峰, 邵立珍, 雷雪梅
    计算机工程与应用    2023, 59 (20): 1-12.   DOI: 10.3778/j.issn.1002-8331.2303-0111
    摘要426)      PDF(pc) (720KB)(438)    收藏
    深度学习的快速发展使计算机视觉技术应用越来越广泛,同时利用深度神经网络根据破损图像的已知信息对图像复原的修复技术成为关注的热点。对近年基于深度神经网络的图像修复方法进行了综述和分析:按照模型优化的方向,对图像修复方法进行分类综述;介绍了图像修复常用的数据集和性能评价指标,并在相关数据集上对各种基于深度神经网络的破损图像修复算法进行性能评价和分析;总结和分析了现有图像修复方法面临的挑战和未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    12. 基于生物信息学的蛋白质功能预测研究综述
    李昕晖, 钱育蓉, 岳海涛, 胡月, 陈嘉颖, 冷洪勇, 马梦楠
    计算机工程与应用    2023, 59 (16): 50-62.   DOI: 10.3778/j.issn.1002-8331.2212-0167
    摘要423)      PDF(pc) (761KB)(241)    收藏
    蛋白质功能预测任务旨在为缺失功能标签的蛋白质数据提供功能注释,随着蛋白质测序技术的发展,数据库中蛋白质数量迅速增长,由于蛋白质数据的复杂性和多元性,蛋白质功能预测任务极具挑战,受到研究人员的密切关注。梳理了机器学习在蛋白质功能预测中的发展历程;对近年来的蛋白质功能预测方法进行归类与总结,分析各类算法之间的异同;最后对蛋白质功能预测存在的问题进行讨论,并对该领域的未来研究进行展望。
    参考文献 | 相关文章 | 多维度评价
    13. 改进YOLOv7的小目标检测算法研究
    李安达, 吴瑞明, 李旭东
    计算机工程与应用    2024, 60 (1): 122-134.   DOI: 10.3778/j.issn.1002-8331.2307-0004
    摘要385)      PDF(pc) (884KB)(218)    收藏
    随着深度学习在国内目标检测的不断应用,常规的大、中目标检测已经取得惊人的进步,但由于卷积网络本身的局限性,针对小目标检测依然会出现漏检、误检的问题,以数据集Visdrone2019和数据集FloW-Img为例,对YOLOv7模型进行研究,在网络结构上对骨干网的ELAN模块进行改进,将Focal NeXt block加入到ELAN模块的长短梯度路径中融合来强化输出小目标的特征质量和提高输出特征包含的上下文信息含量,在头部网络引入RepLKDeXt模块,该模块不仅可以取代SPPCSPC模块来简化模型整体结构还可以利用多通道、大卷积核和Cat操作来优化ELAN-H结构,最后引入SIOU损失函数取代CIOU函数以此提高该模型的鲁棒性。结果表明改进后的YOLOv7模型参数量减少计算复杂性降低并在小目标密度高的Visdrone 2019数据集上的检测性能近似不变,在小目标稀疏的FloW-Img数据集上涨幅9.05个百分点,进一步简化了模型并增加了模型的适用范围。
    参考文献 | 相关文章 | 多维度评价
    14. 无人机飞控系统故障诊断技术研究综述
    安雪, 李少波, 张仪宗, 张安思
    计算机工程与应用    2023, 59 (24): 1-15.   DOI: 10.3778/j.issn.1002-8331.2305-0137
    摘要348)      PDF(pc) (917KB)(1423)    收藏
    近年来,无人机因其运行成本低、机动性强等独特优势被广泛应用于军民各复杂领域;同时,复杂多样的任务对无人机系统的可靠性和安全性提出了更高的要求。无人机故障诊断技术能够及时准确地提供诊断结果,有助于无人机的维护、保养与维修,对提升无人机的作战效能具有重要意义。因此,从无人机的飞控系统剖析各类常见故障的机理,并进行故障归类。主要围绕飞控系统中的传感器、执行器和其他部件的故障诊断技术,分析总结了无人机故障诊断技术的研究方法和现状。探讨了无人机故障诊断技术面临的主要挑战,并指出了未来的发展方向;旨在为无人机故障诊断技术领域研究人员提供一定参考,促进我国无人机故障诊断技术水平的提升。
    参考文献 | 相关文章 | 多维度评价
    15. CNN-Transformer特征融合多目标跟踪算法
    张英俊, 白小辉, 谢斌红
    计算机工程与应用    2024, 60 (2): 180-190.   DOI: 10.3778/j.issn.1002-8331.2211-0028
    摘要345)      PDF(pc) (787KB)(202)    收藏
    在卷积神经网络(CNN)中,卷积运算能高效地提取目标的局部特征,却难以捕获全局表示;而在视觉Transformer中,注意力机制可以捕获长距离的特征依赖,但会忽略局部特征细节。针对以上问题,提出一种基于CNN-Transformer双分支主干网络进行特征提取和融合的多目标跟踪算法CTMOT(CNN-transformer multi-object tracking)。使用基于CNN和Transformer双分支并行的主干网络分别提取图像的局部和全局特征。使用双向桥接模块(two-way braidge module,TBM)对两种特征进行充分融合。将融合后的特征输入两组并行的解码器进行处理。将解码器输出的检测框和跟踪框进行匹配,完成多目标跟踪任务。在多目标跟踪数据集MOT17、MOT20、KITTI以及UA-DETRAC上进行评估,CTMOT算法的MOTP和IDs指标在四个数据集上均达到了SOTA效果,MOTA指标分别达到了76.4%、66.3%、92.36%和88.57%,在MOT数据集上与SOTA方法效果相当,在KITTI数据集上达到SOTA效果。由于同时完成目标检测和关联,能够端到端进行目标跟踪,跟踪速度可达35?FPS,表明CTMOT算法在跟踪的实时性和准确性上达到了较好的平衡,具有较大潜力。
    参考文献 | 相关文章 | 多维度评价
    16. 电动汽车充电站选址智能决策与优化研究综述
    魏冠元, 王冠群, 阮观梅, 耿娜
    计算机工程与应用    2023, 59 (21): 52-65.   DOI: 10.3778/j.issn.1002-8331.2302-0021
    摘要342)      PDF(pc) (683KB)(213)    收藏
    电动汽车(electric vehicle,EV)充电站的合理选址对推动EV行业发展以及城市交通战略布局具有重要作用。通过系统梳理充电站选址智能决策和优化的相关文献,为未来充电站选址规划提供参考和借鉴。阐述了EV充电站选址基本原则和影响因素;归纳了基于EV出行模拟和数据分析的充电需求估计方法;分别介绍了基于点需求、基于起讫点对的流量需求、EV轨迹等方面的EV充电站选址模型;总结了求解EV充电站选址模型的精确算法、启发式算法和深度学习算法;对现有研究进行总结,指出存在的不足并对未来研究方向进行展望。
    参考文献 | 相关文章 | 多维度评价
    17. 重构SPPCSPC与优化下采样的小目标检测算法
    齐向明, 柴蕊, 高一萌
    计算机工程与应用    2023, 59 (20): 158-166.   DOI: 10.3778/j.issn.1002-8331.2305-0004
    摘要335)      PDF(pc) (651KB)(176)    收藏
    针对小目标图像检测中存在相互遮挡、背景复杂和特征点少的问题,基于YOLOv7提出一种重构SPPCSPC与优化下采样的小目标检测算法。在骨干网络的SPPCSPC模块中裁剪CBS层、引入SimAM注意力机制并缩小池化核,以提高关注密集目标区域,提取更多相互遮挡的小目标特征;在颈部网络中,将下采样结构中的SConv替换为SPD Conv,再添加一个四倍下采样分支,以减少小目标特征丢失,提高复杂背景下小目标特征捕获量;把网络模型的损失函数由CIoU替换为Wise IoU,聚焦一般质量瞄框,提升收敛速度。在公开数据集VisDrone2021上做对比实验和消融实验,该算法与原始YOLOv7算法相比,mAP提升5.09个百分点,FPS值达到40,参数量减少2.5?MB,表明小目标检测精度显著提升,同时保持了推理速度并减少了参数量;在公开数据集VOC2007+2012上做泛化实验,mAP提升3.35个百分点,表明该算法具有通用性。
    参考文献 | 相关文章 | 多维度评价
    18. 改进YOLOv8的道路损伤检测算法
    李松, 史涛, 井方科
    计算机工程与应用    2023, 59 (23): 165-174.   DOI: 10.3778/j.issn.1002-8331.2306-0205
    摘要323)      PDF(pc) (671KB)(265)    收藏
    道路损伤检测是保障道路安全、实现道路损伤及时修复的一项重要任务。针对现有的道路损伤检测算法中检测效率低、成本高昂、难以应用于移动终端设备问题,提出了一种改进YOLOv8的轻量型道路损伤检测算法YOLOv8-Road Damage(YOLOv8-RD)。结合CNN和Transformer的优势,提出了一种能够提取道路损伤图像全局特征信息和局部特征信息的BOT模块,以适应裂纹对象的大跨度与细长特征。在骨干网络末端和颈部网络中引入坐标注意力机制(coordinate attention,CA),将位置信息嵌入到通道注意力中,强化特征提取能力,并抑制无关特征的干扰。在YOLOv8颈部网络中使用C2fGhost模块,以减少特征通道融合过程中的浮点运算量,降低模型参数量,同时提高特征表达性能。实验结果表明,在RDD2022数据集和Road Damage数据集上,改进算法与原算法相比mAP50分别提高了2个百分点和3.7个百分点,而模型参数量仅为2.8×106,计算量仅为7.3×109,分别降低了6.7%和8.5%。算法检测速度达到88?FPS,能够实时准确检测道路损伤目标。通过与其他主流目标检测算法比较,验证了该方法的有效性和优越性。
    参考文献 | 相关文章 | 多维度评价
    19. 基于知识表示学习的知识图谱补全研究进展
    于梦波, 杜建强, 罗计根, 聂斌, 刘勇, 邱俊洋
    计算机工程与应用    2023, 59 (18): 59-73.   DOI: 10.3778/j.issn.1002-8331.2212-0119
    摘要303)      PDF(pc) (777KB)(126)    收藏
    知识图谱(KG)是一种基于图的数据结构,其知识是以三元组的形式呈现,即(头实体,关系,尾实体)。随着人工智能的发展,知识图谱已在系统推荐、智能问答、知识搜索等领域发挥了重要作用。然而构建的知识图谱具有不完整性,影响了知识图谱的下游任务应用,知识图谱补全能够很好地解决这一问题。近年来,基于知识表示学习的知识图谱补全方法成为研究的热点,其以表示向量的形式在低维连续向量空间中学习实体和关系的嵌入特征,旨在预测未知的事实信息进行知识图谱补全。根据KG类型的不同,将其分为静态知识图谱补全、时序知识图谱补全以及多模态知识图谱补全,对这三类知识图谱补全方法拟解决的关键问题、设计思路、模型评价等方面进行对比总结,展望知识图谱补全未来的发展方向,为相关领域的研究人员提供参考。
    参考文献 | 相关文章 | 多维度评价
    20. 单张图像三维人脸重建方法综述
    王静婷, 李慧斌
    计算机工程与应用    2023, 59 (17): 1-21.   DOI: 10.3778/j.issn.1002-8331.2210-0041
    摘要302)      PDF(pc) (961KB)(297)    收藏
    近年来,三维人脸重建任务作为“数字人”技术的重要组成部分,受到了学术界和工业界的广泛关注。基于单张图像的三维人脸重建任务在充分结合传统相机模型、光照模型、三维人脸统计形变模型与深度卷积网络、深度生成模型等方面技术之后取得了长足的进步。聚焦单张图像三维人脸重建问题,将现有研究工作分为基于隐空间编码和基于显空间回归两类。第一类研究工作对基础三维人脸统计模型的基系数求解、损失函数设计等进行优化,提升重建效果,在人脸拓扑结构变化方面具备鲁棒性优势,但缺乏细节特征。第二类工作以显空间多种数据形式表示三维人脸并直接通过深度网络进行回归,通常可获得更加个性化的三维人脸细节特征且对光照、遮挡等干扰因素具有较好的鲁棒性。进一步,基于常用数据集和评价指标,充分探讨并比较了两类方法中一些典型方法的优缺点。最后对全文进行总结,并给出了单张图像三维人脸重建任务面临的主要挑战及未来发展趋势。
    参考文献 | 相关文章 | 多维度评价
    21. 深度学习在结肠息肉分割中的应用综述
    孙福艳, 王琼, 吕宗旺, 龚春艳
    计算机工程与应用    2023, 59 (23): 15-27.   DOI: 10.3778/j.issn.1002-8331.2303-0124
    摘要296)      PDF(pc) (626KB)(209)    收藏
    大部分结直肠癌起源于结肠息肉的恶性病变,使用计算机辅助诊断系统实现结肠息肉的自动精准分割具有重要的临床意义,能够在结肠镜检查过程中辅助医生提高息肉检出率。目前深度学习技术在医学图像分割领域应用广泛,基于深度学习的结肠息肉分割算法也取得了重大进展。简要介绍了传统息肉分割算法及其优点和局限性。重点从三个方面对深度学习息肉分割算法进行综述:基于经典CNN结构、基于U-Net结构和基于多模型融合的分割模型,并总结算法改进策略及其优势和局限性。归纳结肠息肉图像公开数据集及数据预处理方法,最后总结基于深度学习的息肉分割研究面临的挑战,并对该领域未来的研究方向做出展望。
    参考文献 | 相关文章 | 多维度评价
    22. 图卷积神经网络及其在图像识别领域的应用综述
    李文静, 白静, 彭斌, 杨瞻源
    计算机工程与应用    2023, 59 (22): 15-35.   DOI: 10.3778/j.issn.1002-8331.2302-0273
    摘要295)      PDF(pc) (803KB)(279)    收藏
    卷积神经网络被广泛应用于图像识别领域并且展现出强大的特征提取能力,但它只能处理欧氏空间的结构化数据,无法适用于非结构化数据的处理。为应对该限制,图卷积神经网络利用谱域和空域方法,拓展了卷积运算的范围,使其能够在非欧几里德空间中进行特征学习,具备图数据的平移不变性,可以实现对非结构化图数据的表征学习。首先阐述了基于频域和空域的两种类型图卷积神经网络的基本原理,并且介绍了相关的改进工作;然后围绕图像识别领域,重点介绍了图卷积神经网络在多标签图像识别、基于骨架的动作识别和高光谱图像分类中的具体应用,总结其研究的最新进展,并对相关的模型进行了性能对比与分析;最后对全文内容进行总结,并对未来的发展方向进行展望。
    参考文献 | 相关文章 | 多维度评价
    23. 结合Swin及多尺度特征融合的细粒度图像分类
    项剑文, 陈泯融, 杨百冰
    计算机工程与应用    2023, 59 (20): 147-157.   DOI: 10.3778/j.issn.1002-8331.2211-0456
    摘要289)      PDF(pc) (718KB)(178)    收藏
    针对细粒度图像类间差异小、类内差异大等问题,提出了一种基于Swin及多尺度特征融合的模型(SwinFC)。基准骨干网络采用具有多阶段层级架构设计的Swin Transformer模型作为全新视觉特征提取器,从中获取局部和全局信息以及多尺度特征。然后在每个阶段的分支通道上嵌入融合外部依赖及跨空间注意力模块,以捕获数据样本之间的潜在相关性,同时捕捉不同空间方向上具有判别力的特征信息,进而强化网络每个阶段的信息表征。进一步地,引入特征融合模块将每个阶段提取的特征进行多尺度融合,促使网络学习更加全面、互补且多样化的特征信息。最后构建特征选择模块来筛选重要且具有辨别力的图像块,以此增大类间差异,减小类内差异,增强模型的判别力。实验结果表明,该方法在CUB-200-2011、NABirds和WebFG-496三个公开细粒度图像数据集上分别达到了92.5%、91.8%和85.84%的分类准确率,性能优于大部分主流模型方法,并且与基准模型Swin相比,分别提高了1.4、2.6和4.86个百分点的分类性能。
    参考文献 | 相关文章 | 多维度评价
    24. 视频文本跨模态检索研究综述
    陈磊, 习怡萌, 刘立波
    计算机工程与应用    2024, 60 (4): 1-20.   DOI: 10.3778/j.issn.1002-8331.2306-0382
    摘要280)      PDF(pc) (3662KB)(267)    收藏
    模态代表着数据特定的存在形式,不同模态数据的快速增长,使得多模态学习受到广泛关注。跨模态检索作为多模态学习的一个重要分支,在图文方面已得到显著发展。然而视频相对于图像而言承载了更多模态的数据,也包含更广泛的信息,能够满足用户对信息检索全面性、灵活性的要求,近年来逐渐成为跨模态检索的研究热点。为全面认识和理解视频文本跨模态检索及其前沿工作,对现有代表性方法进行了梳理和综述。首先归纳分析了当前基于深度学习的单向、双向视频文本跨模态检索方法,对每类方法中的经典工作进行了详细分析并阐述了优缺点。接着从实验的角度给出视频文本跨模态检索的基准数据集和评价指标,并在多个常用基准数据集上比较了一些典型方法的性能。最后讨论了视频文本跨模态检索的应用前景、待解决问题及未来研究挑战。
    参考文献 | 相关文章 | 多维度评价
    25. 面向交通标志的Ghost-YOLOv8检测算法
    熊恩杰, 张荣芬, 刘宇红, 彭靖翔
    计算机工程与应用    2023, 59 (20): 200-207.   DOI: 10.3778/j.issn.1002-8331.2306-0032
    摘要276)      PDF(pc) (564KB)(180)    收藏
    针对当前传统网络模型对交通标志识别精度低、检测不准确的问题,提出一种基于YOLOv8n优化、改进的Ghost-YOLOv8交通标志检测模型。使用GhostConv代替部分Conv,设计全新的C2fGhost模块代替部分C2f,减少了模型的参数量,提升了模型的检测性能;在Neck部分添加GAM注意力机制模块,强化特征中的语义信息和位置信息,提高了模型的特征融合能力;针对检测小目标时尺度不一导致语义信息的丢失,添加小目标检测层,增强深层语义信息与浅层语义信息的结合;使用GIoU边界损失函数代替原损失函数,提升了网络的边界框回归性能。实验结果表明,改进的模型在中国交通标志检测数据集TT100K中的精确度(Precision)及平均精度均值(mAP)相较于原模型分别提高了9.5、6.5个百分点,模型的参数量及模型大小相比原模型分别降低了0.223×109、0.2?MB。综合说明,该模型在减少模型参数量及大小的同时提高了检测精度,显著优于对比算法,也满足边缘计算设备的要求,具有实际的应用价值。
    参考文献 | 相关文章 | 多维度评价
    26. 农业知识图谱研究综述
    唐闻涛, 胡泽林
    计算机工程与应用    2024, 60 (2): 63-76.   DOI: 10.3778/j.issn.1002-8331.2305-0203
    摘要270)      PDF(pc) (629KB)(201)    收藏
    知识图谱是大数据时代下知识工程的关键技术。利用知识图谱强大的语义理解和知识组织能力,可以解决现代化农业建设中农业知识分散无序、知识覆盖范围不足等问题针对农业领域数据复杂、专业性强等特点,给出了农业知识图谱的构建方法与框架;综述了农业知识图谱构建中本体构建、知识抽取、知识融合以及知识推理四个关键技术的国内外研究现状;系统梳理了农业知识图谱在决策支持、智能问答与推荐系统的应用;最后,介绍了几个具体的农业知识图谱实例。根据农业知识图谱的研究现状,对其未来的研究方向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    27. 图可视化布局方法最新研究进展综述
    杨卓, 谢雅淇, 陈谊, 战荫伟
    计算机工程与应用    2023, 59 (16): 1-15.   DOI: 10.3778/j.issn.1002-8331.2212-0068
    摘要268)      PDF(pc) (863KB)(182)    收藏
    图可视化是图数据的直观表示,随着图数据的广泛应用,合适的图可视化能够使用户对图数据的理解更加深入和高效。但随着图数据量级的增长,图可视化布局面临着计算时间长,难以发现图的重要结构和关系,以及节点遮挡和复杂的边交叉所产生的视觉杂乱等挑战。因此,如何快速对大规模图数据进行布局,如何强化对图中重要的结构和关系的探索,以及如何生成美观的图可视化布局成为亟需解决的问题。近年来,许多基于力学模型和美学评价标准的优化方法被提出来解决上述问题。另外,图挖掘、图嵌入、图神经网络等机器学习方法从图数据特点的角度,为解决图可视化的布局问题提供了新思路,相比之下,机器学习方法在布局效率和效果上表现出一定的优越性。主要从力导向算法、基于美学约束的布局方法、图挖掘技术和机器学习方法这四方面对图可视化布局的最新研究进展进行了阐述,最后对图可视化布局方法的未来发展进行了展望。
    参考文献 | 相关文章 | 多维度评价
    28. 在线课程推荐系统综述
    余鹏, 刘星雨, 程颢, 杨佳琦, 陈国华, 贺超波
    计算机工程与应用    2023, 59 (22): 1-14.   DOI: 10.3778/j.issn.1002-8331.2305-0162
    摘要264)      PDF(pc) (692KB)(207)    收藏
    在线教育的快速发展使得在线课程数量爆炸式增长,学习者很容易陷入“课程过载”带来的课程信息获取效率低下的问题,这推动了在线课程推荐系统的产生和发展。目前在线课程推荐系统已成为研究热点,并且在该领域中提出了大量方法,有必要对最新的研究进展进行系统的梳理分析。首先归纳总结在线课程推荐系统的基本框架和相关概念。然后重点对比分析现有在线课程推荐系统采用的各类核心推荐方法,其中包括基于关联规则挖掘、基于矩阵分解、基于概率模型、基于深度学习、基于智能优化、基于语义计算等类型的方法。最后介绍在线课程系统的各种评价指标和公开可用的数据集,并展望未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    29. 医学CT影像超分辨率深度学习方法综述
    田苗苗, 支力佳, 张少敏, 晁代福
    计算机工程与应用    2024, 60 (3): 44-60.   DOI: 10.3778/j.issn.1002-8331.2303-0224
    摘要261)      PDF(pc) (867KB)(187)    收藏
    图像超分辨率(SR)是计算机视觉领域提高图像分辨率的重要处理方法之一,在医学图像领域有重要的研究意义和应用价值。高质量和高分辨率的医学CT影像在当前的临床过程中非常重要。近年来,基于深度学习的医学CT影像超分辨率重建技术取得了显著的进展,对该领域内的代表性方法进行了梳理,系统回顾了医学CT影像超分辨率重建技术的发展。介绍了SR基本理论,给出常用的评价指标;重点阐述基于深度学习的医学CT影像超分辨率重建方向的创新与进展,对各个方法的主要特点和性能进行了综合比较分析。最后,讨论了医学CT影像超分辨率重建方向上存在的困难和挑战,并对未来的发展趋势进行了总结与展望,希望能为相关研究提供参考。
    参考文献 | 相关文章 | 多维度评价
    30. 改进YOLOv8的道路交通标志目标检测算法
    田鹏, 毛力
    计算机工程与应用    2024, 60 (8): 202-212.   DOI: 10.3778/j.issn.1002-8331.2309-0415
    摘要249)      PDF(pc) (937KB)(204)    收藏
    虽然,当前检测技术日趋成熟,但对于复杂环境下的小目标检测仍然是研究的重难点。针对道路交通场景中普遍存在的交通标志小目标比例较高,环境干扰因素较大的问题,提出了一种基于YOLOv8改进的道路交通标志目标检测算法。由于小目标检测中容易出现漏检的现象,利用BRA(bi-level routing attention)注意力机制提高网络对小目标的感知能力。此外,还利用可形变卷积模块DCNv3(deformable convolution v3),针对特征图中的不规则形状具有更好的特征提取能力,使骨干网络更好地适应不规则的空间结构,更精准地关注重要目标,从而提高模型对遮挡重叠目标的检测能力。DCNv3和BRA模块均在基本不增加模型权重大小的情况下提高模型准确性。同时引入基于辅助边框的Inner-IOU损失函数。在RoadSign、CCTSDB、TSDD、GTSDB四个数据集上,分别进行了小样本训练、大样本训练、单目标检测和多目标检测,实验结果均有所提高。其中,在RoadSign数据集上的实验结果最佳,YOLOv8改进模型的均值平均精度mAP50与mAP50:95分别达到了90.7%和75.1%,相较于基线模型,mAP50与mAP50:95分别提升了5.9和4.8个百分点。实验结果表明,YOLOv8改进模型有效地实现了在复杂道路场景下的交通标志检测。
    参考文献 | 相关文章 | 多维度评价
    31. 机器视觉在农作物种子检测中的研究进展
    王昊, 祝玉华, 李智慧, 甄彤
    计算机工程与应用    2023, 59 (22): 69-83.   DOI: 10.3778/j.issn.1002-8331.2303-0166
    摘要243)      PDF(pc) (858KB)(149)    收藏
    农作物种子是农业生产的基础。种子检测作为一种重要的手段,在种子生产、贸易和利用的各个环节都扮演着不可或缺的角色。然而传统的农作物种子识别方法效率低,需要人力以及专业检测设备的支持。相比之下,机器视觉技术能够通过模拟人的视觉功能来实现对目标的无损检测,效率高、准确度高,有助于实现农作物种子的品种识别、分级、分类的自动化、智能化。首先简单叙述了机器视觉技术中图像采集、预处理的方法,并以玉米种子为例给出了目前主流的处理流程,然后具体叙述了机器视觉技术中传统机器学习和深度学习两种检测方式在农作物种子检测中的应用,最后针对玉米不完善粒的研究,在分为以上两种检测方式进行具体叙述的同时,指出了目前存在的问题以及玉米不完善粒检测未来的研究方向。
    参考文献 | 相关文章 | 多维度评价
    32. 基于CNN图像增强的雾天跨域自适应目标检测
    郭迎, 梁睿琳, 王润民
    计算机工程与应用    2023, 59 (16): 187-195.   DOI: 10.3778/j.issn.1002-8331.2211-0132
    摘要242)      PDF(pc) (714KB)(156)    收藏
    针对自动驾驶车辆视觉感知系统在雾天条件下捕获图像质量较低,造成目标检测算法精度下降的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)图像增强的跨域自适应雾天目标检测方法。构建一个端到端目标检测网络,融合数字图像处理技术(digital image processing,DIP)和CNN的自适应图像增强模块,通过小型CNN参数预测器自适应学习增强参数,提升雾天图像质量;进一步地,将多尺度领域自适应(domain adaptive,DA)模块与YOLOv4主干网络相连,通过对抗训练减少由雾天造成的领域差异,提高雾天目标检测精度。在训练阶段,所提方法以端到端的方式学习CNN、DA模块以及YOLOv4,而在目标检测阶段将移除CNN及DA模块,仅使用预训练权重在正常天气和雾天天气自适应地检测图像,不会增加原有网络复杂性,从而保证自动驾驶车辆的实时性要求。在公开数据集Foggy Cityscapes上的实验表明,采用所提方法使雾天图像质量显著增强,目标检测平均精度提升了10.4%,有效提升了雾天条件下自动驾驶车辆对目标的识别能力。
    参考文献 | 相关文章 | 多维度评价
    33. 改进YOLOv8的多尺度轻量型车辆目标检测算法
    张利丰, 田莹
    计算机工程与应用    2024, 60 (3): 129-137.   DOI: 10.3778/j.issn.1002-8331.2309-0145
    摘要236)      PDF(pc) (713KB)(233)    收藏
    针对传统车辆目标检测模型设备需求高、检测精度低、重叠目标漏检率高等问题,提出了一种改进YOLOv8的车辆目标检测算法RBT-YOLO。采用多尺度融合的方式对主干网络进行重构。对BiFPN进行改进,增加卷积操作以及调整输入输出通道个数以适应YOLOv8,加强其特征融合能力。在Neck部分输出的特征图之后加入轻量型注意力机制Triplet Attention,提升模型的特征提取能力。针对真实情况下车辆目标重叠度较高的问题,使用SoftNMS(soft non-maximum suppression)替换原有NMS,使模型对候选框的处理方式更为温和,增强了模型对目标的检测能力,提升了召回率。在Pascal VOC和MS COCO数据集上进行实验,结果表明提出的RBT-YOLO性能超越原始模型,参数量和计算量下降60%左右,mAP分别提高了2.6和3.0个百分点,并在体积和精度上优于其他经典检测模型,具有很强的实用性。
    参考文献 | 相关文章 | 多维度评价
    34. 深度学习优化器进展综述
    常禧龙, 梁琨, 李文涛
    计算机工程与应用    2024, 60 (7): 1-12.   DOI: 10.3778/j.issn.1002-8331.2307-0370
    摘要236)      PDF(pc) (1327KB)(273)    收藏
    优化器是提高深度学习模型性能的关键因素,通过最小化损失函数使得模型的参数和真实参数接近从而提高模型的性能。随着GPT等大语言模型成为自然语言处理领域研究焦点,以梯度下降优化器为核心的传统优化器对大模型的优化效果甚微。因此自适应矩估计类优化器应运而生,其在提高模型泛化能力等方面显著优于传统优化器。以梯度下降、自适应梯度和自适应矩估计三类优化器为主线,分析其原理及优劣。将优化器应用到Transformer架构中,选取法-英翻译任务作为评估基准,通过实验深入探讨优化器在特定任务上的效果差异。实验结果表明,自适应矩估计类优化器在机器翻译任务上有效提高模型的性能。同时,展望优化器的发展方向并给出在具体任务上的应用场景。
    参考文献 | 相关文章 | 多维度评价
    35. 面向无人机视角下小目标检测的YOLOv8s改进模型
    潘玮, 韦超, 钱春雨, 杨哲
    计算机工程与应用    2024, 60 (9): 142-150.   DOI: 10.3778/j.issn.1002-8331.2312-0043
    摘要233)      PDF(pc) (5858KB)(333)    收藏
    从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(concentration-based attention module)注意力机制改进卷积模块,解决注意力权重参数在感受野特征中共享问题的同时,在通道和空间维度加上注意力权重,增强特征提取能力;通过引入大型可分离卷积注意力思想,改造空间金字塔池化层,增加不同层级特征间的信息交融;优化颈部结构,增加具有丰富小目标语义信息的特征层;使用inner-IoU损失函数的思想改进MPDIoU(minimum point distance based IoU)函数,以inner-MPDIoU代替原损失函数,提升对困难样本的学习能力。实验结果表明,改进后的YOLOv8s模型在VisDrone数据集上mAP、P、R分别提升了16.1%、9.3%、14.9%,性能超过YOLOv8m,可以有效应用于无人机平台上的目标检测任务。
    参考文献 | 相关文章 | 多维度评价
    36. 基于深度元学习的小样本图像分类研究综述
    周伯俊, 陈峙宇
    计算机工程与应用    2024, 60 (8): 1-15.   DOI: 10.3778/j.issn.1002-8331.2308-0271
    摘要228)      PDF(pc) (1091KB)(293)    收藏
    深度元学习是解决小样本分类问题的流行范式。对近年来基于深度元学习的小样本图像分类算法进行了详细综述。从问题的描述出发对基于深度元学习的小样本图像分类算法进行概括,并介绍了常用小样本图像分类数据集及评价准则;分别从基于模型的深度元学习方法、基于优化的深度元学习方法以及基于度量的深度元学习方法三个方面对其中的典型模型以及最新研究进展进行详细阐述。最后,给出了现有算法在常用公开数据集上的性能表现,总结了该课题中的研究热点,并讨论了未来的研究方向。
    参考文献 | 相关文章 | 多维度评价
    37. 联邦学习中的攻击手段与防御机制研究综述
    张世文, 陈双, 梁伟, 李仁发
    计算机工程与应用    2024, 60 (5): 1-16.   DOI: 10.3778/j.issn.1002-8331.2306-0243
    摘要228)      PDF(pc) (792KB)(256)    收藏
    联邦学习的攻防技术是联邦学习系统安全的核心问题。联邦学习的攻防技术能大幅降低联邦学习系统被攻击的风险,明显提升联邦学习系统的安全性。深入了解联邦学习的攻防技术,可以推进联邦学习领域的研究,实现联邦学习的广泛应用。因此,对联邦学习的攻防技术进行研究具有十分重要的意义。简要地介绍了联邦学习的概念、基本工作流程、类型及可能存在的安全问题;介绍联邦学习系统可能遭受到的攻击,梳理了相关研究;从联邦学习系统有无目标性的防御措施出发,将防御措施分为通用性防御措施及针对性防御措施两类,并对其进行了针对性的总结;对联邦学习安全性未来的研究方向进行了梳理与分析,为相关研究者在联邦学习安全性方面的研究工作提供了参考。
    参考文献 | 相关文章 | 多维度评价
    38. 融合改进YOLOv5及Mediapipe的手势识别研究
    倪广兴, 徐华, 王超
    计算机工程与应用    2024, 60 (7): 108-118.   DOI: 10.3778/j.issn.1002-8331.2308-0097
    摘要226)      PDF(pc) (686KB)(191)    收藏
    针对现有手势识别算法计算量大、鲁棒性差等问题,提出一种基于IYOLOv5-Med(improved YOLOv5 Mediapipe)算法的手势识别方法。该算法将改进的YOLOv5算法和Mediapipe方法结合,包括手势检测和手势分析两部分,算法有效降低了训练的时间成本,增加了识别的鲁棒性。手势检测部分,改进了传统YOLOv5算法,利用FastNet重构C3模块,将CBS模块替换为GhostNet中GhostConv模块,在Backbone网络末端加入SE注意力机制模块,改进后的算法,模型体积更小,更适用于资源有限的边缘设备。手势分析部分,提出了一种基于Mediapipe的方法,对手势检测部分定位到的手势区域进行手部关键点检测,并提取相关特征,然后通过朴素贝叶斯分类器进行识别。实验结果证实了提出的IYOLOv5-Med算法的有效性,与传统YOLOv5算法相比,参数量下降34.5%,计算量减少34.9%,模型权重降低33.2%,最终平均识别率达到0.997,且实现方法相对简单,有较好的应用前景。
    参考文献 | 相关文章 | 多维度评价
    39. 改进YOLOv8的航拍图像小目标检测算法
    付锦燚, 张自嘉, 孙伟, 邹凯鑫
    计算机工程与应用    2024, 60 (6): 100-109.   DOI: 10.3778/j.issn.1002-8331.2311-0281
    摘要225)      PDF(pc) (771KB)(208)    收藏
    针对在航拍图像检测任务中,物体和整体图像尺寸都比较小,尺度特征不一和细节信息不清晰,会造成漏检和误检等问题,提出了一种改进小目标检测算法CA-YOLOv8。设计了一种通道特征部分卷积模块CFPConv(channel feature partial convolution),基于此重新构造了C2f中的Bottleneck结构,命名为CFP_C2f,从而替换YOLOv8头部和颈部的部分C2f模块,增强有效通道特征权值,提升多尺度细节特征的获取能力。嵌入一种用以提升上下文聚合能力的模块CAM(context aggregated module),优化特征通道的响应,强化对深层特征的细节感知能力。添加NWD损失函数,将其与CIoU结合作为定位回归损失函数,降低位置偏差的敏感性。充分运用多重注意力机制的优势,把原有检测头替换为DyHead(dynamic head)。在VisDrone2019数据集的实验中,改进的算法较YOLOv8s原模型参数量降低了33.3%,检测精度mAP50值和mAP50:95分别提升了8.7和5.7个百分点,表现出良好的性能,验证了其有效性。
    参考文献 | 相关文章 | 多维度评价
    40. 改进YOLOv5s的复杂交通场景路侧目标检测算法
    杨睿宁, 惠飞, 金鑫, 侯瑞宇
    计算机工程与应用    2023, 59 (16): 159-169.   DOI: 10.3778/j.issn.1002-8331.2304-0090
    摘要221)      PDF(pc) (793KB)(146)    收藏
    针对传统路侧目标检测模型存在的对于行人、非机动车、受遮挡车辆等小目标检测精度低以及模型体积过大的问题,提出了一种基于改进YOLOv5s的路侧目标检测模型。使用EIoU Loss替换原始的CIoU Loss作为目标边界框的回归损失函数,在加快预测框回归损失函数收敛速度的同时提升了预测框的回归预测精度;使用轻量级的通用上采样算子CARAFE替换原始的最近邻插值上采样模块,减少了上采样过程中特征信息的损失;在原始的三尺度检测层的基础上新添加一层检测尺度更小的小目标检测分支,并提出了一种高效的解耦预测头对不同尺度的检测层进行解耦,进一步提升了模型对于小目标的检测能力;对改进后的模型进行通道剪枝,剪除对于检测效果影响不大的冗余通道,降低模型体积,使得模型更加适用于资源受限条件下的路侧目标检测任务。在路侧目标检测数据集DAIR-V2X-I上的实验结果表明,相较于原始YOLOv5s算法,改进后的算法在模型体积减小5.7?MB的基础上,mAP50、mAP50:95分别提高了2.5个百分点和3.8个百分点,达到了90.3%、67.7%,检测速度也达到了89?FPS。与其他主流的目标检测算法在检测精度、模型体积以及检测速度上相比有一定的优势,改进后的算法适用于复杂交通场景下的路侧目标检测任务。
    参考文献 | 相关文章 | 多维度评价