摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 一年内发表文章
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 小样本困境下的图像语义分割综述
    韦婷, 李馨蕾, 刘慧
    计算机工程与应用    2023, 59 (2): 1-11.   DOI: 10.3778/j.issn.1002-8331.2205-0496
    摘要616)      PDF(pc) (4301KB)(456)    收藏
    近年来,由于大规模数据集的出现,图像语义分割技术得到快速发展。但在实际场景中,并不容易获取到大规模、高质量的图像,图像的标注也需要消耗大量的人力和时间成本。为了摆脱对样本数量的依赖,小样本语义分割技术逐渐成为研究热点。当前小样本语义分割的方法主要利用了元学习的思想,按照不同的模型结构可划分为基于孪生神经网络、基于原型网络和基于注意力机制三大类。基于近年来小样本语义分割的发展现状,介绍了小样本语义分割各类方法的发展及优缺点,以及小样本语义分割任务中常用的数据集及实验设计。在此基础上,总结了小样本语义分割技术的应用场景及未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    2. 融合注意力机制的轻量级戴口罩人脸识别算法
    叶子勋, 张红英, 何昱均
    计算机工程与应用    2023, 59 (3): 166-174.   DOI: 10.3778/j.issn.1002-8331.2206-0222
    摘要458)      PDF(pc) (707KB)(82)    收藏
    COVID-19的全球化大流行使得佩戴口罩出行成为人们生活中的常态,这种防疫措施给人脸识别算法带来了新的挑战。针对这一问题,提出了一种口罩遮挡下的轻量级人脸识别算法,该算法改进GhostNet为主干特征提取网络;提出了融合空间注意力机制的FocusNet特征加强提取网络,使模型聚焦于未被口罩遮挡的上半脸区域;针对当前口罩遮挡人脸数据集不充分的问题,提出了一种采用三维人脸网络生成添加口罩遮挡的数据增强方法。实验表明,所提出的改进模型与基准模型相比,模型参数量降低84%的同时,戴口罩人脸的识别率提升4.29个百分点,较好地平衡了速度与精度。
    参考文献 | 相关文章 | 多维度评价
    3. 基于Transformer的目标检测算法综述
    李建, 杜建强, 朱彦陈, 郭永坤
    计算机工程与应用    2023, 59 (10): 48-64.   DOI: 10.3778/j.issn.1002-8331.2211-0133
    摘要442)      PDF(pc) (875KB)(257)    收藏
    深度学习框架Transformer具有强大的建模能力和并行计算能力,目前基于Transformer的目标检测算法已经成为研究的热点。为了进一步探索目标检测的新思路、新方向,对基于Transformer的目标检测算法进行了归纳总结。概述了多种目标检测数据集及其应用场景,从特征学习、目标估计、标签匹配策略和算法应用四方面梳理了Transformer目标检测的相关算法,并与基于卷积神经网络的目标检测算法进行对比,分析了Transformer在目标检测任务中的优点和局限性,并提出了Transformer目标检测模型的一般性框架。对Transformer在目标检测领域中的发展趋势进行了展望。
    参考文献 | 相关文章 | 多维度评价
    4. Transformer在计算机视觉领域的研究综述
    李翔, 张涛, 张哲, 魏宏杨, 钱育蓉
    计算机工程与应用    2023, 59 (1): 1-14.   DOI: 10.3778/j.issn.1002-8331.2204-0207
    摘要440)      PDF(pc) (1285KB)(320)    收藏
    Transformer是一种基于自注意力机制的深度神经网络。近几年,基于Transformer的模型已成为计算机视觉领域的热门研究方向,其结构也在不断改进和扩展,比如局部注意力机制、金字塔结构等。通过对基于Transformer结构改进的视觉模型,分别从性能优化和结构改进两个方面进行综述和总结;也对比分析了Transformer和CNN各自结构的优缺点,并介绍了一种新型的CNN+Transformer的混合结构;最后,对Transformer在计算机视觉上的发展进行总结和展望。
    参考文献 | 相关文章 | 多维度评价
    5. 深度强化学习求解车辆路径问题的研究综述
    杨笑笑, 柯琳, 陈智斌
    计算机工程与应用    2023, 59 (5): 1-13.   DOI: 10.3778/j.issn.1002-8331.2210-0153
    摘要439)      PDF(pc) (1036KB)(302)    收藏
    车辆路径问题(VRP)是组合优化问题中经典的NP难问题,广泛应用于交通、物流等领域,随着问题规模和动态因素的增多,传统算法很难快速、智能地求解复杂的VRP问题。近年来随着人工智能技术的发展,尤其是深度强化学习(DRL)在AlphaGo中的成功应用,为路径问题求解提供了全新思路。鉴于此,针对近年来利用DRL求解VRP及其变体问题的模型进行文献综述。回顾了DRL求解VRP的相关思路,并梳理基于DRL求解VRP问题的关键步骤,对基于指针网络、图神经网络、Transformer和混合模型的四类求解方法分类总结,同时对目前基于DRL求解VRP及其变体问题的模型性能进行对比分析,总结了基于DRL求解VRP问题时遇到的挑战以及未来的研究方向。
    参考文献 | 相关文章 | 多维度评价
    6. 基于深度学习的相机位姿估计方法综述
    王静, 金玉楚, 郭苹, 胡少毅
    计算机工程与应用    2023, 59 (7): 1-14.   DOI: 10.3778/j.issn.1002-8331.2209-0280
    摘要422)      PDF(pc) (702KB)(264)    收藏
    相机位姿估计是指在已知环境下精确地估计相机在世界坐标系中六自由度位姿的技术,该技术是机器人技术和自动驾驶中的关键技术。随着深度学习的飞速发展,使用深度学习来优化相机位姿估计算法已经成为了当前的研究热点之一。为了掌握目前相机位姿估计算法的研究现状与趋势,对基于深度学习的相机位姿估计的主流算法进行了综述。简单介绍了传统的基于特征点的相机位姿估计方法。重点介绍了基于深度学习的方法:根据核心算法的不同,从端到端的相机位姿估计、场景坐标回归、基于检索的相机位姿估计、层级结构、多信息融合和跨场景的相机位姿估计六个方面进行了详细的阐述和分析。对研究现状进行了总结,并基于深入的性能分析指出了相机位姿估计领域面临的挑战,展望了其发展动向。
    参考文献 | 相关文章 | 多维度评价
    7. 改进YOLOv5的无人机影像小目标检测算法
    谢椿辉, 吴金明, 徐怀宇
    计算机工程与应用    2023, 59 (9): 198-206.   DOI: 10.3778/j.issn.1002-8331.2212-0336
    摘要380)      PDF(pc) (808KB)(253)    收藏
    无人机航拍影像具有目标尺度变化大、背景复杂等诸多特性,导致现有的检测器难以检测出航拍影像中的小目标。针对无人机影像中小目标误检漏检的问题,提出了改进YOLOv5的算法模型Drone-YOLO。增加了检测分支以提高模型在多尺度下的检测能力。设计了多层次信息聚合的特征金字塔网络结构,实现跨层次信息的融合。设计了基于多尺度通道注意力机制的特征融合模块,提高对小目标的关注度。将预测头的分类任务与回归任务解耦,使用Alpha-IoU优化损失函数定义,提升模型检测的效果。通过无人机影像数据集VisDrone的实验结果表明,Drone-YOLO模型较YOLOv5模型在AP50指标上提高了4.91个百分点,推理延时仅需16.78?ms。对比其他主流模型对于小目标拥有更好的检测效果,能够有效完成无人机航拍影像的小目标检测任务。
    参考文献 | 相关文章 | 多维度评价
    8. 图像边缘检测综述
    肖扬, 周军
    计算机工程与应用    2023, 59 (5): 40-54.   DOI: 10.3778/j.issn.1002-8331.2209-0122
    摘要356)      PDF(pc) (921KB)(187)    收藏
    边缘检测的任务是将亮度变化明显的像素点识别为目标边缘,是计算机视觉低层级问题,并且边缘检测在对象识别和检测、对象提议生成、图像分割有着重要应用。如今,边缘检测已经产生了多类方法,如基于梯度的传统检测方法、基于深度学习的边缘检测算法,还有结合新兴技术的检测方法等。对这些方法进行更精细的分类,让研究者更清楚地了解边缘检测的发展趋势。对传统边缘检测的理论依据及实现方法做出介绍;详细介绍近年来主要的深度学习边缘检测方法,根据使用的方法进行分类,并对其中所使用的创新技术进行说明,如分支结构、特征融合和损失函数。衡量算法性能采用评估指标:单图最佳阈值(ODS)和帧数(FPS),在基础数据集(BSDS500)上进行对比。对边缘检测的研究现状进行分析和总结,对未来可能的研究方向进行展望。
    参考文献 | 相关文章 | 多维度评价
    9. 基于深度学习和Transformer的目标检测算法
    付苗苗, 邓淼磊, 张德贤
    计算机工程与应用    2023, 59 (1): 37-48.   DOI: 10.3778/j.issn.1002-8331.2205-0354
    摘要351)      PDF(pc) (947KB)(221)    收藏
    目标检测是实现目标跟踪、实例分割等高级视觉任务的基础,在智慧交通、缺陷检测、智能安防等现实场景有着重要应用。现有高精度检测算法都是在深度学习的指导下实现,同时伴有锚框技术,但是锚框自身的不足对检测器性能有着较大影响,无锚点碰撞检测成为了近几年目标检测领域新的研究方向。与此同时,Transformer表现出的巨大潜力为视觉领域开辟了图像与Transformer结合这个新方向,基于Transformer的目标检测也成为一个新的研究热点。系统地总结了深度学习时代的目标检测算法,调查并研究了近五年目标检测的相关论文,重点从Anchor-free和Transformer两个角度对这些算法进行深入分析,介绍了这些算法在现实场景具体应用情况以及目标检测领域常用数据集,基于目前的研究现状对目标检测的未来可研究方向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    10. 基于深度域适应的跨域目标检测算法综述
    刘华玲, 皮常鹏, 赵晨宇, 乔梁
    计算机工程与应用    2023, 59 (8): 1-12.   DOI: 10.3778/j.issn.1002-8331.2210-0063
    摘要348)      PDF(pc) (583KB)(260)    收藏
    近年来,基于深度学习的目标检测算法在自动驾驶、人机交互等众多域上有着成功的应用,且因其检测性能较高引起学者的广泛关注。传统的深度学习方法一般基于源域与目标域服从同一分布的假设,但该假设不具备现实性,严重地降低了模型的泛化性能。如何对齐源域与目标域的分布,提高目标检测模型的泛化性成为近两年的研究热点。对跨域目标检测算法进行了综述,介绍了跨域目标检测的预备知识:深度域适应和目标检测,将跨域目标检测分解为两个子问题进行了概述,从底层逻辑理解其发展进程;给出了跨域目标检测算法的最新进展,从差异、对抗、重构、混合和其他等几个分类角度切入,梳理了每个类别的研究脉络并对比了在不同数据集上的性能;通过对目前跨域目标检测算法的梳理和总结,就其未来的研究方向进行展望。
    参考文献 | 相关文章 | 多维度评价
    11. YOLO系列目标检测算法研究进展
    王琳毅, 白静, 李文静, 蒋金哲
    计算机工程与应用    2023, 59 (14): 15-29.   DOI: 10.3778/j.issn.1002-8331.2301-0081
    摘要337)      PDF(pc) (1009KB)(282)    收藏
    YOLO算法是目标检测中研究的热点方向之一。近几年,随着YOLO系列算法及其改进模型的不断提出,使其在目标检测领域取得了优异的成绩,被广泛应用于现实中各个领域。针对YOLO系列目标检测算法,整理了目标检测典型数据集及评价指标;回顾了YOLO整体框架以及YOLOv1~YOLOv7目标检测算法的发展历程;总结了在输入、特征提取和预测这三个阶段下的数据增强、轻量化网络构建和IOU损失优化等八个改进方向的模型及性能;介绍了YOLO算法应用领域;结合目标检测目前存在的实际问题,总结并展望了YOLO算法的发展方向。
    参考文献 | 相关文章 | 多维度评价
    12. 视觉Transformer在医学图像分析中的应用研究综述
    石磊, 籍庆余, 陈清威, 赵恒毅, 张俊星
    计算机工程与应用    2023, 59 (8): 41-55.   DOI: 10.3778/j.issn.1002-8331.2206-0022
    摘要321)      PDF(pc) (869KB)(215)    收藏
    深度自注意力网络(Transformer)对输入信息全局特征和长距离相关性具有天然良好的建模能力,其与卷积神经网络(CNN)的归纳偏置特性具有较强互补性。受其在自然语言处理领域取得巨大成功的启发,Transformer已被广泛引入到计算机视觉各项任务特别是医学图像分析领域并已取得了不俗表现。对Transformer与自然图像结合的典型工作进行介绍,根据视觉Transformer在医学图像分割、医学图像分类以及医学图像配准等子领域对相关工作按照不同病灶及部位进行了整理和归纳,重点对一些代表性研究工作的实现思想进行了详细分析。对现有研究工作进行了讨论并对未来方向进行了展望,以期为该领域的进一步深入研究提供参考。
    参考文献 | 相关文章 | 多维度评价
    13. 对话情绪识别综述
    陈晓婷, 李实
    计算机工程与应用    2023, 59 (3): 33-48.   DOI: 10.3778/j.issn.1002-8331.2207-0417
    摘要310)      PDF(pc) (681KB)(139)    收藏
    对话情绪识别是情感计算领域的一个热门研究课题,旨在检测对话过程中每个话语的情感类别。其在对话理解和对话生成方面具有重要的研究意义,同时在社交媒体分析、推荐系统、医疗和人机交互等诸多领域具有广泛的实际应用价值。随着深度学习技术的不断创新和发展,对话情绪识别受到学术界和工业界越来越多的关注,现阶段需要综述性的文章对已有研究成果进行总结,以便更好地开展后续工作。从问题定义、问题切入方式、研究方法、主流数据集等多个角度对该领域的研究成果进行全面梳理,回顾和分析了对话情绪识别任务的发展。对话文本中含有丰富的语义信息,结合视频和音频可以进一步提升建模效果,因此,重点对文本对话情绪识别以及多模态对话情绪识别的方法进行了梳理,立足于当前研究现状,总结了现有对话情绪识别领域存在的开放问题以及未来的发展趋势。
    参考文献 | 相关文章 | 多维度评价
    14. 改进YOLOv5的遥感图像目标检测算法
    李坤亚, 欧鸥, 刘广滨, 于泽峰, 李林
    计算机工程与应用    2023, 59 (9): 207-214.   DOI: 10.3778/j.issn.1002-8331.2209-0119
    摘要309)      PDF(pc) (665KB)(231)    收藏
    针对遥感图像中背景复杂度高、目标尺寸多样和小目标存在过多所导致的目标检测精度较低的问题,提出一种改进YOLOv5的遥感图像目标检测算法。该算法在主干网络引入通道-全局注意力机制(CGAM)以增强对不同尺度目标的特征提取能力和抑制冗余信息的干扰。引入密集上采样卷积(DUC)模块扩张低分辨率卷积特征图,有效增强不同卷积特征图的融合效果。将改进算法应用于公开遥感数据集RSOD中,改进YOLOv5算法平均精度AP值达到78.5%,较原算法提升了3.1个百分点。实验结果证明,改进后的算法能有效提高遥感图像目标检测精度。
    参考文献 | 相关文章 | 多维度评价
    15. 个性化学习中学科知识图谱构建与应用综述
    赵宇博, 张丽萍, 闫盛, 侯敏, 高茂
    计算机工程与应用    2023, 59 (10): 1-21.   DOI: 10.3778/j.issn.1002-8331.2209-0345
    摘要309)      PDF(pc) (929KB)(253)    收藏
    学科知识图谱是依赖大数据、人工智能等技术构建的支持教学活动的重要工具,作为一种学科知识语义网络,能够助力个性化学习体系的发展并促进数字教育资源新基建。对知识图谱的概念、分类等内容进行概述;总结了学科知识图谱的概念、特点、优势、内涵及其对个性化学习的支持等内容;重点梳理了学科知识图谱的构建流程:学科本体构建、学科知识抽取、学科知识融合以及学科知识加工,并介绍了学科知识图谱在个性化学习情境中的应用及其面临的挑战;展望了学科知识图谱以及个性化学习的未来趋势,为教育资源的组织方式及个性化学习的创新发展提供借鉴和启示。
    参考文献 | 相关文章 | 多维度评价
    16. 利用知识图谱的推荐系统研究综述
    张明星, 张骁雄, 刘姗姗, 田昊, 杨琴琴
    计算机工程与应用    2023, 59 (4): 30-42.   DOI: 10.3778/j.issn.1002-8331.2209-0033
    摘要297)      PDF(pc) (702KB)(183)    收藏
    随着互联网的快速发展,如何从海量数据中筛选实际需要的信息变得尤为重要。推荐系统作为一种信息过滤的方法,旨在为用户推荐个性化内容。传统推荐算法中普遍存在数据稀疏和冷启动问题,近年来,研究者利用知识图谱中丰富的实体与关系信息,不仅能够缓解以上问题,同时增强了推荐系统的整体性能。利用知识图谱的推荐系统研究主要包括三方面内容:介绍推荐系统和知识图谱的基本概念,指出现有推荐算法的不足之处;根据不同核心技术详细分析利用知识图谱的推荐系统研究现状,评估不同方法的技术优势与挑战;总结相关应用场景和数据集信息,并展望未来发展前景。
    参考文献 | 相关文章 | 多维度评价
    17. 水果采摘机器人视觉系统与机械手研究进展
    苟园旻, 闫建伟, 张富贵, 孙成宇, 徐勇
    计算机工程与应用    2023, 59 (9): 13-26.   DOI: 10.3778/j.issn.1002-8331.2209-0183
    摘要296)      PDF(pc) (787KB)(184)    收藏
    水果采摘机器人对实现水果装备自动化智能化具有重要意义。对近年国内外水果采摘机器人领域关键技术研究工作进行总结,根据水果采摘机器人的重要组成结构与关键技术,对水果采摘机器人视觉系统的关键技术:传统基于水果特征的图像分割方法如阈值法、边缘检测法、基于颜色特征的聚类算法与基于区域的图像分割算法,基于深度学习的目标识别算法以及目标果实的定位等进行分析和对比;总结了水果采摘机器人机械臂与末端执行器的技术发展现状,指出水果采摘机器人存在的问题;对未来水果采摘机器人的发展趋势及方向进行了展望,可为水果采摘机器人相关研究提供参考。
    参考文献 | 相关文章 | 多维度评价
    18. 深度长时目标跟踪算法综述
    梁义涛, 韩永波, 李磊
    计算机工程与应用    2023, 59 (4): 1-17.   DOI: 10.3778/j.issn.1002-8331.2206-0507
    摘要290)      PDF(pc) (918KB)(216)    收藏
    在视觉目标跟踪领域,长时跟踪因存在更为复杂的遮挡、相似物干扰和目标消失等具有现实意义的挑战场景,而越来越被研究者所重视。传统长时跟踪算法存在精度低和效率低等问题,已经无法满足如视频监控和自动驾驶等领域对跟踪器性能的应用需求。目前,大量的研究工作通过引入深度神经网络快速推动了长时跟踪技术的发展。为了深入分析深度长时跟踪算法的现状与未来发展,通过对比长短时跟踪数据集及评价指标,初步界定了长时跟踪任务范畴,归纳了长时跟踪任务的需求和难点,并介绍了长时跟踪数据集及评价体系的发展。基于深度长时目标跟踪算法的设计框架,详细描述了框架各组成部分的设计思路。以长时跟踪策略为切入点深入分析了现有研究工作,归纳了不同模型的优缺点及特性。依据对现有研究工作的整理和总结,讨论了该领域面临的挑战,并对未来的发展方向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    19. 深度学习的目标检测算法改进综述
    杨锋, 丁之桐, 邢蒙蒙, 丁波
    计算机工程与应用    2023, 59 (11): 1-15.   DOI: 10.3778/j.issn.1002-8331.2209-0312
    摘要290)      PDF(pc) (691KB)(224)    收藏
    目标检测是当下计算机视觉领域的研究热点,随着深度学习的发展,基于深度学习的目标检测算法的应用越来越多,性能也不断被提升,通过总结目标检测过程中遇到的常见难题以及相应的改进方法,梳理了基于深度学习的目标检测方法的最新研究进展,重点针对基于深度学习目标检测算法的两大类型进行综述。此外还从注意力机制、轻量型网络、多尺度检测等方面对目标检测算法的最新改进思路进行总结梳理。针对当前目标检测领域存在的问题,对其未来的发展趋势进行展望,并提出可行的解决方案,以期为该领域后续的研究工作提供可借鉴的思路和方向。
    参考文献 | 相关文章 | 多维度评价
    20. 图神经网络及其在图像处理领域的研究进展
    蒋玉英, 陈心雨, 李广明, 王飞, 葛宏义
    计算机工程与应用    2023, 59 (7): 15-30.   DOI: 10.3778/j.issn.1002-8331.2205-0503
    摘要281)      PDF(pc) (659KB)(140)    收藏
    图神经网络(graph neural network,GNN)是一种基于深度学习的图结构数据处理模型,因良好的可解释性和对图结构数据强大的非线性拟合能力而受到研究者广泛关注。随着GNN的逐步优化,GNN与图像处理技术实现融合发展,在图像分类、人体解析和视觉问答等方面取得重大突破。对图像处理技术和传统神经网络理论进行介绍,并对五类GNN的原理、特点和不足进行分析与总结;同时从数据集和性能评估指标两个角度对文中所述的常用模型进行对比与总结,并补充介绍了九种常见的图像处理领域公共数据集;最后深入分析了GNN在图像处理领域中有待改进的方面,并对其应用前景进行展望。
    参考文献 | 相关文章 | 多维度评价
    21. 深度多模态表示学习的研究综述
    潘梦竹, 李千目, 邱天
    计算机工程与应用    2023, 59 (2): 48-64.   DOI: 10.3778/j.issn.1002-8331.2206-0145
    摘要279)      PDF(pc) (6521KB)(220)    收藏
    尽管深度学习因为强大的非线性表示能力已广泛应用于许多领域,多源异构模态数据间结构和语义上的鸿沟严重阻碍了后续深度学习模型的应用。虽然已经有许多学者提出了大量的表示学习方法以探索不同模态间的相关性和互补性,并提高深度学习预测和泛化性能。然而,多模态表示学习研究还处于初级阶段,依然存在许多科学问题尚需解决。迄今为止,多模态表示学习仍缺乏统一的认知,多模态表示学习研究的体系结构和评价指标尚不完全明确。根据不同模态的特征结构、语义信息和表示能力,从表示融合和表示对齐两个角度研究和分析了深度多模态表示学习的进展,并对现有研究工作进行了系统的总结和科学的分类。同时,解析了代表性框架和模型的基本结构、应用场景和关键问题,分析了深度多模态表示学习的理论基础和最新发展,并且指出了多模态表示学习研究当前面临的挑战和今后的发展趋势,以进一步推动深度多模态表示学习的发展和应用。
    参考文献 | 相关文章 | 多维度评价
    22. CoT-TransUNet:轻量化的上下文Transformer医学图像分割网络
    杨鹤, 柏正尧
    计算机工程与应用    2023, 59 (3): 218-225.   DOI: 10.3778/j.issn.1002-8331.2205-0046
    摘要277)      PDF(pc) (645KB)(155)    收藏
    针对以往医学图像分割网络中卷积的感受野太小以及Transformer的特征丢失问题,提出了一种端到端的轻量化上下文Transformer医学图像分割网络(lightweight context Transformer medical image segmentation network,CoT-TransUNet)。该网络由编码器、解码器以及跳跃连接三部分组成。对于输入图像,编码器使用CoTNet-Transformer的混合模块,采用CoTNet作为特征提取器来生成特征图。Transformer块则把特征图编码为输入序列。解码器通过一个级联上采样器,将编码后的特征进行上采样。该上采样器级联了多个上采样块,每个上采样块都采用CARAFE上采样算子。通过跳跃连接实现编码器与解码器在不同分辨率上的特征聚合。CoT-TransUNet通过在特征提取阶段采用全局与局部上下文信息相结合的CoTNet;在上采样阶段采用具有更大感受野的CARAFE算子。实现了生成更好的输入特征图,以及基于内容的上采样,并保持轻量化。在多器官分割任务的实验中,CoT-TransUNet取得了优于其他网络的性能。
    参考文献 | 相关文章 | 多维度评价
    23. 基于脑电时频空多域特征融合的情感识别研究
    王璐, 梁明晶, 石慧宇, 温昕, 曹锐
    计算机工程与应用    2023, 59 (4): 191-196.   DOI: 10.3778/j.issn.1002-8331.2109-0083
    摘要277)      PDF(pc) (642KB)(98)    收藏
    传统基于脑电信号(electroencephalogram,EEG)的情感识别主要采用单一的脑电特征提取方法,为了充分利用EEG中蕴含的丰富信息,提出一种多域特征融合的脑电情感识别新方法。提取了EEG的时域、频域和空域特征,将三域特征进行融合作为情感识别模型的输入。首先计算不同时间窗EEG信号的alpha、beta、gamma三个频段功率谱密度,并结合脑电电极空间信息构成EEG图片,然后利用卷积神经网络(convolutional neural network,CNN)与双向长短期记忆网络(bidirectional long short-term memory network,BLSTM)构建CNN-BLSTM情感识别模型,分别对时、频、空三域特征进行学习。在SEED数据集对该方法进行验证,结果表明该方法能有效提高情感识别精度,平均识别准确率达96.25%。
    参考文献 | 相关文章 | 多维度评价
    24. FS-YOLOv5:轻量化红外目标检测方法
    黄磊, 杨媛, 杨成煜, 杨威, 李耀华
    计算机工程与应用    2023, 59 (9): 215-224.   DOI: 10.3778/j.issn.1002-8331.2210-0487
    摘要270)      PDF(pc) (815KB)(197)    收藏
    针对传统目标识别算法复杂场景下的道路目标识别精度低、实时性差、小目标检测难度大等问题,提出了基于红外场景下FS-YOLOv5轻量化模型。采用单阶段目标检测网络YOLOv5s作为基础网络,提出了一种新的FS-MobileNetV3网络代替原网络中的CSPDarknet主干网络来提取特征图像;在原网络CIoU损失函数的基础上引入Power变换,替换为α-CIoU,提高网络对小目标的检测能力;将K-means++聚类算法应用在FLIR红外数据集上重新生成Anchor,最后利用DIoU-NMS替换原网络的NMS后处理方法,改善对遮挡物体的检测能力,降低了模型的漏检率。通过在FLIR红外数据集上的消融实验验证了FS-YOLOv5轻量化算法满足红外场景下的道路目标检测任务,与原网络相比,在平均精度仅降低0.37个百分点的前提下,FS-YOLOv5模型的大小减少了26%,参数量减少了29%,检测速度提升了11?FPS,满足了在不同场景下移动端部署的需求。
    参考文献 | 相关文章 | 多维度评价
    25. 深度学习在安全帽佩戴检测中的应用研究综述
    高腾, 张先武, 李柏
    计算机工程与应用    2023, 59 (6): 13-29.   DOI: 10.3778/j.issn.1002-8331.2207-0434
    摘要262)      PDF(pc) (832KB)(168)    收藏
    在深度学习的推动下,目标检测方法在工业安防领域取得了很大的进展,安全帽佩戴检测任务逐渐成为智能图像识别领域的一项重要研究课题。为了综合分析深度学习技术在安全帽佩戴检测任务中的研究现状,方便后续科研人员开展研究性工作。对近年来国内外学者在深度学习环境下的安全帽佩戴检测算法总结归纳,对比分析这些方法的优点和局限性。分别从数据集的建立和用途、安全帽佩戴检测主要检测算法归纳、当前安全帽佩戴检测领域的难点这三个方面进行分析。对安全帽佩戴检测领域未来的研究方向进行展望,并提出该领域今后研究重点。
    参考文献 | 相关文章 | 多维度评价
    26. 道路交通流数据预测方法研究综述
    孟闯, 王慧, 林浩, 李科岑, 王鑫鹏
    计算机工程与应用    2023, 59 (14): 51-61.   DOI: 10.3778/j.issn.1002-8331.2209-0458
    摘要261)      PDF(pc) (605KB)(133)    收藏
    道路交通流预测作为智能交通系统中的重要分支,在道路拥堵预测、路径规划等方面起着重要作用。道路交通流数据时空多态、关联性复杂的特性迫使大数据时代下的道路交通流预测方法转型和升级。为了深入挖掘交通流时空性的特征,学者们相继提出各类方法,包括模型融合、模型算法改进、数据定义转换等方式,以求提高模型的预测精度。为了合理综述各类交通流的预测方法,根据所用方法的种类分为三大类:基于统计学的方法、基于机器学习的方法、基于深度学习的方法。通过综述各类交通流预测方法,对近年来新出现的模型与算法进行概括与分析,旨在为相关研究学者提供研究思路。对交通流预测方法进行了总结及展望,给出未来交通流预测领域的探索方向。
    参考文献 | 相关文章 | 多维度评价
    27. 使用Conformer增强的混合CTC/Attention端到端中文语音识别
    陈戈, 谢旭康, 孙俊, 陈祺东
    计算机工程与应用    2023, 59 (4): 97-103.   DOI: 10.3778/j.issn.1002-8331.2111-0462
    摘要260)      PDF(pc) (568KB)(95)    收藏
    最近,基于自注意力的Transformer结构在不同领域的一系列任务上表现出非常好的性能。探索了基于Transformer编码器和LAS(listen,attend and spell)解码器的Transformer-LAS语音识别模型的效果,并针对Transformer不善于捕捉局部信息的问题,使用Conformer代替Transformer,提出Conformer-LAS模型。由于Attention过于灵活的对齐方式,使得在嘈杂环境中的效果急剧下降,采用连接时序分类(connectionist temporal classification,CTC)辅助训练以加快收敛,并加入音素级别的中间CTC损失联合优化,提出了效果更好的Conformer-LAS-CTC语音识别模型。在开源中文普通话Aishell-1数据集上对提出来的模型进行验证,实验结果表明,Conformer-LAS-CTC相对于采用的基线BLSTM-LAS和Transformer-LAS模型在测试集上的字错率分别相对降低了22.58%和48.76%,模型最终字错误率为4.54%。
    参考文献 | 相关文章 | 多维度评价
    28. Adapter与Prompt Tuning微调方法研究综述
    林令德, 刘纳, 王正安
    计算机工程与应用    2023, 59 (2): 12-21.   DOI: 10.3778/j.issn.1002-8331.2209-0025
    摘要259)      PDF(pc) (3579KB)(145)    收藏
    文本挖掘是数据挖掘的一个分支学科,涵盖多种技术,其中自然语言处理技术是文本挖掘的核心工具之一,旨在帮助用户从海量数据中获取有用的信息。近年来,预训练模型对自然语言处理的研究和发展有重要的推动作用,预训练模型的微调方法也成为重要的研究领域。根据近年来预训练模型微调方法的相关文献,选择目前主流的Adapter与Prompt微调方法进行介绍。对自然语言处理的发展脉络进行简要梳理,分析目前预训练模型微调存在的问题与不足;介绍Adapter与Prompt两类微调方法,对两个研究方向中经典方法进行介绍,并从优缺点和性能等方面进行详细分析;进行总结归纳,阐述目前预训练模型的微调方法存在的局限性并讨论未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    29. 改进YOLOv5的交通标志检测算法
    胡昭华, 王莹
    计算机工程与应用    2023, 59 (1): 82-91.   DOI: 10.3778/j.issn.1002-8331.2207-0307
    摘要258)      PDF(pc) (1654KB)(126)    收藏
    交通标志检测在自动驾驶、辅助驾驶等领域是一个重要的环节,关乎到行车安全问题。针对交通标志中存在目标小、背景复杂等难点,提出一种基于改进YOLOv5的算法。提出区域上下文模块,利用多种扩张率的空洞卷积来获取不同感受野,进而获取到目标及其相邻区域的特征信息,相邻区域的信息对交通标志小目标检测起到重要补充作用,可以有效解决目标小的问题;在主干部分引入特征增强模块,进一步提高主干的特征提取能力,利用注意力机制与原C3模块结合,使网络更能聚焦小目标信息,避免复杂背景的干扰;在多尺度检测部分,将浅层特征层与深层检测层进行特征融合,可以同时兼顾浅层位置信息与深层语义信息,增加目标定位与边界回归的准确度,更有利于小目标检测。实验结果表明,改进后的算法在交通标志检测数据集TT100K上取得了87.2%的小目标检测精度、92.4%的小目标召回率以及91.8%的mAP,与原YOLOv5算法相比较,分别提升了3.5、4.1、2.6个百分点,检测速度83.3?frame/s;在CCTSDB数据集上mAP为98.0%,提升了2.0个百分点,检测速度90.9?frame/s。因此,提出的改进YOLOv5算法可以有效提高交通标志检测精度以及召回率,且检测速度相当。
    参考文献 | 相关文章 | 多维度评价
    30. 知识图谱增强的图神经网络推荐研究进展
    吴国栋, 王雪妮, 刘玉良
    计算机工程与应用    2023, 59 (4): 18-29.   DOI: 10.3778/j.issn.1002-8331.2205-0268
    摘要256)      PDF(pc) (638KB)(186)    收藏
    已有推荐方法主要基于用户与项目的历史交互行为,未充分运用用户及项目相关特征信息,推荐效果并不理想。知识图谱(knowledge graph,KG)增强的图神经网络(graph neural network,GNN)推荐,是以用户与项目交互行为构建的交互图为基础,引入同为图结构的知识图谱,并运用图神经网络技术进行处理,从而实现个性化推荐。深入探讨了现有知识图谱增强的图神经网络推荐研究进展。首先在对图神经网络推荐和知识图谱推荐进行探讨的基础上,从项目知识图谱和协同知识图谱视角,深入分析了当前知识图谱增强的图神经网络推荐取得的相关研究成果;然后从大规模动态知识图谱处理、用户对项目属性的偏好挖掘、知识图谱的图嵌入学习等方面,指出了已有知识图谱增强的图神经网络推荐研究存在的主要问题;最后从动态时序知识图谱增强的GNN推荐、元学习的知识图谱增强GNN推荐、多模态知识图谱增强的GNN推荐、知识图谱增强的GNN跨领域推荐等方面,展望了知识图谱增强的图神经网络推荐未来主要研究方向。
    参考文献 | 相关文章 | 多维度评价
    31. 改进YOLOv5s的轨道障碍物检测模型轻量化研究
    李昂, 孙士杰, 张朝阳, 冯明涛, 吴成中, 李旺
    计算机工程与应用    2023, 59 (4): 197-207.   DOI: 10.3778/j.issn.1002-8331.2208-0045
    摘要253)      PDF(pc) (910KB)(116)    收藏
    针对传统列车轨道障碍物检测方法实时性差和对小目标检测精度低的不足,提出一种改进YOLOv5s检测网络的轻量化障碍物检测模型。引入更加轻量化的Mixup数据增强方式,替代算法中原有的Mosaic数据增强方式;引入GhostNet网络结构中的深度可分离卷积GhostConv,替代原有YOLOv5s模型中特征提取网络与特征融合网络中的普通卷积层,减小了模型的计算开销;在模型特征提取网络末端加入CA空间注意力机制,让算法在训练过程中减少了重要位置信息的丢失,弥补了改进GhostNet对检测精度的损失;将改进后的模型进行稀疏训练和通道剪枝操作,剪掉对检测精度影响不大的通道,同时保留重要的特征信息,使模型更加轻量化。实验结果表明,改进后的模型在自制的多样化轨道交通数据集上,相较于原始YOLOv5s算法,在模型大小减小9.7?MB,检测速度提高14?FPS的前提下,检测精度提升了1.0个百分点。同时与目前主流的检测算法对比,在检测精度与检测速度上也具有一定的优越性,适用于复杂轨道交通环境下的障碍物目标检测。
    参考文献 | 相关文章 | 多维度评价
    32. 深度学习实时语义分割算法研究综述
    何家峰, 陈宏伟, 骆德汉
    计算机工程与应用    2023, 59 (8): 13-27.   DOI: 10.3778/j.issn.1002-8331.2210-0144
    摘要251)      PDF(pc) (1161KB)(200)    收藏
    语义分割是从像素的角度分割出图片中的不同对象,并对原始图片中的每个像素进行标注的一种技术。但由于无人机导航、遥感图像、医疗诊断等应用领域需要实时地进行语义分割处理。所以,基于深度学习的实时语义分割技术得到了迅速的发展。实时语义分割技术发展至今已有许多的技术与模型。基于此,在对相关文献进行研究的基础上,由语义分割技术引出了实时语义分割技术,并简单叙述了实时语义分割的优点。随后,研讨出目前实时语义分割存在的重难点。根据重难点进而对已存在的相关技术与模型进行阐述,并总结技术与模型的优缺点。最后,展望实时语义分割所面临的挑战,并对实时语义分割进行了总结与归纳,为后续的研讨提供了一些理论参考。
    参考文献 | 相关文章 | 多维度评价
    33. 改进SegFormer网络的遥感图像语义分割方法
    田雪伟, 汪佳丽, 陈明, 杜守庆
    计算机工程与应用    2023, 59 (8): 217-226.   DOI: 10.3778/j.issn.1002-8331.2204-0141
    摘要250)      PDF(pc) (951KB)(124)    收藏
    由于遥感图像存在目标尺度多、小目标的语义信息不足等问题,现有算法对遥感图像中小目标和目标边界难以精准分割。为此提出了一种改进SegFormer网络的遥感图像语义分割方法,以级联的方式合并SegFormer编码器输出的多个尺度的特征。在合并高层语义信息特征时使用语义特征融合模块保留模糊边界;在合并细节信息特征时使用门控注意力机制模块过滤部分高层语义信息特征,减少其对细节信息特征的干扰。之后将多个尺度的特征上采样后连接,使用多局部通道注意力模块根据通道上下文关系重新校准连接特征的映射关系,增强最终的分割效果。在UAVid和ISPRS Potsdam数据集上的实验结果表明,改进SegFormer的分割方法优于比较的当前主流分割方法,对遥感图像中的小目标和边界有更好的语义分割效果。
    参考文献 | 相关文章 | 多维度评价
    34. 改进YOLOv5的机场跑道异物目标检测算法
    李小军, 邓月明, 陈正浩, 何鑫
    计算机工程与应用    2023, 59 (2): 202-211.   DOI: 10.3778/j.issn.1002-8331.2207-0462
    摘要250)      PDF(pc) (5308KB)(139)    收藏
    针对机场跑道异物(foreign object debris,FOD)在图像中目标占比小,特征不明显,经常导致误检、漏检的问题,提出一种改进YOLOv5的FOD目标检测算法。改进多尺度融合与检测部分,融合高分辨率特征图增强小目标特征表达,移除大目标检测层以减少网络推理计算量;引入轻量高效的卷积注意力模块(CBAM),从空间与通道两个维度提升模型关注目标特征的能力;在特征融合阶段采用RepVGG模块,提高模型特征融合能力的同时提高了检测精度;采用SIoU Loss作为损失函数,提升了边框回归的速度与精度。在自制FOD数据集上进行对比实验,结果表明:该方法在满足实时性的条件下,实现了95.01%的mAP50、55.79%的mAP50:95,比原算法YOLOv5分别提高了2.78、3.28个百分点,有效解决了传统FOD检测误检、漏检问题,同时与主流目标检测算法相比,提出的改进算法更适用于FOD检测任务。
    参考文献 | 相关文章 | 多维度评价
    35. 改进Yolov7-tiny的钢材表面缺陷检测算法
    齐向明, 董旭
    计算机工程与应用    2023, 59 (12): 176-183.   DOI: 10.3778/j.issn.1002-8331.2302-0191
    摘要250)      PDF(pc) (679KB)(146)    收藏
    为提高钢材表面缺陷小目标检测效率,提出一种改进Yolov7-tiny的钢材表面缺陷检测算法。将特征提取网络的激活函数更换为SiLU,提高特征提取能力;把特征融合网络的张量拼接操作与加权双向特征金字塔BiFPN结合,再把上采样部分的最邻近插值替换为轻量级算子CARAFE,提升特征融合能力;最后在输出端引入多头自注意力机制MHSA 和SPD卷积构建块,提升输出端对钢材表面缺陷小目标的检测性能。在NEU-DET数据集上做消融和对比实验,改进算法与原Yolov7-tiny算法比较,mAP提升11.7个百分点,Precision提升3.3个百分点,FPS值达到192,结果表明改进算法能有效提升钢材表面缺陷小目标检测效率;在VOC2012数据集上做通用性对比实验,结果表明改进算法具有通用性。
    参考文献 | 相关文章 | 多维度评价
    36. 基于深度神经网络的图像修复算法综述
    吕建峰, 邵立珍, 雷雪梅
    计算机工程与应用    2023, 59 (20): 1-12.   DOI: 10.3778/j.issn.1002-8331.2303-0111
    摘要244)      PDF(pc) (720KB)(295)    收藏
    深度学习的快速发展使计算机视觉技术应用越来越广泛,同时利用深度神经网络根据破损图像的已知信息对图像复原的修复技术成为关注的热点。对近年基于深度神经网络的图像修复方法进行了综述和分析:按照模型优化的方向,对图像修复方法进行分类综述;介绍了图像修复常用的数据集和性能评价指标,并在相关数据集上对各种基于深度神经网络的破损图像修复算法进行性能评价和分析;总结和分析了现有图像修复方法面临的挑战和未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    37. 小样本轴承故障诊断研究综述
    司伟伟, 岑健, 伍银波, 胡学良, 何敏赞, 杨卓洪, 陈红花
    计算机工程与应用    2023, 59 (6): 45-56.   DOI: 10.3778/j.issn.1002-8331.2208-0139
    摘要243)      PDF(pc) (701KB)(117)    收藏
    随着数据时代的来临,基于数据驱动的轴承故障诊断方法表现出了优越的性能,但是此类方法依赖大量标记数据,而在实际生产过程中很难收集到大量的数据,因此小样本的轴承故障诊断具有很高的研究价值。对小样本条件下的轴承故障诊断方法进行了回顾,并将其分为两类:基于数据的方法和基于模型的方法。其中基于数据的方法是从数据角度对原始样本进行扩充;基于模型的方法是指利用模型优化特征提取或者提高分类精度等。总结了当前小样本条件下故障诊断方法的不足,并展望了小样本轴承故障诊断的未来。
    参考文献 | 相关文章 | 多维度评价
    38. 基于Transformer的多模态气象预测
    向德萍, 张普, 向世明, 潘春洪
    计算机工程与应用    2023, 59 (10): 94-103.   DOI: 10.3778/j.issn.1002-8331.2208-0486
    摘要242)      PDF(pc) (977KB)(197)    收藏
    随着气象观测技术的快速发展,气象行业积累了海量的气象大数据,为构建新型的数据驱动的气象预测模型提供了机遇。由于气象数据中存在的长时依赖关系和大范围空间关联关系,以及多模态气象要素间存在的复杂跨模态耦合关系,基于深度学习的气象预测是一个具有挑战性的研究课题。针对“温度、相对湿度、纬向风速、经向风速”四种经典气象要素组成的等气压层时序多模态数据,提出了一种基于多模态融合的气象预测深度学习模型。首先采用卷积网络来学习各个模态的特征,并在此基础上引入门控机制实现多模态加权融合;然后引入注意力机制,以并行时空轴向注意力代替传统的注意力机制,从而有效地学习长时依赖关系和大范围空间关联关系。整体结构上,采用了基于Transformer的编码器-解码器结构。在ERA5再分析数据集(子区域)上进行了对比实验,实验结果表明了所提方法在温度、相对湿度、风速等预测任务上的有效性和优越性。
    参考文献 | 相关文章 | 多维度评价
    39. 可解释人工智能研究综述
    赵延玉, 赵晓永, 王磊, 王宁宁
    计算机工程与应用    2023, 59 (14): 1-14.   DOI: 10.3778/j.issn.1002-8331.2208-0322
    摘要242)      PDF(pc) (683KB)(211)    收藏
    随着机器学习和深度学习的发展,人工智能技术已经逐渐应用在各个领域。然而采用人工智能的最大缺陷之一就是它无法解释预测的依据。模型的黑盒性质使得在医疗、金融和自动驾驶等关键任务应用场景中人类还无法真正信任模型,从而限制了这些领域中人工智能的落地应用。推动可解释人工智能(explainable artificial intelligence,XAI)的发展成为实现关键任务应用落地的重要问题。目前,国内外相关领域仍缺少有关可解释人工智能的研究综述,也缺乏对因果解释方法的关注以及对可解释性方法评估的研究。从解释方法的特点出发,将主要可解释性方法分为三类:独立于模型的方法、依赖于模型的方法和因果解释方法,分别进行总结分析,对解释方法的评估进行总结,列举出可解释人工智能的应用,讨论当前可解释性存在的问题并进行展望。
    参考文献 | 相关文章 | 多维度评价
    40. 药物-靶点相互作用预测的计算方法综述
    张然, 王学志, 汪嘉葭, 孟珍
    计算机工程与应用    2023, 59 (12): 1-13.   DOI: 10.3778/j.issn.1002-8331.2210-0108
    摘要240)      PDF(pc) (675KB)(187)    收藏
    药物-靶点相互作用预测旨在发现可作用于特定蛋白质的潜在药物,在药物重定位、药物副作用预测、多重药理学和耐药性的研究中都发挥着重要作用。随着计算机处理能力的进步和计算算法的不断更新,药物-靶点相互作用预测的计算方法展现出时间短、成本低、精度高、范围广的优势,受到了广泛的关注,并取得了显著的进展。为了梳理其研究发展历程,探讨未来的研究方向,就药物-靶点相互作用预测的背景和意义进行简要概述;将方法分为基于分子对接、基于药物结构、基于文本挖掘和基于化学基因组四类进行综述,并对每类方法进行对比分析,详细阐述每类方法的数据需求及应用场景;对现有研究存在的局限性和面临的挑战进行讨论,展望未来的研究方向,为后续研究提供参考和借鉴。
    参考文献 | 相关文章 | 多维度评价