摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 三年内
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 改进CBAM的轻量级注意力模型
    付国栋,黄进,杨涛,郑思宇
    计算机工程与应用    2021, 57 (20): 150-156.   DOI: 10.3778/j.issn.1002-8331.2101-0369
    摘要2046)      PDF(pc) (808KB)(656)    收藏

    近几年注意力模型在计算机视觉领域取得了广泛的应用,通过在卷积神经网络中加入注意力模型,网络的性能可以显著提升。然而大多数现有的方法都专注于开发更复杂的注意力模型,以使卷积神经网络获得更强的特征表达能力,但这也不可避免地增加了模型的复杂性。为了在性能和复杂度间取得平衡,对CBAM模型进行优化提出了轻量级的EAM(Efficient Attention Module)模型。针对CBAM的通道注意力模块,引入一维卷积替代全连接层来聚合各通道间的信息;对于CBAM的空间注意力模块,将大卷积核替换为空洞卷积来增加感受野以聚合更广的空间上下文信息。将该模型融入YOLOv4后在VOC2012数据集上进行测试,mAP提高3.48个百分点。实验结果表明,该注意力模型只引入较小的参数量,网络性能可获得较大提升。

    参考文献 | 相关文章 | 多维度评价
    2. 深度强化学习及在路径规划中的研究进展
    张荣霞,武长旭,孙同超,赵增顺
    计算机工程与应用    2021, 57 (19): 44-56.   DOI: 10.3778/j.issn.1002-8331.2104-0369
    摘要1991)      PDF(pc) (1134KB)(816)    收藏

    路径规划的目的是让机器人在移动过程中既能避开障碍物,又能快速规划出最短路径。在分析基于强化学习的路径规划算法优缺点的基础上,引出能够在复杂动态环境下进行良好路径规划的典型深度强化学习DQN(Deep Q-learning Network)算法。深入分析了DQN算法的基本原理和局限性,对比了各种DQN变种算法的优势和不足,进而从训练算法、神经网络结构、学习机制、AC(Actor-Critic)框架的多种变形四方面进行了分类归纳。提出了目前基于深度强化学习的路径规划方法所面临的挑战和亟待解决的问题,并展望了未来的发展方向,可为机器人智能路径规划及自动驾驶等方向的发展提供参考。

    参考文献 | 相关文章 | 多维度评价
    3. 基于深度学习的网络流量预测研究综述
    康梦轩,宋俊平,范鹏飞,高博文,周旭,李琢
    计算机工程与应用    2021, 57 (10): 1-9.   DOI: 10.3778/j.issn.1002-8331.2101-0402
    摘要1672)      PDF(pc) (711KB)(1475)    收藏

    精准地预判网络流量变化趋势可以帮助运营商准确预估网络的使用情况,合理分配并高效利用网络资源,以满足日益增长且多样化的用户需求。以深度学习算法在网络流量预测领域的进展为线索,阐述了网络流量预测的评价指标和目前公开的网络流量数据集及应用,具体分析了网络流量预测中常用的深度信念网络、卷积神经网络、循环神经网络和长短时记忆网络共四种深度学习方法,并重点介绍了近年来针对不同问题所提出的改进神经网络模型,总结了各模型特点及应用场景。最后对网络流量预测未来发展进行了展望。

    相关文章 | 多维度评价
    4. 卷积神经网络中的注意力机制综述
    张宸嘉,朱磊,俞璐
    计算机工程与应用    2021, 57 (20): 64-72.   DOI: 10.3778/j.issn.1002-8331.2105-0135
    摘要1604)      PDF(pc) (973KB)(998)    收藏

    注意力机制因其优秀的效果与即插即用的便利性,在深度学习任务中得到了越来越广泛的应用。主要着眼于卷积神经网络,对卷积网络注意力机制发展过程中的各种主流方法进行介绍,并对其核心思想与实现过程进行提取与总结,同时对每种注意力机制方法进行实现,针对同型号辐射源设备实测数据进行对比实验与结果分析,并依据主流方法的思想与实验的结果总结并阐述了卷积网络中的注意力机制的研究现状与未来其发展方向。

    参考文献 | 相关文章 | 多维度评价
    5. 人工神经网络模型发展及应用综述
    张驰,郭媛,黎明
    计算机工程与应用    2021, 57 (11): 57-69.   DOI: 10.3778/j.issn.1002-8331.2102-0256
    摘要1357)      PDF(pc) (781KB)(1445)    收藏

    人工神经网络与其他学科领域联系日益紧密,人们通过对人工神经网络层结构的探索和改进来解决各个领域的问题。根据人工神经网络相关文献进行分析,综述了人工神经网络算法以及网络模型结构的发展史,根据神经网络的发展介绍了人工神经网络相关概念,其中主要涉及到多层感知器、反向传播神经网络、卷积神经网络以及递归神经网络,描述了卷积神经网络发展当中出现的部分卷积神经网络模型和递归神经网络中常用的相关网络结构,分别综述了各个人工神经网络算法在相关领域的应用情况,总结了人工神经网络的未来发展方向。

    相关文章 | 多维度评价
    6. 基于CNN和LSTM的多通道注意力机制文本分类模型
    滕金保,孔韦韦,田乔鑫,王照乾,李龙
    计算机工程与应用    2021, 57 (23): 154-162.   DOI: 10.3778/j.issn.1002-8331.2104-0212
    摘要1344)      PDF(pc) (844KB)(446)    收藏

    针对传统的卷积神经网络(Convolutional Neural Network,CNN)和长短时记忆网络(Long Short-Term Memory,LSTM)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于CNN和LSTM的多通道注意力机制文本分类模型。使用CNN和LSTM提取文本局部信息和上下文特征;用多通道注意力机制(Attention)提取CNN和LSTM输出信息的注意力分值;将多通道注意力机制的输出信息进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上。在三个公开数据集上的实验结果表明,提出的模型相较于CNN、LSTM及其改进模型效果更好,可以有效提高文本分类的效果。

    参考文献 | 相关文章 | 多维度评价
    7. 深度强化学习在智能制造中的应用展望综述
    孔松涛,刘池池,史勇,谢义,王堃
    计算机工程与应用    2021, 57 (2): 49-59.   DOI: 10.3778/j.issn.1002-8331.2008-0431
    摘要1337)      PDF(pc) (982KB)(1632)    收藏

    深度强化学习作为机器学习发展的最新成果,已经在很多应用领域崭露头角。关于深度强化学习的算法研究和应用研究,产生了很多经典的算法和典型应用领域。深度强化学习应用在智能制造中,能在复杂环境中实现高水平控制。对深度强化学习的研究进行概述,对深度强化学习基本原理进行介绍,包括深度学习和强化学习。介绍深度强化学习算法应用的理论方法,在此基础对深度强化学习的算法进行了分类介绍,分别介绍了基于值函数和基于策略梯度的强化学习算法,列举了这两类算法的主要发展成果,以及其他相关研究成果。对深度强化学习在智能制造的典型应用进行分类分析。对深度强化学习存在的问题和未来发展方向进行了讨论。

    相关文章 | 多维度评价
    8. 基于深度学习的小目标检测算法综述
    刘洋,战荫伟
    计算机工程与应用    2021, 57 (2): 37-48.   DOI: 10.3778/j.issn.1002-8331.2009-0047
    摘要1321)      PDF(pc) (959KB)(1351)    收藏

    随着人工智能技术的发展,深度学习技术在人脸识别、行人检测、无人驾驶等领域得到了广泛的应用。而目标检测作为机器视觉中最基本、最具有挑战性的问题之一,近年来受到了广泛的关注。针对目标检测特别是小目标检测问题,归纳了常用的数据集和性能评价指标,并对各类常见数据集的特点、优势及检测难度进行对比,系统性地总结了常用的目标检测方法和小目标检测面临的挑战,梳理了基于深度学习的小目标检测方法的最新工作,重点介绍了基于多尺度的小目标检测方法和基于超分辨率的小目标检测方法等,同时介绍了针对目标检测方法的轻量化策略和一些轻量化模型的性能,并总结了各类方法的特点、优势和局限性等,展望了基于深度学习的小目标检测方法的未来发展方向。

    相关文章 | 多维度评价
    9. 多标签文本分类研究进展
    郝超,裘杭萍,孙毅,张超然
    计算机工程与应用    2021, 57 (10): 48-56.   DOI: 10.3778/j.issn.1002-8331.2101-0096
    摘要1300)      PDF(pc) (906KB)(967)    收藏

    文本分类作为自然语言处理中一个基本任务,在20世纪50年代就已经对其算法进行了研究,现在单标签文本分类算法已经趋向成熟,但是对于多标签文本分类的研究还有很大的提升空间。介绍了多标签文本分类的基本概念以及基本流程,包括数据集获取、文本预处理、模型训练和预测结果。介绍了多标签文本分类的方法。这些方法主要分为两大类:传统机器学习方法和基于深度学习的方法。传统机器学习方法主要包括问题转换方法和算法自适应方法。基于深度学习的方法是利用各种神经网络模型来处理多标签文本分类问题,根据模型结构,将其分为基于CNN结构、基于RNN结构和基于Transfomer结构的多标签文本分类方法。对多标签文本分类常用的数据集进行了梳理总结。对未来的发展趋势进行了分析与展望。

    相关文章 | 多维度评价
    10. 深度神经网络的小样本学习综述
    祝钧桃,姚光乐,张葛祥,李军,杨强,王胜,叶绍泽
    计算机工程与应用    2021, 57 (7): 22-33.   DOI: 10.3778/j.issn.1002-8331.2012-0200
    摘要1276)      PDF(pc) (859KB)(692)    收藏

    随着最近深度学习技术的蓬勃发展,深度神经网络(DNN)在大规模的图像分类与识别任务中取得了突破性的进展,但其在解决小样本学习问题时仍面临巨大挑战。小样本学习(FSL)是指在少量有监督样本的情况下学习一个能解决实际问题的模型,在深度学习领域具有重要意义。这促使该系统梳理了已有的DNN下的小样本学习工作,根据它们在解决小样本学习问题时所采用的技术,将DNN下的小样本学习解决方案分为四种策略:数据增强、度量学习、外部记忆、参数优化。根据这些策略,对现有的DNN下的小样本学习方法进行了全面的综述,同时总结了每一种策略在相关基准上的表现。强调了现有技术存在的局限性并对其未来的发展方向进行了展望,为今后的研究工作提供参考。

    相关文章 | 多维度评价
    11. 基于深度学习的图像去噪方法研究综述
    刘迪,贾金露,赵玉卿,钱育蓉
    计算机工程与应用    2021, 57 (7): 1-13.   DOI: 10.3778/j.issn.1002-8331.2011-0341
    摘要1220)      PDF(pc) (1139KB)(1172)    收藏

    图像去噪是利用图像序列的上下文信息去除噪声,从而恢复出清晰图像的一种技术,是计算机视觉领域重要研究内容之一。随着机器学习的发展,深度学习在图像去噪领域得到广泛应用,成为处理图像去噪的有效解决方法。分析了深度学习图像去噪方法;依据网络结构详细分析了图像去噪方法的思想,并对优缺点进行梳理总结;通过在DND、PolyU等数据集上的实验结果,对比分析基于深度学习去噪方法的性能;对图像去噪研究的关键问题进行总结,并讨论该领域未来研究的发展趋势。

    相关文章 | 多维度评价
    12. 引入注意力机制的YOLOv5安全帽佩戴检测方法
    王玲敏, 段军, 辛立伟
    计算机工程与应用    2022, 58 (9): 303-312.   DOI: 10.3778/j.issn.1002-8331.2112-0242
    摘要1206)      PDF(pc) (1381KB)(695)    收藏
    对于钢铁制造业、煤矿行业及建筑行业等高危行业来说,施工过程中佩戴安全帽是避免受伤的有效途径之一。针对目前安全帽佩戴检测模型在复杂环境下对小目标和密集目标存在误检和漏检等问题,提出一种改进YOLOv5的目标检测方法来对安全帽的佩戴进行检测。在YOLOv5的主干网络中添加坐标注意力机制(coordinate attention),该机制将位置信息嵌入到通道注意力当中,使网络可以在更大区域上进行注意。将特征融合模块中原有特征金字塔模块替换成加权双向特征金字塔(BiFPN)网络结构,实现高效的双向跨尺度连接和加权特征融合。在自制安全帽数据集上实验结果表明,改进的YOLOv5模型平均精度达到了95.9%,相比于YOLOv5模型,平均精度提高了5.1个百分点,达到了在复杂环境下对小目标和密集目标检测的要求。
    参考文献 | 相关文章 | 多维度评价
    13. 目标检测难点问题最新研究进展综述
    罗会兰,彭珊,陈鸿坤
    计算机工程与应用    2021, 57 (5): 36-46.   DOI: 10.3778/j.issn.1002-8331.2011-0205
    摘要1045)      PDF(pc) (687KB)(666)    收藏

    目标检测是计算机视觉领域最基本的问题之一,已经被广泛地探讨和研究。虽然近年来基于深度卷积神经网络的目标检测方法使得检测精度有了很大提升,但是在实际应用中仍然存在较多挑战。综述了目标检测领域的最新研究趋势,针对不同的目标检测挑战和难题:目标尺度变化范围大、实时检测问题、弱监督检测问题和样本不均衡问题,从四个方面综述了最近的目标检测研究方法,分析了不同算法之间的关系,阐述了新的改进方法、检测过程和实现效果,并详细比较了不同算法的检测精度、优缺点和适用场景。最后讨论了未来有可能进一步发展的几个方向。

    相关文章 | 多维度评价
    14. 多智能体路径规划综述
    刘志飞, 曹雷, 赖俊, 陈希亮, 陈英
    计算机工程与应用    2022, 58 (20): 43-64.   DOI: 10.3778/j.issn.1002-8331.2203-0467
    摘要1023)      PDF(pc) (1013KB)(384)    收藏
    多智能体路径规划(multi-agent path finding,MAPF)是为多个智能体规划路径的问题,关键约束是多个智能体同时沿着规划路径行进而不会发生冲突。MAPF在物流、军事、安防等领域有着大量应用。对国内外关于MAPF的主要研究成果进行系统整理和分类,按照规划方式不同,MAPF算法分为集中式规划算法和分布式执行算法。集中式规划算法是最经典和最常用的MAPF算法,主要分为基于[A*]搜索、基于冲突搜索、基于代价增长树和基于规约四种算法。分布式执行算法是人工智能领域兴起的基于强化学习的MAPF算法,按照改进技术不同,分布式执行算法分为专家演示型、改进通信型和任务分解型三种算法。基于上述分类,比较MAPF各种算法的特点和适用性,分析现有算法的优点和不足,指出现有算法面临的挑战并对未来工作进行了展望。
    参考文献 | 相关文章 | 多维度评价
    15. 中文领域命名实体识别综述
    焦凯楠,李欣,朱容辰
    计算机工程与应用    2021, 57 (16): 1-15.   DOI: 10.3778/j.issn.1002-8331.2103-0127
    摘要1005)      PDF(pc) (928KB)(612)    收藏

    命名实体识别(Named Entity Recognition,NER)作为自然语言处理领域经典的研究主题,是智能问答、知识图谱等任务的基础技术。领域命名实体识别(Domain Named Entity Recognition,DNER)是面向特定领域的NER方案。在深度学习技术的推动下,中文DNER取得了突破性进展。概括了中文DNER的研究框架,从领域数据源的确定、领域实体类型及规范制定、领域数据集的标注规范、中文DNER评估指标四个角度对国内外已有研究成果进行了综合评述;总结了目前常见的中文DNER的技术框架,介绍了基于词典和规则的模式匹配方法、统计机器学习方法、基于深度学习的方法、多方融合的深度学习方法,并重点分析了基于词向量表征和深度学习的中文DNER方法;讨论了中文DNER的典型应用场景,对未来发展方向进行了展望。

    相关文章 | 多维度评价
    16. 基于计算机视觉的Transformer研究进展
    刘文婷, 卢新明
    计算机工程与应用    2022, 58 (6): 1-16.   DOI: 10.3778/j.issn.1002-8331.2106-0442
    摘要997)      PDF(pc) (1089KB)(716)    收藏
    Transformer是一种基于自注意力机制、并行化处理数据的深度神经网络。近几年基于Transformer的模型成为计算机视觉任务的重要研究方向。针对目前国内基于Transformer综述性文章的空白,对其在计算机视觉上的应用进行概述。回顾了Transformer的基本原理,重点介绍了其在图像分类、目标检测、图像分割等七个视觉任务上的应用,并对效果显著的模型进行分析。最后对Transformer在计算机视觉中面临的挑战以及未来的发展趋势进行了总结和展望。
    参考文献 | 相关文章 | 多维度评价
    17. 深度学习下的医学影像分割算法综述
    彭璟,罗浩宇,赵淦森,林成创,易序晟,陈少洁
    计算机工程与应用    2021, 57 (3): 44-57.   DOI: 10.3778/j.issn.1002-8331.2010-0335
    摘要995)      PDF(pc) (1397KB)(1129)    收藏

    医学影像分割是计算机视觉在医学影像处理中的一个重要应用领域,其目标是从医学影像中分割出目标区域,为后续的疾病诊断和治疗提供有效的帮助。近年来深度学习技术在图像处理方面取得了巨大进展,基于深度学习的医学影像分割算法逐渐成为该领域研究的重点和热点。叙述了计算机视觉下的医学影像分割任务及其难点,重点综述了基于深度学习的医学影像分割算法,对当前具有代表性的相关方法进行了分类和总结,介绍了医学影像分割算法常用的评价指标和数据集。对该技术的发展进行了总结和展望。

    相关文章 | 多维度评价
    18. 文本情感分析方法研究综述
    王婷,杨文忠
    计算机工程与应用    2021, 57 (12): 11-24.   DOI: 10.3778/j.issn.1002-8331.2101-0022
    摘要975)      PDF(pc) (906KB)(1073)    收藏

    文本情感分析是自然语言处理领域的一个重要分支,广泛应用于舆情分析和内容推荐等方面,是近年来的研究热点。根据使用的不同方法,将其划分为基于情感词典的情感分析方法、基于传统机器学习的情感分析方法、基于深度学习的情感分析方法。通过对这三种方法进行对比,分析其研究成果,并对不同方法的优缺点进行归纳总结,介绍相关数据集和评价指标及应用场景,对情感分析子任务进行简单概括,发现将来的情感分析问题的研究趋势及应用领域,并为研究者在相关领域方面提供一定的帮助和指导。

    相关文章 | 多维度评价
    19. 智能博弈对抗中的对手建模方法及其应用综述
    魏婷婷, 袁唯淋, 罗俊仁, 张万鹏
    计算机工程与应用    2022, 58 (9): 19-29.   DOI: 10.3778/j.issn.1002-8331.2202-0297
    摘要969)      PDF(pc) (904KB)(348)    收藏
    智能博弈对抗一直是人工智能研究的热点。在博弈对抗环境中,通过对对手进行建模,可以推测敌对智能体动作、目标、策略等相关属性,为博弈策略制定提供关键信息。对手建模方法在竞技类游戏和作战仿真推演等领域的应用前景广阔,博弈策略的制定必须以博弈各方的行动策略为前提,因此建立一个准确的对手行为模型对于预测其意图尤其重要。从内涵、方法、应用三个方面,阐述了对手建模的必要性,对现有建模方式进行了分类;对基于强化学习的预测方法、基于心智理论的推理方法和基于贝叶斯的优化方法进行了梳理与总结;以序贯博弈(德州扑克)、即时策略博弈(星际争霸)和元博弈为典型应用场景,分析了智能博弈对抗过程中的对手建模的作用;从有限理性、策略欺骗性和可解释性三个方面进行了对手建模技术发展的展望。
    参考文献 | 相关文章 | 多维度评价
    20. 神经风格迁移模型综述
    唐稔为,刘启和,谭浩
    计算机工程与应用    2021, 57 (19): 32-43.   DOI: 10.3778/j.issn.1002-8331.2105-0296
    摘要944)      PDF(pc) (1078KB)(612)    收藏

    神经风格迁移技术主要用于对图像、视频等进行风格化,使其具有艺术美感,该领域极具应用价值,是人工智能的热门研究领域之一。为推动神经风格迁移领域的研究发展,对神经风格迁移技术进行了全面概述。简述了非真实感渲染技术和传统的纹理迁移技术。对现有神经风格迁移模型进行了分类整理,并详细探讨了各类代表性模型的算法原理及后续改进,分析了神经风格迁移技术的应用市场。提出对风格迁移模型质量的评判应该从定性评估和定量评估两个方面来考虑,并从各个角度讨论了现阶段风格迁移技术存在的问题以及未来研究方向。最后强调应提高模型的综合能力,在保证生成质量的情况下提升生成速度以及泛化能力。

    参考文献 | 相关文章 | 多维度评价
    21. 深度学习的典型目标检测算法研究综述
    许德刚,王露,李凡
    计算机工程与应用    2021, 57 (8): 10-25.   DOI: 10.3778/j.issn.1002-8331.2012-0449
    摘要860)      PDF(pc) (736KB)(733)    收藏

    目标检测是计算机视觉的一个重要研究方向,其目的是精确识别给定图像中特定目标物体的类别和位置。近年来,深度卷积神经网络(Deep Convolutional Neural Networks,DCNN)所具有的特征学习和迁移学习能力,在目标检测算法特征提取、图像表达、分类与识别等方面取得了显著进展。介绍了基于深度学习目标检测算法的研究进展、常用数据集特点以及性能指标评价的关键参数,对比分析了双阶段、单阶段以及其他改进算法的网络结构和实现方式。阐述了算法在人脸、显著目标、行人、遥感图像、医学图像、粮虫等检测领域的应用进展,结合当前存在的问题和挑战,展望分析了其未来的研究方向。

    相关文章 | 多维度评价
    22. 卷积神经网络在高光谱图像分类中的应用综述
    万亚玲,钟锡武,刘慧,钱育蓉
    计算机工程与应用    2021, 57 (4): 1-10.   DOI: 10.3778/j.issn.1002-8331.2010-0423
    摘要845)      PDF(pc) (764KB)(672)    收藏

    高光谱图像(Hyperspectral Imagery,HSI)分类是高光谱图像处理和应用的一项重要工作。随着深度学习的不断发展,卷积神经网络(Convolutional Neural Network,CNN)日渐成为处理高光谱遥感图像分类问题的一个有效方法。首先对高光谱遥感图像分类任务进行了概述,分析了目前存在的问题;其次对CNN及其基于光谱特征、空间特征、空谱特征的分类方法进行了系统的梳理,并且将上述的分类方法通过实验分析其性能;最后对高光谱遥感图像分类的关键问题进行了总结,并讨论了未来的研究方向。

    相关文章 | 多维度评价
    23. 改进TEB算法的局部路径规划算法研究
    代婉玉, 张丽娟, 吴佳峰, 马向华
    计算机工程与应用    2022, 58 (8): 283-288.   DOI: 10.3778/j.issn.1002-8331.2108-0290
    摘要845)      PDF(pc) (878KB)(159)    收藏
    在复杂动态环境中用传统TEB(time elastic band)算法规划路径时,会出现速度控制量不平滑导致的路径震荡、给机器人带来较大冲击和易发生碰撞。针对以上问题对传统TEB算法进行改进,对检测到的不规则障碍物膨胀化处理并进行区域分级策略,优先考虑安全区域的行驶路线,使机器人在复杂环境中更加安全平稳地运行。在算法中加入障碍物距离对速度的约束,能有效降低机器人靠近障碍物后因速度跳变导致的路径行驶过程的震荡幅度和机器人受到的冲击,以保障机器人运行时的安全。通过在ROS环境中的大量对比仿真,表明在复杂动态环境中改进后TEB算法规划的路径更安全平滑,能有效减少机器人受到的冲击。
    参考文献 | 相关文章 | 多维度评价
    24. 多智能体博弈强化学习研究综述
    王军,曹雷,陈希亮,赖俊,章乐贵
    计算机工程与应用    2021, 57 (21): 1-13.   DOI: 10.3778/j.issn.1002-8331.2104-0432
    摘要834)      PDF(pc) (779KB)(947)    收藏

    使用深度强化学习解决单智能体任务已经取得了突破性的进展。由于多智能体系统的复杂性,普通算法无法解决其主要难点。同时,由于智能体数量增加,将最大化单个智能体的累积回报的期望值作为学习目标往往无法收敛,某些特殊的收敛点也不满足策略的合理性。对于不存在最优解的实际问题,强化学习算法更是束手无策,将博弈理论引入强化学习可以很好地解决智能体的相互关系,可以解释收敛点对应策略的合理性,更重要的是可以用均衡解来替代最优解以求得相对有效的策略。因此,从博弈论的角度梳理近年来出现的强化学习算法,总结当前博弈强化学习算法的重难点,并给出可能解决上述重难点的几个突破方向。

    参考文献 | 相关文章 | 多维度评价
    25. 目标检测算法在交通场景中应用综述
    肖雨晴,杨慧敏
    计算机工程与应用    2021, 57 (6): 30-41.   DOI: 10.3778/j.issn.1002-8331.2011-0361
    摘要816)      PDF(pc) (919KB)(409)    收藏

    目标检测是计算机视觉领域的重要研究任务,在机器人、自动驾驶、工业检测等方面应用广泛。在深度学习理论的基础上,系统性总结了目标检测算法的发展与研究现状,对两类算法的特点、优缺点和实时性进行对比。以交通场景中三类典型物体(非机动车、机动车和行人)为目标,从传统检测方法、目标检测算法、目标检测算法优化、三维目标检测、多模态目标检测和重识别六个方面分别论述和总结目标检测算法检测识别交通场景目标的研究现状与应用情况,重点介绍了各类方法的优势、局限性和适用场景。归纳了常用目标检测和交通场景数据集及评价标准,比较分析两类算法性能,展望目标检测算法在交通场景中应用研究的发展趋势,为智能交通、自动驾驶提供研究思路。

    相关文章 | 多维度评价
    26. 基于自编码器的深度聚类算法综述
    陶文彬, 钱育蓉, 张伊扬, 马恒志, 冷洪勇, 马梦楠
    计算机工程与应用    2022, 58 (18): 16-25.   DOI: 10.3778/j.issn.1002-8331.2204-0049
    摘要815)      PDF(pc) (724KB)(286)    收藏
    聚类分析作为一种常见的分析方法,广泛应用于各种场景。随着机器学习技术的发展,深度聚类算法也成了当下研究的热点,基于自编码器的深度聚类算法是其中的代表算法。为了及时了解掌握基于自编码器的深度聚类算法的发展,介绍了四种自编码器的模型,对近些年代表性的算法依照自编码器的结构进行了分类。在MNIST、USPS、Fashion-MNIST数据集上,针对传统聚类算法和基于自编码器的深度聚类算法进行了实验对比、分析,最后对基于自编码器的深度聚类算法目前存在的问题进行了总结,展望了深度聚类算法的研究方向。
    参考文献 | 相关文章 | 多维度评价
    27. 卷积神经网络在生物医学图像上的应用进展
    杨培伟,周余红,邢岗,田智强,许夏瑜
    计算机工程与应用    2021, 57 (7): 44-58.   DOI: 10.3778/j.issn.1002-8331.2009-0161
    摘要810)      PDF(pc) (1266KB)(586)    收藏

    生物医学成像领域的迅速发展引起相关图像信息的爆炸式增长,对其图像进行人工智能辅助分析日益成为科学研究、临床应用、即时诊断等领域的迫切需求。近年来深度学习,尤其是卷积神经网络在生物医学图像分析领域取得广泛应用,在生物医学图像的信息提取,包括细胞分类、检测,生理及病理图像的分割、检测等领域发挥日益重要的作用。介绍了深度学习及卷积神经网络相关技术的发展;重点针对近几年卷积神经网络在细胞生物学图像、医学图像领域的应用进展进行了梳理;对卷积神经网络在生物医学图像分析领域研究目前存在的问题及可能的发展方向进行了展望。

    相关文章 | 多维度评价
    28. 胶囊神经网络研究现状与未来的浅析
    贺文亮,朱敏玲
    计算机工程与应用    2021, 57 (3): 33-43.   DOI: 10.3778/j.issn.1002-8331.2009-0209
    摘要806)      PDF(pc) (890KB)(703)    收藏

    当今时代的人工智能技术迅速发展,推动了社会的巨大进步。深度学习作为人工智能领域重要的一部分,具有非常广阔的应用前景,近年来,越来越多的专家学者开始研究深度学习领域相关技术,比较典型的两个方向就是自然语言处理和计算机视觉,其中计算机视觉的发展大力引领着深度学习领域的进步。介绍了卷积神经网络的经典模型和深度学习中新型神经网络模型——胶囊网络以及其动态路由算法,并对比了二者的优劣性。对胶囊网络的应用给予综述,以图像和文本两方面来阐述胶囊网络的应用领域和优势所在。最后进行概括总结,并展望了胶囊网络可能的改进方向。

    相关文章 | 多维度评价
    29. 基于深度学习的视觉多目标跟踪算法综述
    张瑶,卢焕章,张路平,胡谋法
    计算机工程与应用    2021, 57 (13): 55-66.   DOI: 10.3778/j.issn.1002-8331.2102-0260
    摘要801)      PDF(pc) (931KB)(657)    收藏

    视觉多目标跟踪是计算机视觉领域的热点问题,然而,场景中目标数量的不确定、目标之间的相互遮挡、目标特征区分度不高等多种难题导致了视觉多目标跟踪现实应用进展缓慢。近年来,随着视觉智能处理研究的不断深入,涌现出多种多样的深度学习类视觉多目标跟踪算法。在分析了视觉多目标跟踪面临的挑战和难点基础上,将算法分为基于检测跟踪(Detection-Based-Tracking,DBT)、联合检测跟踪(Joint-Detection-Tracking,JDT)两大类及六个子类,研究不同类别算法的优缺点。分析表明,DBT类算法结构简单,但算法各子环节的关联度不高,JDT类算法融合多模块联合学习,在多项跟踪评价指标中占优。DBT类算法中特征提取模块是解决目标遮挡问题的关键,但损失了算法速度,JDT类算法对检测模块更为依赖。目前,多目标跟踪跟踪总体是从DBT类算法向JDT发展,分阶段实现算法准确度与速度的均衡;提出多目标跟踪算法未来在数据集、各子模块、具体场景应用等方面的发展方向。

    相关文章 | 多维度评价
    30. 三维人体姿态估计研究综述
    王发明,李建微,陈思喜
    计算机工程与应用    2021, 57 (10): 26-38.   DOI: 10.3778/j.issn.1002-8331.2102-0039
    摘要792)      PDF(pc) (1035KB)(1035)    收藏

    三维人体姿态估计在本质上是一个分类问题和回归问题,主要通过图像估计人体的三维姿态。基于传统方法和深度学习方法的三维人体姿态估计是当前研究的主流方法。按照传统方法到深度学习方法的顺序对近年来三维人体姿态估计方法进行系统介绍,从而了解传统方法通过生成和判别等方法得到人体姿态的众多要素完成三维人体姿态的估计。基于深度学习的三维人体姿态估计方法主要通过构建神经网络,从图像特征中回归出人体姿态信息,大致可以分为基于直接回归方法、基于2D信息方法和基于混合方法的三维人体姿态估计这三类。最后对当前三维人体姿态估计研究所面临的困难与挑战进行阐述,并对未来的研究趋势做出展望。

    相关文章 | 多维度评价
    31. 多模态数据融合综述
    任泽裕,王振超,柯尊旺,李哲,吾守尔·斯拉木
    计算机工程与应用    2021, 57 (18): 49-64.   DOI: 10.3778/j.issn.1002-8331.2104-0237
    摘要789)      PDF(pc) (1214KB)(1160)    收藏

    随着当今信息技术的飞速发展,信息的存在形式多种多样,来源也十分广泛。不同的存在形式或信息来源均可被称之为一种模态,由两种或两种以上模态组成的数据称之为多模态数据。多模态数据融合负责将多个模态的信息进行有效的整合,汲取不同模态的优点,完成对信息的整合。自然现象具有十分丰富的特征,单一模态很难提供某个现象的完整信息。面对保持融合后具有各个模态信息的多样性以及完整性、使各个模态的优点最大化、减少融合过程造成的信息损失等方面的融合要求,如何对各个模态的信息进行融合成为了多个领域广泛存在的一个新挑战。简要阐述了常见的多模态融合方法、融合架构,总结了三个常见的融合模型,简要分析协同、联合、编解码器三大架构的优缺点以及多核学习、图像模型等具体融合方法。在多模态的应用方面,对多模态视频片段检索、综合多模态信息生成内容摘要、多模态情感分析、多模态人机对话系统进行了分析与总结。指出了当前多模态融合出现的问题,并提出未来的研究方向。

    相关文章 | 多维度评价
    32. 零样本学习综述
    王泽深,杨云,向鸿鑫,柳青
    计算机工程与应用    2021, 57 (19): 1-17.   DOI: 10.3778/j.issn.1002-8331.2106-0133
    摘要778)      PDF(pc) (1267KB)(490)    收藏

    尽管自深度学习发展以来,减少大量人工标记样本的需求使得零样本学习取得了不错的进展,以至于已经拥有比较完善的理论体系。但是对于零样本学习应用的研究寥寥无几,如何有效地对应用领域进行梳理是现阶段急需解决的问题。对零样本的理论体系进行介绍,通过一个例子引出零样本学习的定义,继而与广义零样本、监督学习比较,再而列举4个关键问题以及现有的解决方案,给出文本、图像、视频三方面常用的数据集;按照关键技术(属性、嵌入以及生成模型)出现时间顺序,对13个典型模型如何进行零样本学习展开描述,并对优点、缺点、创新点、挑选数据集以及表现进行总结;从词、图像、视频3个维度详细介绍了零样本学习在各个领域的应用;提出了零样本学习过程中出现的挑战并给出了对应的潜在研究方向。

    参考文献 | 相关文章 | 多维度评价
    33. 深度强化学习算法在智能军事决策中的应用
    况立群,李思远,冯利,韩燮,徐清宇
    计算机工程与应用    2021, 57 (20): 271-278.   DOI: 10.3778/j.issn.1002-8331.2104-0114
    摘要773)      PDF(pc) (1223KB)(476)    收藏

    深度强化学习算法能够很好地实现离散化的决策行为,但是难以运用于高度复杂且行为连续的现代战场环境,同时多智能体环境下算法难以收敛。针对这些问题,提出了一种改进的深度确定策略梯度(DDPG)算法,该算法引入了基于优先级的经验重放技术和单训练模式,以提高算法收敛速度;同时算法中还设计了一种混合双噪声的探索策略,从而实现复杂且连续的军事决策控制行为。采用Unity开发了基于改进DDPG算法的智能军事决策仿真平台,搭建了蓝军步兵进攻红军军事基地的仿真环境,模拟多智能体的作战训练。实验结果显示,该算法能够驱动多作战智能体完成战术机动,实现绕过障碍物抵达优势区域进行射击等战术行为,算法拥有更快的收敛速度和更好的稳定性,可得到更高的回合奖励,达到了提高智能军事决策效率的目的。

    参考文献 | 相关文章 | 多维度评价
    34. COVID-19医学影像数据集及研究进展
    刘锐,丁辉,尚媛园,邵珠宏,刘铁
    计算机工程与应用    2021, 57 (22): 15-27.   DOI: 10.3778/j.issn.1002-8331.2106-0118
    摘要761)      PDF(pc) (1013KB)(329)    收藏

    由于影像学技术在新型冠状病毒肺炎(COVID-19)的诊断和评估中发挥了重要作用,COVID-19相关数据集陆续被公布,但目前针对相关文献中数据集以及研究进展的整理相对较少。为此,通过COVID-19相关的期刊论文、报告和相关开源数据集网站,对涉及到的新冠肺炎数据集及深度学习模型进行整理和分析,包括计算机断层扫描(CT)图像数据集和X射线(CXR)图像数据集。对这些数据集呈现的医学影像的特征进行分析;重点论述开源数据集,以及在相关数据集上表现较好的分类和分割模型。最后讨论了肺部影像学技术未来的发展趋势。

    参考文献 | 相关文章 | 多维度评价
    35. 基于改进YOLOv5的目标检测算法研究
    邱天衡, 王玲, 王鹏, 白燕娥
    计算机工程与应用    2022, 58 (13): 63-73.   DOI: 10.3778/j.issn.1002-8331.2202-0093
    摘要752)      PDF(pc) (1109KB)(390)    收藏
    YOLOv5是目前单阶段目标检测性能较好的算法,但对目标边界回归的精确度不高,难以适用对预测框交并比要求较高的场景。基于YOLOv5算法,提出一种对硬件要求低、模型收敛速度快、目标框准确率高的新模型YOLO-G。改进特征金字塔结构(FPN),采用跨层级联的方式融合更多的特征,一定程度上防止了浅层语义信息的丢失,同时加深金字塔深度,对应增加检测层,使各种锚框的铺设间隔更加合理;其次把并行模式的注意力机制融入到网络结构中,赋予空间注意力模块和通道注意力模块相同的优先级,以加权融合的方式提取注意力信息,使网络可根据对空间和通道注意力的关注程度得到混合域注意力;通过降低网络的参数量和计算量对网络进行轻量化处理,防止因模型复杂度提升造成实时性能的损失。使用PASCAL VOC的2007、2012两个数据集来验证算法的有效性,YOLO-G比YOLOv5s的参数量减少了4.7%,计算量减少了47.9%,而mAP@0.5提高了3.1个百分点,mAP@0.5:0.95提高了5.6个百分点。
    参考文献 | 相关文章 | 多维度评价
    36. 融合U-Net及MobileNet-V2的快速语义分割网络
    兰天翔,向子彧,刘名果,陈凯
    计算机工程与应用    2021, 57 (17): 175-180.   DOI: 10.3778/j.issn.1002-8331.2005-0278
    摘要728)      PDF(pc) (1156KB)(233)    收藏

    传统U-Net网络模型大,处理图片速度慢,难以适应工业生产中实时的需求。针对该问题,设计并实现了一个轻量级全卷积语义分割网络LU-Net。LU-Net网络以U-Net框架为主体,结合MobileNet-V2的思想,利用深度可分离卷积参数少、计算量小的特点轻量化网络模型。网络综合利用bottleneck模块与普通卷积的优点,并高效利用了高层特征,在保持精度的同时,大幅缩短了分割所需时间。经公开数据集DRIVE及自制凹陷字符数据集上实验的验证,相较于原U-Net网络模型,提出的LU-Net模型参数量缩小至0.59×106,为原模型的1.9%,运行速度提高5倍,处理一张360×270图片的平均耗时为25?ms。LU-Net基本满足工业生产对图像实时处理的要求。

    相关文章 | 多维度评价
    37. 深度学习模型可解释性研究综述
    曾春艳,严康,王志锋,余琰,纪纯妹
    计算机工程与应用    2021, 57 (8): 1-9.   DOI: 10.3778/j.issn.1002-8331.2012-0357
    摘要715)      PDF(pc) (677KB)(1067)    收藏

    深度学习技术以数据驱动学习的特点,在自然语言处理、图像处理、语音识别等领域取得了巨大成就。但由于深度学习模型网络过深、参数多、复杂度高等特性,该模型做出的决策及中间过程让人类难以理解,因此探究深度学习的可解释性成为当前人工智能领域研究的新课题。以深度学习模型可解释性为研究对象,对其研究进展进行总结阐述。从自解释模型、特定模型解释、不可知模型解释、因果可解释性四个方面对主要可解释性方法进行总结分析。列举出可解释性相关技术的应用,讨论当前可解释性研究存在的问题并进行展望,以推动深度学习可解释性研究框架的进一步发展。

    相关文章 | 多维度评价
    38. 基于深度学习的医学图像配准技术研究进展
    郭艳芬,崔喆,杨智鹏,彭静,胡金蓉
    计算机工程与应用    2021, 57 (15): 1-8.   DOI: 10.3778/j.issn.1002-8331.2101-0281
    摘要712)      PDF(pc) (681KB)(669)    收藏

    医学图像配准技术对于病灶检测、临床诊断、手术规划,疗效评估等有着广泛的应用价值。系统性地总结了基于深度学习的配准算法,从深度迭代、全监督、弱监督到无监督学习的研究发展趋势,分析了各种方法的优势与局限。总体来看,无论是对数据的要求、配准精度,还是计算效率,无监督学习因其不依赖金标准和解剖标签,采用端到端的网络配准框架就可以自动执行需要的任务等优势成为研究的主流方向。然而,基于无监督学习的医学图像配准方法在医学图像领域的可解释性、跨模态多样性和可重复可扩展性方面同样面临着一些研究难点和挑战,这为将来实现更精准的医学图像配准方法指明了研究方向。

    相关文章 | 多维度评价
    39. 基于深度学习的视觉里程计方法综述
    职恒辉, 尹晨阳, 李慧斌
    计算机工程与应用    2022, 58 (20): 1-15.   DOI: 10.3778/j.issn.1002-8331.2203-0480
    摘要712)      PDF(pc) (904KB)(403)    收藏
    视觉里程计(visual odometry,VO)是处理搭载视觉传感器的移动设备定位问题的一种常用方法,在自动驾驶、移动机器人、AR/VR等领域得到了广泛应用。与传统基于模型的方法相比,基于深度学习的方法可在不需显式计算的情况下从数据中学习高效且鲁棒的特征表达,从而提升其对于光照变化、少纹理等挑战性场景的鲁棒性。简略回顾了基于模型的视觉里程计方法,从监督学习方法、无监督学习方法、模型与学习融合方法、常用数据集、评价指标、模型法与深度学习方法对比分析六个方面全面介绍了基于深度学习的视觉里程计方法。指出了基于深度学习视觉里程计仍存在的问题和未来的发展趋势。
    参考文献 | 相关文章 | 多维度评价
    40. 无人机航拍图像语义分割研究综述
    程擎,范满,李彦冬,赵远,李诚龙
    计算机工程与应用    2021, 57 (19): 57-69.   DOI: 10.3778/j.issn.1002-8331.2105-0423
    摘要708)      PDF(pc) (926KB)(484)    收藏

    随着无人机技术的快速发展,无人机在研究领域和工业应用方面受到了广泛的关注。图像和视频是无人机感知周围环境的重要途径。图像语义分割是计算机视觉领域的研究热点,在无人驾驶、智能机器人等场景中应用广泛。无人机航拍图像语义分割是在无人机航拍图像的基础上,运用语义分割技术使无人机获得场景目标智能感知能力。介绍了语义分割技术和无人机的应用发展、相关无人机航拍数据集、无人机航拍图像特点和常用语义分割评价指标。针对无人机航拍的特点介绍了相关语义分割方法,包括小目标、模型实时性和多尺度整合等方面。综述无人机语义分割相关应用,包括线检测、农业和建筑物提取等方向,并分析无人机语义分割未来发展趋势和挑战。

    参考文献 | 相关文章 | 多维度评价