摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 三年内
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 深度强化学习及在路径规划中的研究进展
    张荣霞,武长旭,孙同超,赵增顺
    计算机工程与应用    2021, 57 (19): 44-56.   DOI: 10.3778/j.issn.1002-8331.2104-0369
    摘要2603)      PDF(pc) (1134KB)(1068)    收藏

    路径规划的目的是让机器人在移动过程中既能避开障碍物,又能快速规划出最短路径。在分析基于强化学习的路径规划算法优缺点的基础上,引出能够在复杂动态环境下进行良好路径规划的典型深度强化学习DQN(Deep Q-learning Network)算法。深入分析了DQN算法的基本原理和局限性,对比了各种DQN变种算法的优势和不足,进而从训练算法、神经网络结构、学习机制、AC(Actor-Critic)框架的多种变形四方面进行了分类归纳。提出了目前基于深度强化学习的路径规划方法所面临的挑战和亟待解决的问题,并展望了未来的发展方向,可为机器人智能路径规划及自动驾驶等方向的发展提供参考。

    参考文献 | 相关文章 | 多维度评价
    2. 改进CBAM的轻量级注意力模型
    付国栋,黄进,杨涛,郑思宇
    计算机工程与应用    2021, 57 (20): 150-156.   DOI: 10.3778/j.issn.1002-8331.2101-0369
    摘要2412)      PDF(pc) (808KB)(763)    收藏

    近几年注意力模型在计算机视觉领域取得了广泛的应用,通过在卷积神经网络中加入注意力模型,网络的性能可以显著提升。然而大多数现有的方法都专注于开发更复杂的注意力模型,以使卷积神经网络获得更强的特征表达能力,但这也不可避免地增加了模型的复杂性。为了在性能和复杂度间取得平衡,对CBAM模型进行优化提出了轻量级的EAM(Efficient Attention Module)模型。针对CBAM的通道注意力模块,引入一维卷积替代全连接层来聚合各通道间的信息;对于CBAM的空间注意力模块,将大卷积核替换为空洞卷积来增加感受野以聚合更广的空间上下文信息。将该模型融入YOLOv4后在VOC2012数据集上进行测试,mAP提高3.48个百分点。实验结果表明,该注意力模型只引入较小的参数量,网络性能可获得较大提升。

    参考文献 | 相关文章 | 多维度评价
    3. 基于深度学习的网络流量预测研究综述
    康梦轩,宋俊平,范鹏飞,高博文,周旭,李琢
    计算机工程与应用    2021, 57 (10): 1-9.   DOI: 10.3778/j.issn.1002-8331.2101-0402
    摘要1884)      PDF(pc) (711KB)(1701)    收藏

    精准地预判网络流量变化趋势可以帮助运营商准确预估网络的使用情况,合理分配并高效利用网络资源,以满足日益增长且多样化的用户需求。以深度学习算法在网络流量预测领域的进展为线索,阐述了网络流量预测的评价指标和目前公开的网络流量数据集及应用,具体分析了网络流量预测中常用的深度信念网络、卷积神经网络、循环神经网络和长短时记忆网络共四种深度学习方法,并重点介绍了近年来针对不同问题所提出的改进神经网络模型,总结了各模型特点及应用场景。最后对网络流量预测未来发展进行了展望。

    相关文章 | 多维度评价
    4. 人工神经网络模型发展及应用综述
    张驰,郭媛,黎明
    计算机工程与应用    2021, 57 (11): 57-69.   DOI: 10.3778/j.issn.1002-8331.2102-0256
    摘要1843)      PDF(pc) (781KB)(1733)    收藏

    人工神经网络与其他学科领域联系日益紧密,人们通过对人工神经网络层结构的探索和改进来解决各个领域的问题。根据人工神经网络相关文献进行分析,综述了人工神经网络算法以及网络模型结构的发展史,根据神经网络的发展介绍了人工神经网络相关概念,其中主要涉及到多层感知器、反向传播神经网络、卷积神经网络以及递归神经网络,描述了卷积神经网络发展当中出现的部分卷积神经网络模型和递归神经网络中常用的相关网络结构,分别综述了各个人工神经网络算法在相关领域的应用情况,总结了人工神经网络的未来发展方向。

    相关文章 | 多维度评价
    5. 卷积神经网络中的注意力机制综述
    张宸嘉,朱磊,俞璐
    计算机工程与应用    2021, 57 (20): 64-72.   DOI: 10.3778/j.issn.1002-8331.2105-0135
    摘要1821)      PDF(pc) (973KB)(1185)    收藏

    注意力机制因其优秀的效果与即插即用的便利性,在深度学习任务中得到了越来越广泛的应用。主要着眼于卷积神经网络,对卷积网络注意力机制发展过程中的各种主流方法进行介绍,并对其核心思想与实现过程进行提取与总结,同时对每种注意力机制方法进行实现,针对同型号辐射源设备实测数据进行对比实验与结果分析,并依据主流方法的思想与实验的结果总结并阐述了卷积网络中的注意力机制的研究现状与未来其发展方向。

    参考文献 | 相关文章 | 多维度评价
    6. 多模态数据融合综述
    任泽裕,王振超,柯尊旺,李哲,吾守尔·斯拉木
    计算机工程与应用    2021, 57 (18): 49-64.   DOI: 10.3778/j.issn.1002-8331.2104-0237
    摘要1659)      PDF(pc) (1214KB)(1759)    收藏

    随着当今信息技术的飞速发展,信息的存在形式多种多样,来源也十分广泛。不同的存在形式或信息来源均可被称之为一种模态,由两种或两种以上模态组成的数据称之为多模态数据。多模态数据融合负责将多个模态的信息进行有效的整合,汲取不同模态的优点,完成对信息的整合。自然现象具有十分丰富的特征,单一模态很难提供某个现象的完整信息。面对保持融合后具有各个模态信息的多样性以及完整性、使各个模态的优点最大化、减少融合过程造成的信息损失等方面的融合要求,如何对各个模态的信息进行融合成为了多个领域广泛存在的一个新挑战。简要阐述了常见的多模态融合方法、融合架构,总结了三个常见的融合模型,简要分析协同、联合、编解码器三大架构的优缺点以及多核学习、图像模型等具体融合方法。在多模态的应用方面,对多模态视频片段检索、综合多模态信息生成内容摘要、多模态情感分析、多模态人机对话系统进行了分析与总结。指出了当前多模态融合出现的问题,并提出未来的研究方向。

    相关文章 | 多维度评价
    7. 文本情感分析方法研究综述
    王婷,杨文忠
    计算机工程与应用    2021, 57 (12): 11-24.   DOI: 10.3778/j.issn.1002-8331.2101-0022
    摘要1489)      PDF(pc) (906KB)(1406)    收藏

    文本情感分析是自然语言处理领域的一个重要分支,广泛应用于舆情分析和内容推荐等方面,是近年来的研究热点。根据使用的不同方法,将其划分为基于情感词典的情感分析方法、基于传统机器学习的情感分析方法、基于深度学习的情感分析方法。通过对这三种方法进行对比,分析其研究成果,并对不同方法的优缺点进行归纳总结,介绍相关数据集和评价指标及应用场景,对情感分析子任务进行简单概括,发现将来的情感分析问题的研究趋势及应用领域,并为研究者在相关领域方面提供一定的帮助和指导。

    相关文章 | 多维度评价
    8. 基于CNN和LSTM的多通道注意力机制文本分类模型
    滕金保,孔韦韦,田乔鑫,王照乾,李龙
    计算机工程与应用    2021, 57 (23): 154-162.   DOI: 10.3778/j.issn.1002-8331.2104-0212
    摘要1454)      PDF(pc) (844KB)(492)    收藏

    针对传统的卷积神经网络(Convolutional Neural Network,CNN)和长短时记忆网络(Long Short-Term Memory,LSTM)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于CNN和LSTM的多通道注意力机制文本分类模型。使用CNN和LSTM提取文本局部信息和上下文特征;用多通道注意力机制(Attention)提取CNN和LSTM输出信息的注意力分值;将多通道注意力机制的输出信息进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上。在三个公开数据集上的实验结果表明,提出的模型相较于CNN、LSTM及其改进模型效果更好,可以有效提高文本分类的效果。

    参考文献 | 相关文章 | 多维度评价
    9. 多标签文本分类研究进展
    郝超,裘杭萍,孙毅,张超然
    计算机工程与应用    2021, 57 (10): 48-56.   DOI: 10.3778/j.issn.1002-8331.2101-0096
    摘要1420)      PDF(pc) (906KB)(1049)    收藏

    文本分类作为自然语言处理中一个基本任务,在20世纪50年代就已经对其算法进行了研究,现在单标签文本分类算法已经趋向成熟,但是对于多标签文本分类的研究还有很大的提升空间。介绍了多标签文本分类的基本概念以及基本流程,包括数据集获取、文本预处理、模型训练和预测结果。介绍了多标签文本分类的方法。这些方法主要分为两大类:传统机器学习方法和基于深度学习的方法。传统机器学习方法主要包括问题转换方法和算法自适应方法。基于深度学习的方法是利用各种神经网络模型来处理多标签文本分类问题,根据模型结构,将其分为基于CNN结构、基于RNN结构和基于Transfomer结构的多标签文本分类方法。对多标签文本分类常用的数据集进行了梳理总结。对未来的发展趋势进行了分析与展望。

    相关文章 | 多维度评价
    10. 水果采摘机器人视觉系统与机械手研究进展
    苟园旻, 闫建伟, 张富贵, 孙成宇, 徐勇
    计算机工程与应用    2023, 59 (9): 13-26.   DOI: 10.3778/j.issn.1002-8331.2209-0183
    摘要1335)      PDF(pc) (787KB)(934)    收藏
    水果采摘机器人对实现水果装备自动化智能化具有重要意义。对近年国内外水果采摘机器人领域关键技术研究工作进行总结,根据水果采摘机器人的重要组成结构与关键技术,对水果采摘机器人视觉系统的关键技术:传统基于水果特征的图像分割方法如阈值法、边缘检测法、基于颜色特征的聚类算法与基于区域的图像分割算法,基于深度学习的目标识别算法以及目标果实的定位等进行分析和对比;总结了水果采摘机器人机械臂与末端执行器的技术发展现状,指出水果采摘机器人存在的问题;对未来水果采摘机器人的发展趋势及方向进行了展望,可为水果采摘机器人相关研究提供参考。
    参考文献 | 相关文章 | 多维度评价
    11. 引入注意力机制的YOLOv5安全帽佩戴检测方法
    王玲敏, 段军, 辛立伟
    计算机工程与应用    2022, 58 (9): 303-312.   DOI: 10.3778/j.issn.1002-8331.2112-0242
    摘要1317)      PDF(pc) (1381KB)(744)    收藏
    对于钢铁制造业、煤矿行业及建筑行业等高危行业来说,施工过程中佩戴安全帽是避免受伤的有效途径之一。针对目前安全帽佩戴检测模型在复杂环境下对小目标和密集目标存在误检和漏检等问题,提出一种改进YOLOv5的目标检测方法来对安全帽的佩戴进行检测。在YOLOv5的主干网络中添加坐标注意力机制(coordinate attention),该机制将位置信息嵌入到通道注意力当中,使网络可以在更大区域上进行注意。将特征融合模块中原有特征金字塔模块替换成加权双向特征金字塔(BiFPN)网络结构,实现高效的双向跨尺度连接和加权特征融合。在自制安全帽数据集上实验结果表明,改进的YOLOv5模型平均精度达到了95.9%,相比于YOLOv5模型,平均精度提高了5.1个百分点,达到了在复杂环境下对小目标和密集目标检测的要求。
    参考文献 | 相关文章 | 多维度评价
    12. 多智能体路径规划综述
    刘志飞, 曹雷, 赖俊, 陈希亮, 陈英
    计算机工程与应用    2022, 58 (20): 43-64.   DOI: 10.3778/j.issn.1002-8331.2203-0467
    摘要1277)      PDF(pc) (1013KB)(548)    收藏
    多智能体路径规划(multi-agent path finding,MAPF)是为多个智能体规划路径的问题,关键约束是多个智能体同时沿着规划路径行进而不会发生冲突。MAPF在物流、军事、安防等领域有着大量应用。对国内外关于MAPF的主要研究成果进行系统整理和分类,按照规划方式不同,MAPF算法分为集中式规划算法和分布式执行算法。集中式规划算法是最经典和最常用的MAPF算法,主要分为基于[A*]搜索、基于冲突搜索、基于代价增长树和基于规约四种算法。分布式执行算法是人工智能领域兴起的基于强化学习的MAPF算法,按照改进技术不同,分布式执行算法分为专家演示型、改进通信型和任务分解型三种算法。基于上述分类,比较MAPF各种算法的特点和适用性,分析现有算法的优点和不足,指出现有算法面临的挑战并对未来工作进行了展望。
    参考文献 | 相关文章 | 多维度评价
    13. 基于计算机视觉的Transformer研究进展
    刘文婷, 卢新明
    计算机工程与应用    2022, 58 (6): 1-16.   DOI: 10.3778/j.issn.1002-8331.2106-0442
    摘要1271)      PDF(pc) (1089KB)(824)    收藏
    Transformer是一种基于自注意力机制、并行化处理数据的深度神经网络。近几年基于Transformer的模型成为计算机视觉任务的重要研究方向。针对目前国内基于Transformer综述性文章的空白,对其在计算机视觉上的应用进行概述。回顾了Transformer的基本原理,重点介绍了其在图像分类、目标检测、图像分割等七个视觉任务上的应用,并对效果显著的模型进行分析。最后对Transformer在计算机视觉中面临的挑战以及未来的发展趋势进行了总结和展望。
    参考文献 | 相关文章 | 多维度评价
    14. 基于改进YOLOv5的目标检测算法研究
    邱天衡, 王玲, 王鹏, 白燕娥
    计算机工程与应用    2022, 58 (13): 63-73.   DOI: 10.3778/j.issn.1002-8331.2202-0093
    摘要1226)      PDF(pc) (1109KB)(511)    收藏
    YOLOv5是目前单阶段目标检测性能较好的算法,但对目标边界回归的精确度不高,难以适用对预测框交并比要求较高的场景。基于YOLOv5算法,提出一种对硬件要求低、模型收敛速度快、目标框准确率高的新模型YOLO-G。改进特征金字塔结构(FPN),采用跨层级联的方式融合更多的特征,一定程度上防止了浅层语义信息的丢失,同时加深金字塔深度,对应增加检测层,使各种锚框的铺设间隔更加合理;其次把并行模式的注意力机制融入到网络结构中,赋予空间注意力模块和通道注意力模块相同的优先级,以加权融合的方式提取注意力信息,使网络可根据对空间和通道注意力的关注程度得到混合域注意力;通过降低网络的参数量和计算量对网络进行轻量化处理,防止因模型复杂度提升造成实时性能的损失。使用PASCAL VOC的2007、2012两个数据集来验证算法的有效性,YOLO-G比YOLOv5s的参数量减少了4.7%,计算量减少了47.9%,而mAP@0.5提高了3.1个百分点,mAP@0.5:0.95提高了5.6个百分点。
    参考文献 | 相关文章 | 多维度评价
    15. 多智能体博弈强化学习研究综述
    王军,曹雷,陈希亮,赖俊,章乐贵
    计算机工程与应用    2021, 57 (21): 1-13.   DOI: 10.3778/j.issn.1002-8331.2104-0432
    摘要1118)      PDF(pc) (779KB)(1228)    收藏

    使用深度强化学习解决单智能体任务已经取得了突破性的进展。由于多智能体系统的复杂性,普通算法无法解决其主要难点。同时,由于智能体数量增加,将最大化单个智能体的累积回报的期望值作为学习目标往往无法收敛,某些特殊的收敛点也不满足策略的合理性。对于不存在最优解的实际问题,强化学习算法更是束手无策,将博弈理论引入强化学习可以很好地解决智能体的相互关系,可以解释收敛点对应策略的合理性,更重要的是可以用均衡解来替代最优解以求得相对有效的策略。因此,从博弈论的角度梳理近年来出现的强化学习算法,总结当前博弈强化学习算法的重难点,并给出可能解决上述重难点的几个突破方向。

    参考文献 | 相关文章 | 多维度评价
    16. 智能博弈对抗中的对手建模方法及其应用综述
    魏婷婷, 袁唯淋, 罗俊仁, 张万鹏
    计算机工程与应用    2022, 58 (9): 19-29.   DOI: 10.3778/j.issn.1002-8331.2202-0297
    摘要1076)      PDF(pc) (904KB)(414)    收藏
    智能博弈对抗一直是人工智能研究的热点。在博弈对抗环境中,通过对对手进行建模,可以推测敌对智能体动作、目标、策略等相关属性,为博弈策略制定提供关键信息。对手建模方法在竞技类游戏和作战仿真推演等领域的应用前景广阔,博弈策略的制定必须以博弈各方的行动策略为前提,因此建立一个准确的对手行为模型对于预测其意图尤其重要。从内涵、方法、应用三个方面,阐述了对手建模的必要性,对现有建模方式进行了分类;对基于强化学习的预测方法、基于心智理论的推理方法和基于贝叶斯的优化方法进行了梳理与总结;以序贯博弈(德州扑克)、即时策略博弈(星际争霸)和元博弈为典型应用场景,分析了智能博弈对抗过程中的对手建模的作用;从有限理性、策略欺骗性和可解释性三个方面进行了对手建模技术发展的展望。
    参考文献 | 相关文章 | 多维度评价
    17. 神经风格迁移模型综述
    唐稔为,刘启和,谭浩
    计算机工程与应用    2021, 57 (19): 32-43.   DOI: 10.3778/j.issn.1002-8331.2105-0296
    摘要1071)      PDF(pc) (1078KB)(709)    收藏

    神经风格迁移技术主要用于对图像、视频等进行风格化,使其具有艺术美感,该领域极具应用价值,是人工智能的热门研究领域之一。为推动神经风格迁移领域的研究发展,对神经风格迁移技术进行了全面概述。简述了非真实感渲染技术和传统的纹理迁移技术。对现有神经风格迁移模型进行了分类整理,并详细探讨了各类代表性模型的算法原理及后续改进,分析了神经风格迁移技术的应用市场。提出对风格迁移模型质量的评判应该从定性评估和定量评估两个方面来考虑,并从各个角度讨论了现阶段风格迁移技术存在的问题以及未来研究方向。最后强调应提高模型的综合能力,在保证生成质量的情况下提升生成速度以及泛化能力。

    参考文献 | 相关文章 | 多维度评价
    18. 中文领域命名实体识别综述
    焦凯楠,李欣,朱容辰
    计算机工程与应用    2021, 57 (16): 1-15.   DOI: 10.3778/j.issn.1002-8331.2103-0127
    摘要1070)      PDF(pc) (928KB)(647)    收藏

    命名实体识别(Named Entity Recognition,NER)作为自然语言处理领域经典的研究主题,是智能问答、知识图谱等任务的基础技术。领域命名实体识别(Domain Named Entity Recognition,DNER)是面向特定领域的NER方案。在深度学习技术的推动下,中文DNER取得了突破性进展。概括了中文DNER的研究框架,从领域数据源的确定、领域实体类型及规范制定、领域数据集的标注规范、中文DNER评估指标四个角度对国内外已有研究成果进行了综合评述;总结了目前常见的中文DNER的技术框架,介绍了基于词典和规则的模式匹配方法、统计机器学习方法、基于深度学习的方法、多方融合的深度学习方法,并重点分析了基于词向量表征和深度学习的中文DNER方法;讨论了中文DNER的典型应用场景,对未来发展方向进行了展望。

    相关文章 | 多维度评价
    19. 多组学数据整合分析和应用研究综述
    钟雅婷,林艳梅,陈定甲,彭昱忠,曾远鹏
    计算机工程与应用    2021, 57 (23): 1-17.   DOI: 10.3778/j.issn.1002-8331.2106-0341
    摘要1053)      PDF(pc) (806KB)(1664)    收藏

    随着组学新测序技术的不断涌现和推广,产生了大量的组学数据,这些数据对人们深入研究和揭示生命奥秘有着极重要的意义。利用多组学数据整合技术分析生命科学问题可获得更丰富更全面的生命系统相关信息,已成为研究者探索生命机制的新方向。介绍了多组学数据整合分析的研究背景和研究意义,综述了近年来多组学数据整合分析的方法和相关领域的应用研究,探讨了多组学数据整合分析方法当前所存在的问题以及未来展望。

    参考文献 | 相关文章 | 多维度评价
    20. 改进TEB算法的局部路径规划算法研究
    代婉玉, 张丽娟, 吴佳峰, 马向华
    计算机工程与应用    2022, 58 (8): 283-288.   DOI: 10.3778/j.issn.1002-8331.2108-0290
    摘要997)      PDF(pc) (878KB)(201)    收藏
    在复杂动态环境中用传统TEB(time elastic band)算法规划路径时,会出现速度控制量不平滑导致的路径震荡、给机器人带来较大冲击和易发生碰撞。针对以上问题对传统TEB算法进行改进,对检测到的不规则障碍物膨胀化处理并进行区域分级策略,优先考虑安全区域的行驶路线,使机器人在复杂环境中更加安全平稳地运行。在算法中加入障碍物距离对速度的约束,能有效降低机器人靠近障碍物后因速度跳变导致的路径行驶过程的震荡幅度和机器人受到的冲击,以保障机器人运行时的安全。通过在ROS环境中的大量对比仿真,表明在复杂动态环境中改进后TEB算法规划的路径更安全平滑,能有效减少机器人受到的冲击。
    参考文献 | 相关文章 | 多维度评价
    21. 三维人体姿态估计研究综述
    王发明,李建微,陈思喜
    计算机工程与应用    2021, 57 (10): 26-38.   DOI: 10.3778/j.issn.1002-8331.2102-0039
    摘要983)      PDF(pc) (1035KB)(1180)    收藏

    三维人体姿态估计在本质上是一个分类问题和回归问题,主要通过图像估计人体的三维姿态。基于传统方法和深度学习方法的三维人体姿态估计是当前研究的主流方法。按照传统方法到深度学习方法的顺序对近年来三维人体姿态估计方法进行系统介绍,从而了解传统方法通过生成和判别等方法得到人体姿态的众多要素完成三维人体姿态的估计。基于深度学习的三维人体姿态估计方法主要通过构建神经网络,从图像特征中回归出人体姿态信息,大致可以分为基于直接回归方法、基于2D信息方法和基于混合方法的三维人体姿态估计这三类。最后对当前三维人体姿态估计研究所面临的困难与挑战进行阐述,并对未来的研究趋势做出展望。

    相关文章 | 多维度评价
    22. 基于深度学习的视觉多目标跟踪算法综述
    张瑶,卢焕章,张路平,胡谋法
    计算机工程与应用    2021, 57 (13): 55-66.   DOI: 10.3778/j.issn.1002-8331.2102-0260
    摘要967)      PDF(pc) (931KB)(846)    收藏

    视觉多目标跟踪是计算机视觉领域的热点问题,然而,场景中目标数量的不确定、目标之间的相互遮挡、目标特征区分度不高等多种难题导致了视觉多目标跟踪现实应用进展缓慢。近年来,随着视觉智能处理研究的不断深入,涌现出多种多样的深度学习类视觉多目标跟踪算法。在分析了视觉多目标跟踪面临的挑战和难点基础上,将算法分为基于检测跟踪(Detection-Based-Tracking,DBT)、联合检测跟踪(Joint-Detection-Tracking,JDT)两大类及六个子类,研究不同类别算法的优缺点。分析表明,DBT类算法结构简单,但算法各子环节的关联度不高,JDT类算法融合多模块联合学习,在多项跟踪评价指标中占优。DBT类算法中特征提取模块是解决目标遮挡问题的关键,但损失了算法速度,JDT类算法对检测模块更为依赖。目前,多目标跟踪跟踪总体是从DBT类算法向JDT发展,分阶段实现算法准确度与速度的均衡;提出多目标跟踪算法未来在数据集、各子模块、具体场景应用等方面的发展方向。

    相关文章 | 多维度评价
    23. 零样本学习综述
    王泽深,杨云,向鸿鑫,柳青
    计算机工程与应用    2021, 57 (19): 1-17.   DOI: 10.3778/j.issn.1002-8331.2106-0133
    摘要956)      PDF(pc) (1267KB)(559)    收藏

    尽管自深度学习发展以来,减少大量人工标记样本的需求使得零样本学习取得了不错的进展,以至于已经拥有比较完善的理论体系。但是对于零样本学习应用的研究寥寥无几,如何有效地对应用领域进行梳理是现阶段急需解决的问题。对零样本的理论体系进行介绍,通过一个例子引出零样本学习的定义,继而与广义零样本、监督学习比较,再而列举4个关键问题以及现有的解决方案,给出文本、图像、视频三方面常用的数据集;按照关键技术(属性、嵌入以及生成模型)出现时间顺序,对13个典型模型如何进行零样本学习展开描述,并对优点、缺点、创新点、挑选数据集以及表现进行总结;从词、图像、视频3个维度详细介绍了零样本学习在各个领域的应用;提出了零样本学习过程中出现的挑战并给出了对应的潜在研究方向。

    参考文献 | 相关文章 | 多维度评价
    24. 深度学习的典型目标检测算法研究综述
    许德刚,王露,李凡
    计算机工程与应用    2021, 57 (8): 10-25.   DOI: 10.3778/j.issn.1002-8331.2012-0449
    摘要946)      PDF(pc) (736KB)(792)    收藏

    目标检测是计算机视觉的一个重要研究方向,其目的是精确识别给定图像中特定目标物体的类别和位置。近年来,深度卷积神经网络(Deep Convolutional Neural Networks,DCNN)所具有的特征学习和迁移学习能力,在目标检测算法特征提取、图像表达、分类与识别等方面取得了显著进展。介绍了基于深度学习目标检测算法的研究进展、常用数据集特点以及性能指标评价的关键参数,对比分析了双阶段、单阶段以及其他改进算法的网络结构和实现方式。阐述了算法在人脸、显著目标、行人、遥感图像、医学图像、粮虫等检测领域的应用进展,结合当前存在的问题和挑战,展望分析了其未来的研究方向。

    相关文章 | 多维度评价
    25. 融合改进A*与DWA算法的机器人动态路径规划
    刘建娟,薛礼啟,张会娟,刘忠璞
    计算机工程与应用    2021, 57 (15): 73-81.   DOI: 10.3778/j.issn.1002-8331.2103-0525
    摘要943)      PDF(pc) (1452KB)(803)    收藏

    传统A*算法是移动机器人全局路径规划的常用算法之一,但是算法搜索效率低、规划路径转折点多、面对复杂环境中随机出现的动态障碍物无法实现动态路径规划。针对这些问题,在考虑全局最优的基础上将改进A*与DWA算法融合,量化环境中的障碍物信息,根据此信息调节A*算法启发函数的权重,提高算法的效率和灵活性。基于Floyd算法思想设计路径节点优化算法,删除冗余节点,减少转折,提高路径平滑度。基于全局最优设计DWA算法的动态窗口评价函数,用于区分已知障碍物和未知动态、静态障碍物,提取改进A*算法规划路径的关键点作为DWA算法的临时目标点,在全局最优的基础上实现了改进A*与DWA算法融合。实验结果表明,在复杂环境中,融合算法规划路径既能保证全局最优,又能及时有效地躲避环境中出现的动静态障碍物,实现复杂环境中的动态路径规划。

    相关文章 | 多维度评价
    26. 基于自编码器的深度聚类算法综述
    陶文彬, 钱育蓉, 张伊扬, 马恒志, 冷洪勇, 马梦楠
    计算机工程与应用    2022, 58 (18): 16-25.   DOI: 10.3778/j.issn.1002-8331.2204-0049
    摘要918)      PDF(pc) (724KB)(325)    收藏
    聚类分析作为一种常见的分析方法,广泛应用于各种场景。随着机器学习技术的发展,深度聚类算法也成了当下研究的热点,基于自编码器的深度聚类算法是其中的代表算法。为了及时了解掌握基于自编码器的深度聚类算法的发展,介绍了四种自编码器的模型,对近些年代表性的算法依照自编码器的结构进行了分类。在MNIST、USPS、Fashion-MNIST数据集上,针对传统聚类算法和基于自编码器的深度聚类算法进行了实验对比、分析,最后对基于自编码器的深度聚类算法目前存在的问题进行了总结,展望了深度聚类算法的研究方向。
    参考文献 | 相关文章 | 多维度评价
    27. 基于Transformer的目标检测算法综述
    李建, 杜建强, 朱彦陈, 郭永坤
    计算机工程与应用    2023, 59 (10): 48-64.   DOI: 10.3778/j.issn.1002-8331.2211-0133
    摘要895)      PDF(pc) (875KB)(506)    收藏
    深度学习框架Transformer具有强大的建模能力和并行计算能力,目前基于Transformer的目标检测算法已经成为研究的热点。为了进一步探索目标检测的新思路、新方向,对基于Transformer的目标检测算法进行了归纳总结。概述了多种目标检测数据集及其应用场景,从特征学习、目标估计、标签匹配策略和算法应用四方面梳理了Transformer目标检测的相关算法,并与基于卷积神经网络的目标检测算法进行对比,分析了Transformer在目标检测任务中的优点和局限性,并提出了Transformer目标检测模型的一般性框架。对Transformer在目标检测领域中的发展趋势进行了展望。
    参考文献 | 相关文章 | 多维度评价
    28. 移动机器人路径规划算法的研究综述
    林韩熙,向丹,欧阳剑,兰晓东
    计算机工程与应用    2021, 57 (18): 38-48.   DOI: 10.3778/j.issn.1002-8331.2103-0519
    摘要858)      PDF(pc) (865KB)(462)    收藏

    路径规划是移动机器人的热门研究之一,是实现机器人自主导航的关键技术。针对移动机器人路径规划的算法进行研究,以了解不同条件下路径规划算法的发展与应用,系统性地总结了路径规划的研究现状和发展。针对移动机器人路径规划的特点,将其划分为智能搜索算法、基于人工智能算法、基于几何模型算法和用于局部避障算法。基于上述分类,介绍了近年来具有代表性的研究成果,重点分析各类规划算法的优缺点,对移动机器人路径规划的未来发展趋势进行展望,为移动机器人路径规划研究提供一定的思路。

    相关文章 | 多维度评价
    29. 深度学习模型可解释性研究综述
    曾春艳,严康,王志锋,余琰,纪纯妹
    计算机工程与应用    2021, 57 (8): 1-9.   DOI: 10.3778/j.issn.1002-8331.2012-0357
    摘要840)      PDF(pc) (677KB)(1213)    收藏

    深度学习技术以数据驱动学习的特点,在自然语言处理、图像处理、语音识别等领域取得了巨大成就。但由于深度学习模型网络过深、参数多、复杂度高等特性,该模型做出的决策及中间过程让人类难以理解,因此探究深度学习的可解释性成为当前人工智能领域研究的新课题。以深度学习模型可解释性为研究对象,对其研究进展进行总结阐述。从自解释模型、特定模型解释、不可知模型解释、因果可解释性四个方面对主要可解释性方法进行总结分析。列举出可解释性相关技术的应用,讨论当前可解释性研究存在的问题并进行展望,以推动深度学习可解释性研究框架的进一步发展。

    相关文章 | 多维度评价
    30. 深度强化学习算法在智能军事决策中的应用
    况立群,李思远,冯利,韩燮,徐清宇
    计算机工程与应用    2021, 57 (20): 271-278.   DOI: 10.3778/j.issn.1002-8331.2104-0114
    摘要839)      PDF(pc) (1223KB)(534)    收藏

    深度强化学习算法能够很好地实现离散化的决策行为,但是难以运用于高度复杂且行为连续的现代战场环境,同时多智能体环境下算法难以收敛。针对这些问题,提出了一种改进的深度确定策略梯度(DDPG)算法,该算法引入了基于优先级的经验重放技术和单训练模式,以提高算法收敛速度;同时算法中还设计了一种混合双噪声的探索策略,从而实现复杂且连续的军事决策控制行为。采用Unity开发了基于改进DDPG算法的智能军事决策仿真平台,搭建了蓝军步兵进攻红军军事基地的仿真环境,模拟多智能体的作战训练。实验结果显示,该算法能够驱动多作战智能体完成战术机动,实现绕过障碍物抵达优势区域进行射击等战术行为,算法拥有更快的收敛速度和更好的稳定性,可得到更高的回合奖励,达到了提高智能军事决策效率的目的。

    参考文献 | 相关文章 | 多维度评价
    31. COVID-19医学影像数据集及研究进展
    刘锐,丁辉,尚媛园,邵珠宏,刘铁
    计算机工程与应用    2021, 57 (22): 15-27.   DOI: 10.3778/j.issn.1002-8331.2106-0118
    摘要829)      PDF(pc) (1013KB)(358)    收藏

    由于影像学技术在新型冠状病毒肺炎(COVID-19)的诊断和评估中发挥了重要作用,COVID-19相关数据集陆续被公布,但目前针对相关文献中数据集以及研究进展的整理相对较少。为此,通过COVID-19相关的期刊论文、报告和相关开源数据集网站,对涉及到的新冠肺炎数据集及深度学习模型进行整理和分析,包括计算机断层扫描(CT)图像数据集和X射线(CXR)图像数据集。对这些数据集呈现的医学影像的特征进行分析;重点论述开源数据集,以及在相关数据集上表现较好的分类和分割模型。最后讨论了肺部影像学技术未来的发展趋势。

    参考文献 | 相关文章 | 多维度评价
    32. 基于深度学习的视觉里程计方法综述
    职恒辉, 尹晨阳, 李慧斌
    计算机工程与应用    2022, 58 (20): 1-15.   DOI: 10.3778/j.issn.1002-8331.2203-0480
    摘要822)      PDF(pc) (904KB)(443)    收藏
    视觉里程计(visual odometry,VO)是处理搭载视觉传感器的移动设备定位问题的一种常用方法,在自动驾驶、移动机器人、AR/VR等领域得到了广泛应用。与传统基于模型的方法相比,基于深度学习的方法可在不需显式计算的情况下从数据中学习高效且鲁棒的特征表达,从而提升其对于光照变化、少纹理等挑战性场景的鲁棒性。简略回顾了基于模型的视觉里程计方法,从监督学习方法、无监督学习方法、模型与学习融合方法、常用数据集、评价指标、模型法与深度学习方法对比分析六个方面全面介绍了基于深度学习的视觉里程计方法。指出了基于深度学习视觉里程计仍存在的问题和未来的发展趋势。
    参考文献 | 相关文章 | 多维度评价
    33. 融合U-Net及MobileNet-V2的快速语义分割网络
    兰天翔,向子彧,刘名果,陈凯
    计算机工程与应用    2021, 57 (17): 175-180.   DOI: 10.3778/j.issn.1002-8331.2005-0278
    摘要819)      PDF(pc) (1156KB)(257)    收藏

    传统U-Net网络模型大,处理图片速度慢,难以适应工业生产中实时的需求。针对该问题,设计并实现了一个轻量级全卷积语义分割网络LU-Net。LU-Net网络以U-Net框架为主体,结合MobileNet-V2的思想,利用深度可分离卷积参数少、计算量小的特点轻量化网络模型。网络综合利用bottleneck模块与普通卷积的优点,并高效利用了高层特征,在保持精度的同时,大幅缩短了分割所需时间。经公开数据集DRIVE及自制凹陷字符数据集上实验的验证,相较于原U-Net网络模型,提出的LU-Net模型参数量缩小至0.59×106,为原模型的1.9%,运行速度提高5倍,处理一张360×270图片的平均耗时为25?ms。LU-Net基本满足工业生产对图像实时处理的要求。

    相关文章 | 多维度评价
    34. 小样本困境下的图像语义分割综述
    韦婷, 李馨蕾, 刘慧
    计算机工程与应用    2023, 59 (2): 1-11.   DOI: 10.3778/j.issn.1002-8331.2205-0496
    摘要814)      PDF(pc) (4301KB)(594)    收藏
    近年来,由于大规模数据集的出现,图像语义分割技术得到快速发展。但在实际场景中,并不容易获取到大规模、高质量的图像,图像的标注也需要消耗大量的人力和时间成本。为了摆脱对样本数量的依赖,小样本语义分割技术逐渐成为研究热点。当前小样本语义分割的方法主要利用了元学习的思想,按照不同的模型结构可划分为基于孪生神经网络、基于原型网络和基于注意力机制三大类。基于近年来小样本语义分割的发展现状,介绍了小样本语义分割各类方法的发展及优缺点,以及小样本语义分割任务中常用的数据集及实验设计。在此基础上,总结了小样本语义分割技术的应用场景及未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    35. 无人机航拍图像语义分割研究综述
    程擎,范满,李彦冬,赵远,李诚龙
    计算机工程与应用    2021, 57 (19): 57-69.   DOI: 10.3778/j.issn.1002-8331.2105-0423
    摘要812)      PDF(pc) (926KB)(601)    收藏

    随着无人机技术的快速发展,无人机在研究领域和工业应用方面受到了广泛的关注。图像和视频是无人机感知周围环境的重要途径。图像语义分割是计算机视觉领域的研究热点,在无人驾驶、智能机器人等场景中应用广泛。无人机航拍图像语义分割是在无人机航拍图像的基础上,运用语义分割技术使无人机获得场景目标智能感知能力。介绍了语义分割技术和无人机的应用发展、相关无人机航拍数据集、无人机航拍图像特点和常用语义分割评价指标。针对无人机航拍的特点介绍了相关语义分割方法,包括小目标、模型实时性和多尺度整合等方面。综述无人机语义分割相关应用,包括线检测、农业和建筑物提取等方向,并分析无人机语义分割未来发展趋势和挑战。

    参考文献 | 相关文章 | 多维度评价
    36. 基于深度学习的图像质量评价方法综述
    曹玉东,刘海燕,贾旭,李晓会
    计算机工程与应用    2021, 57 (23): 27-36.   DOI: 10.3778/j.issn.1002-8331.2106-0228
    摘要787)      PDF(pc) (646KB)(843)    收藏

    图像质量评价是对图像或视频的视觉质量的一种度量,主要分析了最近10年图像质量评价算法的研究情况。介绍了图像质量评价算法的衡量指标以及常用的图像质量评价数据集,对图像质量评价方法的分类做了阐述,重点分析了基于深度学习技术的图像质量评价算法。目前,该类算法的基础模型主要包括深度卷积神经网络、深度生成对抗网络和变换器,其性能通常高于传统的图像质量评价算法。描述了基于深度学习技术的图像质量评价算法的原理,重点介绍了基于深度生成对抗网络的无参考图像质量评价算法,通过增强对抗学习强度提高模拟参考图的可靠性。深度学习技术需要海量训练数据的支持,探讨和总结数据集增强的方法,对数字图像质量评价方法的未来研究进行展望。

    参考文献 | 相关文章 | 多维度评价
    37. 深度学习小目标检测算法研究综述
    张艳, 张明路, 吕晓玲, 郭策, 蒋志宏
    计算机工程与应用    2022, 58 (15): 1-17.   DOI: 10.3778/j.issn.1002-8331.2112-0176
    摘要784)      PDF(pc) (995KB)(432)    收藏
    目标检测的主要目的是在图像中快速精准地识别定位出预定义类别的目标。而随着深度学习技术的不断发展,检测算法在相应行业大、中目标已达到了不错的成效。鉴于小目标在图像中尺寸较小、特征不全、与图像中背景差异大等特点,基于深度学习的小目标检测算法性能仍需要进一步提升和优化;小目标检测在无人驾驶、医疗诊断、无人机导航等多个领域都有着广泛的需求,因此研究有着很高的应用价值。在文献调研的基础上,先给出小目标检测定义,找到当前小目标检测的重难点;根据这些重难点从六个研究方向分析当前研究现状,并总结各算法优缺点;结合文献及发展现状对该领域未来的研究方向做出合理预测与展望,为后续研究提供一定基础参考。
    参考文献 | 相关文章 | 多维度评价
    38. 道路交通流数据预测方法研究综述
    孟闯, 王慧, 林浩, 李科岑, 王鑫鹏
    计算机工程与应用    2023, 59 (14): 51-61.   DOI: 10.3778/j.issn.1002-8331.2209-0458
    摘要778)      PDF(pc) (605KB)(343)    收藏
    道路交通流预测作为智能交通系统中的重要分支,在道路拥堵预测、路径规划等方面起着重要作用。道路交通流数据时空多态、关联性复杂的特性迫使大数据时代下的道路交通流预测方法转型和升级。为了深入挖掘交通流时空性的特征,学者们相继提出各类方法,包括模型融合、模型算法改进、数据定义转换等方式,以求提高模型的预测精度。为了合理综述各类交通流的预测方法,根据所用方法的种类分为三大类:基于统计学的方法、基于机器学习的方法、基于深度学习的方法。通过综述各类交通流预测方法,对近年来新出现的模型与算法进行概括与分析,旨在为相关研究学者提供研究思路。对交通流预测方法进行了总结及展望,给出未来交通流预测领域的探索方向。
    参考文献 | 相关文章 | 多维度评价
    39. 生成对抗网络及其应用研究综述
    魏富强,古兰拜尔·吐尔洪,买日旦·吾守尔
    计算机工程与应用    2021, 57 (19): 18-31.   DOI: 10.3778/j.issn.1002-8331.2104-0248
    摘要772)      PDF(pc) (1078KB)(1157)    收藏

    生成对抗网络的理论研究与应用不断获得成功,已经成为当前深度学习领域研究的热点之一。对生成对抗网络理论及其应用从模型的类型、评价标准和理论研究进展等方面进行系统的综述:分别分析基于显式密度和基于隐式密度的生成模型的优缺点;总结生成对抗网络的评价标准,解读各标准之间的关系,并从应用层面介绍生成对抗网络在图像及其他领域中的研究进展,即通过图像转换、图像生成、图像修复、视频生成、文本生成及图像超分辨率等的应用;从模型的结构表示、训练控制、性能稳定以及评价标准等角度分析生成对抗网络的理论研究进展。研究讨论生成对抗网络的挑战,展望未来可能存在的发展方向。

    参考文献 | 相关文章 | 多维度评价
    40. 基于深度学习的烟雾与火灾检测算法综述
    祝玉华, 司艺艺, 李智慧
    计算机工程与应用    2022, 58 (23): 1-11.   DOI: 10.3778/j.issn.1002-8331.2206-0154
    摘要771)      PDF(pc) (782KB)(422)    收藏
    在各种灾害中,火灾是最经常、最普遍的威胁公众安全和社会发展的主要灾害之一。随着经济建设的迅猛发展,城市规模日趋扩大,重大火灾隐患急剧增加。然而,目前广泛使用的烟雾传感器探测火灾的方法,易受距离等因素影响,导致检测不及时。视频监控系统的引入为解决这一问题提供了新思路,基于视频的传统图像处理算法是较早提出的方法,最近机器视觉与图像处理技术快速发展,涌现出一系列使用深度学习技术来自动检测视频和图像中火灾的方法,在消防安全领域具有非常重要的实际应用价值。为了综合分析火灾检测的深度学习方法相关改进及应用,简要介绍了基于深度学习的火灾检测流程,重点从分类、检测、分割3个粒度对火灾检测的深度方法详细对比分析,阐述每类算法针对现有问题采取的相关改进。总结现阶段火灾检测存在的问题,并提出未来的研究方向。
    参考文献 | 相关文章 | 多维度评价