摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 一年内发表文章
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于计算机视觉的Transformer研究进展
    刘文婷, 卢新明
    计算机工程与应用    2022, 58 (6): 1-16.   DOI: 10.3778/j.issn.1002-8331.2106-0442
    摘要452)      PDF(pc) (1089KB)(401)    收藏
    Transformer是一种基于自注意力机制、并行化处理数据的深度神经网络。近几年基于Transformer的模型成为计算机视觉任务的重要研究方向。针对目前国内基于Transformer综述性文章的空白,对其在计算机视觉上的应用进行概述。回顾了Transformer的基本原理,重点介绍了其在图像分类、目标检测、图像分割等七个视觉任务上的应用,并对效果显著的模型进行分析。最后对Transformer在计算机视觉中面临的挑战以及未来的发展趋势进行了总结和展望。
    参考文献 | 相关文章 | 多维度评价
    2. 深度学习在自然语言处理领域的研究进展
    江洋洋,金伯,张宝昌
    计算机工程与应用    2021, 57 (22): 1-14.   DOI: 10.3778/j.issn.1002-8331.2106-0166
    摘要422)      PDF(pc) (1781KB)(123)    收藏

    通过定量与定性相结合的方式全面分析了深度学习在自然语言处理领域的研究情况。采用CiteSpace和VOSviewer对深度学习在自然语言处理领域的研究国家、机构、期刊分布、关键词共现、共被引网络聚类及时间轴视图等进行知识图谱绘制,理清研究脉络。通过深入挖掘领域内的重要文献,总结深度学习在自然语言处理领域的研究趋势、存在的主要问题或发展瓶颈,并给出相应的解决办法与思路。对于如何跟踪深度学习在自然语言处理领域的研究成果给出建议,为该领域的后续研究与发展提供参考。

    参考文献 | 相关文章 | 多维度评价
    3. 迁移学习方法在医学图像领域的应用综述
    高爽,徐巧枝
    计算机工程与应用    2021, 57 (24): 39-50.   DOI: 10.3778/j.issn.1002-8331.2107-0300
    摘要360)      PDF(pc) (896KB)(526)    收藏

    深度学习技术发展迅速,在医学图像处理领域取得了显著成果。但是由于医学图像样本少,标注困难,使得深度学习的效果远未达到预期。近年,利用迁移学习方法缓解医学图像样本不足的问题,提高深度学习技术在医学图像领域的效果,成为了研究热点之一。介绍了迁移学习方法的基本概念、类型、常用策略及模型,根据迁移学习方法的类型,对当前医学图像领域具有代表性的相关研究进行了梳理与小结,对该领域的未来发展进行了总结和展望。

    参考文献 | 相关文章 | 多维度评价
    4. 引入注意力机制的YOLOv5安全帽佩戴检测方法
    王玲敏, 段军, 辛立伟
    计算机工程与应用    2022, 58 (9): 303-312.   DOI: 10.3778/j.issn.1002-8331.2112-0242
    摘要357)      PDF(pc) (1381KB)(333)    收藏
    对于钢铁制造业、煤矿行业及建筑行业等高危行业来说,施工过程中佩戴安全帽是避免受伤的有效途径之一。针对目前安全帽佩戴检测模型在复杂环境下对小目标和密集目标存在误检和漏检等问题,提出一种改进YOLOv5的目标检测方法来对安全帽的佩戴进行检测。在YOLOv5的主干网络中添加坐标注意力机制(coordinate attention),该机制将位置信息嵌入到通道注意力当中,使网络可以在更大区域上进行注意。将特征融合模块中原有特征金字塔模块替换成加权双向特征金字塔(BiFPN)网络结构,实现高效的双向跨尺度连接和加权特征融合。在自制安全帽数据集上实验结果表明,改进的YOLOv5模型平均精度达到了95.9%,相比于YOLOv5模型,平均精度提高了5.1个百分点,达到了在复杂环境下对小目标和密集目标检测的要求。
    参考文献 | 相关文章 | 多维度评价
    5. 基于CNN和LSTM的多通道注意力机制文本分类模型
    滕金保,孔韦韦,田乔鑫,王照乾,李龙
    计算机工程与应用    2021, 57 (23): 154-162.   DOI: 10.3778/j.issn.1002-8331.2104-0212
    摘要348)      PDF(pc) (844KB)(227)    收藏

    针对传统的卷积神经网络(Convolutional Neural Network,CNN)和长短时记忆网络(Long Short-Term Memory,LSTM)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于CNN和LSTM的多通道注意力机制文本分类模型。使用CNN和LSTM提取文本局部信息和上下文特征;用多通道注意力机制(Attention)提取CNN和LSTM输出信息的注意力分值;将多通道注意力机制的输出信息进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上。在三个公开数据集上的实验结果表明,提出的模型相较于CNN、LSTM及其改进模型效果更好,可以有效提高文本分类的效果。

    参考文献 | 相关文章 | 多维度评价
    6. 智能博弈对抗中的对手建模方法及其应用综述
    魏婷婷, 袁唯淋, 罗俊仁, 张万鹏
    计算机工程与应用    2022, 58 (9): 19-29.   DOI: 10.3778/j.issn.1002-8331.2202-0297
    摘要325)      PDF(pc) (904KB)(116)    收藏
    智能博弈对抗一直是人工智能研究的热点。在博弈对抗环境中,通过对对手进行建模,可以推测敌对智能体动作、目标、策略等相关属性,为博弈策略制定提供关键信息。对手建模方法在竞技类游戏和作战仿真推演等领域的应用前景广阔,博弈策略的制定必须以博弈各方的行动策略为前提,因此建立一个准确的对手行为模型对于预测其意图尤其重要。从内涵、方法、应用三个方面,阐述了对手建模的必要性,对现有建模方式进行了分类;对基于强化学习的预测方法、基于心智理论的推理方法和基于贝叶斯的优化方法进行了梳理与总结;以序贯博弈(德州扑克)、即时策略博弈(星际争霸)和元博弈为典型应用场景,分析了智能博弈对抗过程中的对手建模的作用;从有限理性、策略欺骗性和可解释性三个方面进行了对手建模技术发展的展望。
    参考文献 | 相关文章 | 多维度评价
    7. COVID-19医学影像数据集及研究进展
    刘锐,丁辉,尚媛园,邵珠宏,刘铁
    计算机工程与应用    2021, 57 (22): 15-27.   DOI: 10.3778/j.issn.1002-8331.2106-0118
    摘要317)      PDF(pc) (1013KB)(241)    收藏

    由于影像学技术在新型冠状病毒肺炎(COVID-19)的诊断和评估中发挥了重要作用,COVID-19相关数据集陆续被公布,但目前针对相关文献中数据集以及研究进展的整理相对较少。为此,通过COVID-19相关的期刊论文、报告和相关开源数据集网站,对涉及到的新冠肺炎数据集及深度学习模型进行整理和分析,包括计算机断层扫描(CT)图像数据集和X射线(CXR)图像数据集。对这些数据集呈现的医学影像的特征进行分析;重点论述开源数据集,以及在相关数据集上表现较好的分类和分割模型。最后讨论了肺部影像学技术未来的发展趋势。

    参考文献 | 相关文章 | 多维度评价
    8. 上市公司文本信息披露智能分析研究综述
    吕品,武秦娟,许嘉
    计算机工程与应用    2021, 57 (24): 1-13.   DOI: 10.3778/j.issn.1002-8331.2106-0270
    摘要287)      PDF(pc) (724KB)(229)    收藏

    对上市公司发布的文本信息披露进行分析是投资者了解公司经营状况、做出投资决策的重要途径,然而人工阅读和分析的方法存在效率低、成本高等问题。人工智能技术的发展则为文本信息的智能分析提供了契机,能够从海量企业文本数据中挖掘有价值的信息,充分发挥数据驱动的优势,大幅度提高分析效率,成为近些年的研究热点。对近十年关于上市公司文本信息披露智能分析的研究工作进行了总结,分别从文本信息披露的事件类型的研究现状、智能分析方法和应用场景三个方面进行了归纳,分析了该领域当前面临的挑战,最后根据现有方法的不足指出了未来可能的研究方向。

    参考文献 | 相关文章 | 多维度评价
    9. 多智能体博弈强化学习研究综述
    王军,曹雷,陈希亮,赖俊,章乐贵
    计算机工程与应用    2021, 57 (21): 1-13.   DOI: 10.3778/j.issn.1002-8331.2104-0432
    摘要271)      PDF(pc) (779KB)(429)    收藏

    使用深度强化学习解决单智能体任务已经取得了突破性的进展。由于多智能体系统的复杂性,普通算法无法解决其主要难点。同时,由于智能体数量增加,将最大化单个智能体的累积回报的期望值作为学习目标往往无法收敛,某些特殊的收敛点也不满足策略的合理性。对于不存在最优解的实际问题,强化学习算法更是束手无策,将博弈理论引入强化学习可以很好地解决智能体的相互关系,可以解释收敛点对应策略的合理性,更重要的是可以用均衡解来替代最优解以求得相对有效的策略。因此,从博弈论的角度梳理近年来出现的强化学习算法,总结当前博弈强化学习算法的重难点,并给出可能解决上述重难点的几个突破方向。

    参考文献 | 相关文章 | 多维度评价
    10. 无人系统认知联合抗干扰通信研究综述
    王桂胜, 董淑福, 黄国策
    计算机工程与应用    2022, 58 (8): 1-11.   DOI: 10.3778/j.issn.1002-8331.2109-0334
    摘要244)      PDF(pc) (913KB)(237)    收藏
    随着电磁环境日益复杂、敌我对抗态势越发激烈,对无人系统信息传输的可靠性提出了更高的要求,传统节点的认知通信模式已难以适应未来自主化、分布式的宽带联合抗干扰发展趋势。针对无人系统面临的抗干扰低截获通信需求,围绕干扰的检测识别、变换分析和多域抑制等认知抗干扰关键技术展开具体分析,梳理常见的检测估计和分类识别研究现状;对典型干扰类型进行分类建模,总结变换处理过程的方法和问题;并对传统干扰抑制方法和新型干扰抑制方法进行了系统性概述,分析了未知干扰的分类识别、多样干扰的时域消除、分布干扰的联合分离以及协同干扰的优化控制等制约宽带联合抗干扰的关键问题,突出认知抗干扰技术对无人系统通信的重要作用。
    参考文献 | 相关文章 | 多维度评价
    11. 改进TEB算法的局部路径规划算法研究
    代婉玉, 张丽娟, 吴佳峰, 马向华
    计算机工程与应用    2022, 58 (8): 283-288.   DOI: 10.3778/j.issn.1002-8331.2108-0290
    摘要230)      PDF(pc) (878KB)(63)    收藏
    在复杂动态环境中用传统TEB(time elastic band)算法规划路径时,会出现速度控制量不平滑导致的路径震荡、给机器人带来较大冲击和易发生碰撞。针对以上问题对传统TEB算法进行改进,对检测到的不规则障碍物膨胀化处理并进行区域分级策略,优先考虑安全区域的行驶路线,使机器人在复杂环境中更加安全平稳地运行。在算法中加入障碍物距离对速度的约束,能有效降低机器人靠近障碍物后因速度跳变导致的路径行驶过程的震荡幅度和机器人受到的冲击,以保障机器人运行时的安全。通过在ROS环境中的大量对比仿真,表明在复杂动态环境中改进后TEB算法规划的路径更安全平滑,能有效减少机器人受到的冲击。
    参考文献 | 相关文章 | 多维度评价
    12. 多组学数据整合分析和应用研究综述
    钟雅婷,林艳梅,陈定甲,彭昱忠,曾远鹏
    计算机工程与应用    2021, 57 (23): 1-17.   DOI: 10.3778/j.issn.1002-8331.2106-0341
    摘要218)      PDF(pc) (806KB)(323)    收藏

    随着组学新测序技术的不断涌现和推广,产生了大量的组学数据,这些数据对人们深入研究和揭示生命奥秘有着极重要的意义。利用多组学数据整合技术分析生命科学问题可获得更丰富更全面的生命系统相关信息,已成为研究者探索生命机制的新方向。介绍了多组学数据整合分析的研究背景和研究意义,综述了近年来多组学数据整合分析的方法和相关领域的应用研究,探讨了多组学数据整合分析方法当前所存在的问题以及未来展望。

    参考文献 | 相关文章 | 多维度评价
    13. 基于深度学习的入侵检测模型综述
    张昊, 张小雨, 张振友, 李伟
    计算机工程与应用    2022, 58 (6): 17-28.   DOI: 10.3778/j.issn.1002-8331.2107-0084
    摘要208)      PDF(pc) (997KB)(192)    收藏
    随着深度学习技术的不断深入发展,基于深度学习的入侵检测模型已成为网络安全领域的研究热点。对网络入侵检测中常用的数据预处理操作进行了总结;重点对卷积神经网络、长短期记忆网络、自编码器和生成式对抗网络等当前流行的基于深度学习的入侵检测模型进行了分析和比较;并简单说明了基于深度学习的入侵检测模型研究中常用的数据集;指出了现有基于深度学习的入侵检测模型在数据集时效、实时性、普适性、模型训练时间等方面存在的问题和今后可能的研究重点。
    参考文献 | 相关文章 | 多维度评价
    14. 2021年第24期目次
    计算机工程与应用    2021, 57 (24): 0-0.  
    摘要207)      PDF(pc) (1168KB)(284)    收藏
    相关文章 | 多维度评价
    15. 深度学习小目标检测算法研究综述
    张艳, 张明路, 吕晓玲, 郭策, 蒋志宏
    计算机工程与应用    2022, 58 (15): 1-17.   DOI: 10.3778/j.issn.1002-8331.2112-0176
    摘要194)      PDF(pc) (995KB)(161)    收藏
    目标检测的主要目的是在图像中快速精准地识别定位出预定义类别的目标。而随着深度学习技术的不断发展,检测算法在相应行业大、中目标已达到了不错的成效。鉴于小目标在图像中尺寸较小、特征不全、与图像中背景差异大等特点,基于深度学习的小目标检测算法性能仍需要进一步提升和优化;小目标检测在无人驾驶、医疗诊断、无人机导航等多个领域都有着广泛的需求,因此研究有着很高的应用价值。在文献调研的基础上,先给出小目标检测定义,找到当前小目标检测的重难点;根据这些重难点从六个研究方向分析当前研究现状,并总结各算法优缺点;结合文献及发展现状对该领域未来的研究方向做出合理预测与展望,为后续研究提供一定基础参考。
    参考文献 | 相关文章 | 多维度评价
    16. 深度学习驱动的知识追踪研究进展综述
    梁琨,任依梦,尚余虎,张翼英,王聪
    计算机工程与应用    2021, 57 (21): 41-58.   DOI: 10.3778/j.issn.1002-8331.2106-0552
    摘要193)      PDF(pc) (920KB)(234)    收藏

    随着教育信息化程度的不断加深,以预测学生知识状态为目标的知识追踪正成为个性化教育中一项重要且富有挑战性的任务。知识追踪作为一项教育数据挖掘的时间序列任务,与深度学习模型强大的特征提取和建模能力相结合,在处理顺序任务时具有得天独厚的优势。为此,简要分析传统知识追踪模型的特点及局限性,以深度知识追踪发展历程为主线,总结基于循环神经网络、记忆增强神经网络、图神经网络的知识追踪模型及其改进模型,并对该领域的已有模型按照方法策略归类整理。同时梳理了可供研究者使用的公开数据集和模型评估指标,比较和分析不同建模方法的特点。对基于深度学习的知识追踪的未来发展方向进行探讨和展望,奠定进一步深入基于深度知识追踪研究的基础。

    参考文献 | 相关文章 | 多维度评价
    17. 基于视觉的动态手势识别研究综述
    解迎刚,王全
    计算机工程与应用    2021, 57 (22): 68-77.   DOI: 10.3778/j.issn.1002-8331.2105-0314
    摘要190)      PDF(pc) (598KB)(288)    收藏

    手势自古以来在人类交流方面扮演着非常重要的角色,而基于视觉的动态手势识别技术是利用计算机视觉、物联网感知等新兴技术和3D视觉传感器等新型设备让机器能够理解人类的手势,从而让人类能和机器更好地交流,因此对于人机交互等领域的研究很有意义。介绍了动态手势识别中所用到的传感器技术,并比较了相关传感器的技术参数。通过追踪近年来国内外关于视觉的动态手势识别技术,陈述了动态手势识别的处理流程:手势检测与分割、手势追踪、手势分类。通过对比各流程所涉及的方法,可以发现深度学习具有较强的容错性、高度并行性、抗干扰性等一系列优点,在手势识别领域取得了远高于传统学习算法的成就。最后分析了动态手势识别目前遇到的挑战和未来可能的发展方向。

    参考文献 | 相关文章 | 多维度评价
    18. TLS协议恶意加密流量识别研究综述
    康鹏, 杨文忠, 马红桥
    计算机工程与应用    2022, 58 (12): 1-11.   DOI: 10.3778/j.issn.1002-8331.2110-0029
    摘要190)      PDF(pc) (747KB)(151)    收藏
    随着5G时代的来临,以及公众对互联网的认识日益加深,公众对个人隐私的保护也越来越重视。由于数据加密过程中存在着恶意通信,为确保数据安全,维护社会国家利益,加密流量识别的研究工作尤为重要。针对TLS流量详细的阐述,分析了早期识别方法的改进技术,包括常见的流量检测技术、DPI检测技术、代理技术以及证书检测技术。介绍了选取不同TLS加密流量特征的机器学习模型,以及无需特征选择的深度学习模型等诸多最新研究成果。对相关研究工作的不足进行总结,并对未来技术的研究工作和发展趋势进行了展望。
    参考文献 | 相关文章 | 多维度评价
    19. 融合多层注意力的方面级情感分析模型
    袁勋,刘蓉,刘明
    计算机工程与应用    2021, 57 (22): 147-152.   DOI: 10.3778/j.issn.1002-8331.2104-0019
    摘要189)      PDF(pc) (699KB)(168)    收藏

    方面情感分析旨在分析给定文本中特定方面的情感极性。针对目前的研究方法存在对方面情感注意力引入不足问题,提出了一种融合BERT和多层注意力的方面级情感分类模型(BERT and Multi-Layer Attention,BMLA)。模型首先提取BERT内部多层方面情感注意力信息,将编码后的方面信息与BERT隐藏层表征向量融合设计了多层方面注意力,然后将多层方面注意力与编码输出文本进行级联,进而增强了句子与方面词之间的长依赖关系。在SemEval2014 Task4和AI Challenger 2018数据集上的实验表明,强化目标方面权重并在上下文进行交互对方面情感分类是有效的。

    参考文献 | 相关文章 | 多维度评价
    20. 基于深度学习的三维点云语义分割方法研究
    王涛,王文举,蔡宇
    计算机工程与应用    2021, 57 (23): 18-26.   DOI: 10.3778/j.issn.1002-8331.2107-0142
    摘要185)      PDF(pc) (682KB)(171)    收藏

    综述了基于深度学习的三维点云语义分割方法的研究进展。利用文献分析法,按照数据的表现形式对基于深度学习的三维点云语义分割的方法进行阐述。探讨了近些年的国内外发展现状,分析了目前相关方法的优缺点,并展望了未来发展的趋势。深度学习的加入在点云语义分割技术研究上发挥着越来越重要的作用,推动了制造与包装等领域趋向于智能信息化。根据各类方法的优缺点,利用深度学习技术构建出基于投影、体素、多视图以及直接基于点云的2D-3D组合语义分割框架模型是未来的一个重要研究方向。

    参考文献 | 相关文章 | 多维度评价
    21. 基于深度学习的图像质量评价方法综述
    曹玉东,刘海燕,贾旭,李晓会
    计算机工程与应用    2021, 57 (23): 27-36.   DOI: 10.3778/j.issn.1002-8331.2106-0228
    摘要180)      PDF(pc) (646KB)(256)    收藏

    图像质量评价是对图像或视频的视觉质量的一种度量,主要分析了最近10年图像质量评价算法的研究情况。介绍了图像质量评价算法的衡量指标以及常用的图像质量评价数据集,对图像质量评价方法的分类做了阐述,重点分析了基于深度学习技术的图像质量评价算法。目前,该类算法的基础模型主要包括深度卷积神经网络、深度生成对抗网络和变换器,其性能通常高于传统的图像质量评价算法。描述了基于深度学习技术的图像质量评价算法的原理,重点介绍了基于深度生成对抗网络的无参考图像质量评价算法,通过增强对抗学习强度提高模拟参考图的可靠性。深度学习技术需要海量训练数据的支持,探讨和总结数据集增强的方法,对数字图像质量评价方法的未来研究进行展望。

    参考文献 | 相关文章 | 多维度评价
    22. 基于BERT的中文多关系抽取方法研究
    黄梅根,刘佳乐,刘川
    计算机工程与应用    2021, 57 (21): 234-240.   DOI: 10.3778/j.issn.1002-8331.2011-0199
    摘要177)      PDF(pc) (973KB)(159)    收藏

    构建三元组时在文本句子中抽取多个三元组的研究较少,且大多基于英文语境,为此提出了一种基于BERT的中文多关系抽取模型BCMRE,它由关系分类与元素抽取两个任务模型串联组成。BCMRE通过关系分类任务预测出可能包含的关系,将预测关系编码融合到词向量中,对每一种关系复制出一个实例,再输入到元素抽取任务通过命名实体识别预测三元组。BCMRE针对两项任务的特点加入不同前置模型;设计词向量优化BERT处理中文时以字为单位的缺点;设计不同的损失函数使模型效果更好;利用BERT的多头与自注意力机制充分提取特征完成三元组的抽取。BCMRE通过实验与其他模型,以及更换不同的前置模型进行对比,在F1的评估下取得了相对较好的结果,证明了模型可以有效性提高抽取多关系三元组的效果。

    参考文献 | 相关文章 | 多维度评价
    23. 改进YOLOv5的SAR图像舰船目标检测
    谭显东, 彭辉
    计算机工程与应用    2022, 58 (4): 247-254.   DOI: 10.3778/j.issn.1002-8331.2108-0308
    摘要175)      PDF(pc) (2147KB)(140)    收藏
    近年来针对合成孔径雷达(synthetic aperture radar,SAR)图像中缺乏颜色和纹理细节的舰船检测技术在深度学习领域中得到了广泛研究,利用深度学习技术可以有效避免传统的复杂特征设计,并且检测精度得到极大改善。针对舰船目标检测框具有高长宽比和密集排列问题,提出一种基于改进YOLOv5的目标检测方法。该方法针对舰船目标检测框特点将检测框长宽作为参数进行综合考虑并对损失函数进行曲线优化,并结合坐标注意力机制(coordinate attention,CA),在模型轻量化的同时实现对舰船目标检测的高速与高精度并存。实验结果表明:相比原YOLOv5方法,该方法的检测精度由原来的92.3%提升到96.7%,mAP(mean average precision)指标由原来的92.5%提升到97.2%,明显优于对比方法。通过改进检测框损失函数和特征提取方式,提高对SAR图像中舰船目标的检测效果。
    参考文献 | 相关文章 | 多维度评价
    24. 基于改进YOLOv5的目标检测算法研究
    邱天衡, 王玲, 王鹏, 白燕娥
    计算机工程与应用    2022, 58 (13): 63-73.   DOI: 10.3778/j.issn.1002-8331.2202-0093
    摘要172)      PDF(pc) (1109KB)(129)    收藏
    YOLOv5是目前单阶段目标检测性能较好的算法,但对目标边界回归的精确度不高,难以适用对预测框交并比要求较高的场景。基于YOLOv5算法,提出一种对硬件要求低、模型收敛速度快、目标框准确率高的新模型YOLO-G。改进特征金字塔结构(FPN),采用跨层级联的方式融合更多的特征,一定程度上防止了浅层语义信息的丢失,同时加深金字塔深度,对应增加检测层,使各种锚框的铺设间隔更加合理;其次把并行模式的注意力机制融入到网络结构中,赋予空间注意力模块和通道注意力模块相同的优先级,以加权融合的方式提取注意力信息,使网络可根据对空间和通道注意力的关注程度得到混合域注意力;通过降低网络的参数量和计算量对网络进行轻量化处理,防止因模型复杂度提升造成实时性能的损失。使用PASCAL VOC的2007、2012两个数据集来验证算法的有效性,YOLO-G比YOLOv5s的参数量减少了4.7%,计算量减少了47.9%,而mAP@0.5提高了3.1个百分点,mAP@0.5:0.95提高了5.6个百分点。
    参考文献 | 相关文章 | 多维度评价
    25. 改进YOLOv5的白细胞检测算法
    王静, 孙紫雲, 郭苹, 张龙妹
    计算机工程与应用    2022, 58 (4): 134-142.   DOI: 10.3778/j.issn.1002-8331.2107-0332
    摘要171)      PDF(pc) (1380KB)(191)    收藏
    针对白细胞数据样本少、类间差别小及目标尺寸小导致的检测精度低、效果不佳等问题,提出一种基于改进YOLOv5的白细胞检测算法YOLOv5-CHE。在主干特征提取网络的卷积层中添加坐标注意力机制,以提升算法的特征提取能力;使用四尺度特征检测,重新获取锚点框,增加浅层检测尺度,来提高小目标的识别精度;改变边框回归损失函数,以提升检验框检测的准确率。实验结果表明,对比标准的YOLOv5算法,YOLOv5-CHE算法的平均精度均值(mean average precision,mAP)、精准率和召回率分别提升了3.8个百分点、1.8个百分点和1.5个百分点,验证了该算法对白细胞检测具有很好的效果。
    参考文献 | 相关文章 | 多维度评价
    26. 图像超分辨率深度学习研究及应用进展
    夏皓,吕宏峰,罗军,蔡念
    计算机工程与应用    2021, 57 (24): 51-60.   DOI: 10.3778/j.issn.1002-8331.2105-0418
    摘要167)      PDF(pc) (914KB)(243)    收藏

    图像超分辨率重建是用低分辨率图像重建出对应的高分辨率图像的过程。目前,图像超分辨率技术已经成功应用于计算机视觉和图像处理领域。近年来,由于深度学习具有能够从大量数据中自动学习特征的能力,因此被广泛应用于图像超分辨率领域中。介绍了图像超分辨重建的背景,详细总结了用于图像超分辨率的深度学习模型,阐述了图像超分辨率技术在卫星遥感图像、医学影像、视频监控、工业检测任务方面的应用。总结了图像超分辨算法的当前研究现状以及未来发展方向。

    参考文献 | 相关文章 | 多维度评价
    27. 改进YOLOV3实时交通标志检测算法
    王浩, 雷印杰, 陈浩楠
    计算机工程与应用    2022, 58 (8): 243-248.   DOI: 10.3778/j.issn.1002-8331.2011-0460
    摘要164)      PDF(pc) (625KB)(153)    收藏
    交通标志检测是智能驾驶任务中的重要一环。为了满足检测精度和实时检测的要求,基于YOLOV3提出一种改进的实时交通标志检测算法。采用跨阶段局部网络作为特征提取模块,优化梯度信息,减少推理计算量;同时以路径聚合网络替代特征金字塔网络,在解决多尺度特征融合的同时,保留了更加准确的目标空间信息,提高目标检测精度;并且引入完备交并比损失函数替代均方误差损失,提高定位精度。与其他目标检测算法在CCTSDB数据集上进行对比检测,实验结果表明,改进后的算法平均精度达到95.2%,检测速度达到113.6?frame/s,与YOLOV3算法相比,分别提升2.37%和142%。
    参考文献 | 相关文章 | 多维度评价
    28. 深度学习中的安全帽检测算法应用研究综述
    张立艺, 武文红, 牛恒茂, 石宝, 段凯博, 苏晨阳
    计算机工程与应用    2022, 58 (16): 1-17.   DOI: 10.3778/j.issn.1002-8331.2203-0580
    摘要158)      PDF(pc) (967KB)(151)    收藏
    安全帽是施工现场最常见和实用的个人防护工具,能够有效防止和减轻意外带来的头部伤害。安全帽检测是施工现场人员安全管理的主要工作,也是施工现场智能化监控技术的重要内容,随着深度学习的发展,现已成为智慧工地建设的重要部分。为了综合分析深度学习在安全帽检测中的研究现状,针对安全帽检测算法研究,归纳了常用的安全帽检测算法和基于深度学习的安全帽检测算法,具体说明了其优缺点。在此基础上,针对现有问题,系统地总结分析了安全帽检测算法的相关改进方法,并梳理了各类方法的特点、优势和局限性。最后展望了基于深度学习的安全帽检测算法的未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    29. 基于Transformer的单通道语音增强模型综述
    范君怡, 杨吉斌, 张雄伟, 郑昌艳
    计算机工程与应用    2022, 58 (12): 25-36.   DOI: 10.3778/j.issn.1002-8331.2201-0371
    摘要157)      PDF(pc) (1155KB)(94)    收藏
    深度学习可以有效地解决带噪语音信号与干净语音信号之间复杂的映射问题,改善单通道语音增强的质量,但是增强语音的质量依然不理想。Transformer在语音信号处理领域中已得到了广泛应用,由于集成了多头注意力机制,可以更好地关注语音的长时相关性,该模型可以进一步改善语音增强效果。基于此,回顾了基于深度学习的语音增强模型,归纳了Transformer模型及其内部结构,从不同实现结构出发对基于Transformer的语音增强模型分类,详细分析了几种实例模型。并在常用数据集上对比了Transformer单通道语音增强的性能,分析了它们的优缺点。对相关研究工作的不足进行了总结,并对未来发展进行展望。
    参考文献 | 相关文章 | 多维度评价
    30. 基于轻量化YOLOv3的遥感军事目标检测算法
    秦伟伟,宋泰年,刘洁瑜,王洪伟,梁卓
    计算机工程与应用    2021, 57 (21): 263-269.   DOI: 10.3778/j.issn.1002-8331.2106-0026
    摘要157)      PDF(pc) (14418KB)(319)    收藏

    在导弹智能突防的过程中,从海量的遥感图像数据中检测敌方反导阵地具有极大的应用价值。由于弹载部署环境算力有限,设计了一种兼顾轻量化,检测精确率以及检测速度的遥感目标检测算法。制作了典型遥感军事目标数据集,通过K-means算法对数据集聚类分析。利用MobileNetV2网络代替YOLOv3算法的主干网络,保证网络的轻量化和检测速度。提出了适用于遥感目标特性的轻量化高效通道协同注意力模块和目标旋转不变性检测模块,将其嵌入检测算法中,在网络轻量化的基础上提升检测精确率。实验结果表明,提出算法的精确率达到97.8%,提升了6.8个百分点,召回率达到95.7%,提升了3.9个百分点,平均检测精度达到95.2%,提升了4.4个百分点,检测速度达到了每秒34.19张图,而网络大小仅为17.5?MB。结果表明该算法能满足导弹智能突防的综合要求。

    参考文献 | 相关文章 | 多维度评价
    31. 乳腺X线图像计算机辅助诊断技术综述
    陈智丽, 高皓, 潘以轩, 邢风
    计算机工程与应用    2022, 58 (4): 1-21.   DOI: 10.3778/j.issn.1002-8331.2108-0205
    摘要157)      PDF(pc) (1022KB)(167)    收藏
    近年来,乳腺癌严重威胁全球女性的身体健康,乳腺X线摄影是乳腺癌筛查的有效影像检查手段。乳腺X线图像计算机辅助诊断(computer aided diagnosis,CAD)运用计算机视觉、图像处理、机器学习等人工智能先进技术,自动分析处理乳腺X线图像,可为医生在临床中提供重要的诊断参考。主要面向肿块和微钙化病变检测、分割和分类等问题,从传统方法和深度学习方法两个角度,综述乳腺X线图像计算机辅助诊断技术的发展现状。鉴于近年来深度学习方法取得的突破性成果,回顾了经典的深度学习网络模型,着重介绍了深度学习方法在乳腺X线图像分析中的最新应用,对比分析了传统方法的弊端和深度学习方法的优势。对现有技术存在的问题进行分析,并对未来发展方向进行展望。
    参考文献 | 相关文章 | 多维度评价
    32. 混合策略改进的麻雀搜索算法
    张伟康,刘升,任春慧
    计算机工程与应用    2021, 57 (24): 74-82.   DOI: 10.3778/j.issn.1002-8331.2101-0161
    摘要156)      PDF(pc) (1182KB)(245)    收藏

    针对麻雀搜索算法存在的迭代过程中种群多样性减少且容易陷入局部最优以及收敛速度慢等问题,提出混合策略改进的麻雀搜索算法(MSSSA)。利用Circle映射初始化麻雀个体位置,增加初始种群的多样性。结合蝴蝶优化算法(BOA)中蝴蝶飞行方式,改进发现者的位置更新策略,增强算法全局探索能力。采用逐维变异方法对个体位置进行扰动,提升算法跳出局部最优的能力。在仿真实验中与4种基本算法和5种改进算法基于10个基准测试函数进行比较并进行Wilcoxon秩和检验,结果表明所提算法具有更好的收敛性和求解精度,全局寻优能力得到大幅提升。

    参考文献 | 相关文章 | 多维度评价
    33. 脑启发的视觉目标识别模型研究与展望
    杨曦, 闫杰, 王文, 李少毅, 林健
    计算机工程与应用    2022, 58 (7): 1-20.   DOI: 10.3778/j.issn.1002-8331.2110-0253
    摘要156)      PDF(pc) (906KB)(128)    收藏
    视觉目标识别是计算机视觉领域中最基本、最具有挑战性的研究课题之一。由于灵长类出色的视觉目标识别能力,对其神经功能机理的研究可能为类脑视觉带来革命性的突破。旨在系统地回顾最近在计算神经科学和计算机视觉交叉领域的工作,研究当前基于脑启发的目标识别模型及其依据的视觉神经机制。从认知功能和皮层动力学方面总结了灵长类视觉目标识别机制的基本特征和主要贡献;根据技术架构和开发方式总结了基于大脑启发的目标识别模型及其实现类脑目标识别的优缺点。进一步对人工神经网络与视觉神经网络进行相似性分析,研究了当前流行的CNN视觉基准模型在生物学上的可信性。总结了当前视觉目标识别常用的实验设计条件和数据分析方法,可以作为一个研究人员进行视觉目标识别研究时权衡时机和条件的使用指南。
    参考文献 | 相关文章 | 多维度评价
    34. 基于多尺度特征注意力机制的人脸表情识别
    张鹏, 孔韦韦, 滕金保
    计算机工程与应用    2022, 58 (1): 182-189.   DOI: 10.3778/j.issn.1002-8331.2106-0174
    摘要155)      PDF(pc) (719KB)(130)    收藏
    针对传统卷积神经网络在人脸表情识别过程中存在有效特征提取针对性不强、识别准确率不高的问题,提出一种基于多尺度特征注意力机制的人脸表情识别方法。用两层卷积层提取浅层特征信息;在Inception结构基础上并行加入空洞卷积,用来提取人脸表情的多尺度特征信息;引入通道注意力机制,提升模型对重要特征信息的表示能力;最后,将得到的特征输入Softmax层进行分类。通过在公开数据集FER2013和CK+上进行仿真实验,分别取得了68.8%和96.04%的识别准确率,结果表明该方法相比许多经典算法有更好的识别效果。
    参考文献 | 相关文章 | 多维度评价
    35. 2022年第8期目次
    计算机工程与应用    2022, 58 (8): 0-0.  
    摘要154)      PDF(pc) (637KB)(138)    收藏
    相关文章 | 多维度评价
    36. 高光谱遥感图像波段选择研究进展综述
    杨红艳, 杜健民
    计算机工程与应用    2022, 58 (10): 1-12.   DOI: 10.3778/j.issn.1002-8331.2111-0403
    摘要154)      PDF(pc) (776KB)(119)    收藏
    高光谱成像遥感技术可获取地物的光谱、辐射和空间信息,在国民经济的各个领域得到广泛的应用。但其狭窄的波段间距带来丰富光谱信息的同时,也带来了信息冗余,增加了数据处理的难度。因此,高光谱遥感数据在进行实际应用前,需要进行波段选择并提取光谱特征,降低数据维数。对高光谱遥感图像的波段选择研究进展进行了综述,在分析、归纳波段选择策略的基础上,从评价准则、空谱特征、半监督学习、稀疏表达、智能搜索和深度学习六方面阐述了波段选择方法的最新研究进展,探讨了当前高光谱图像波段选择面临的问题与挑战,对未来发展的趋势进行了预估。
    参考文献 | 相关文章 | 多维度评价
    37. 自动语音辨识对抗攻击和防御技术综述
    李克资, 徐洋, 张思聪, 闫嘉乐
    计算机工程与应用    2022, 58 (14): 1-15.   DOI: 10.3778/j.issn.1002-8331.2202-0196
    摘要154)      PDF(pc) (972KB)(115)    收藏
    语音辨识技术是人机交互的重要方式。随着深度学习的不断发展,基于深度学习的自动语音辨识系统也取得了重要进展。然而,经过精心设计的音频对抗样本可以使得基于神经网络的自动语音辨识系统产生错误,给基于语音辨识系统的应用带来安全风险。为了提升基于神经网络的自动语音辨识系统的安全性,需要对音频对抗样本的攻击和防御进行研究。基于此,分析总结对抗样本生成和防御技术的研究现状,介绍自动语音辨识系统对抗样本攻击和防御技术面临的挑战和解决思路。
    参考文献 | 相关文章 | 多维度评价
    38. 医学图像图深度学习分割算法综述
    王国力, 孙宇, 魏本征
    计算机工程与应用    2022, 58 (12): 37-50.   DOI: 10.3778/j.issn.1002-8331.2112-0225
    摘要150)      PDF(pc) (1194KB)(109)    收藏
    精准分割医学图像中的器官或病灶,是医学图像智能分析领域的重要难题,其在临床上对于疾病的辅助诊疗有着重要应用价值。在解决医学图像信息表征及对非欧空间生理组织结构准确建模等挑战性问题方面,基于图深度学习的医学图像分割技术取得了重要突破,展现出显著的信息特征提取及表征优势,可获得更为精准的分割结果,已成为该领域新兴研究热点。为更好促进医学图像图深度学习分割算法的研究发展,对该领域的技术进展及应用现状做了系统的梳理总结。介绍了图的定义及图卷积网络的基本结构,详细阐述了谱图卷积和空域图卷积操作。根据GCN结合残差模块、注意力机制模块及学习模块三种技术结构模式,归纳并总结了其在医学图像分割中的研究进展。对图深度学习算法在医学图像分割领域的应用和发展做了概要总结和展望,为该领域的技术发展提供参考和新的研究思路。
    参考文献 | 相关文章 | 多维度评价
    39. 人脸口罩佩戴检测研究综述
    王欣然, 田启川, 张东
    计算机工程与应用    2022, 58 (10): 13-26.   DOI: 10.3778/j.issn.1002-8331.2110-0396
    摘要149)      PDF(pc) (733KB)(136)    收藏
    人脸口罩佩戴检测是近两年在全球新冠疫情背景下快速发展的一个新兴研究课题。疫情常态下,佩戴口罩是有效防疫的重要手段,因此公共场所下对人员是否佩戴口罩的检查与提醒必不可少。利用人工智能完成口罩佩戴检测工作可以达到实时监督的目的,节省人力资源,有效避免误检、漏检等问题。对当前口罩佩戴检测研究所使用的网络模型和相关算法进行了详细梳理。针对口罩佩戴检测任务及其应用背景进行了简要说明;重点总结和分析了基于深度神经网络和基于目标检测模型两种思路的检测算法,主要讨论了不同研究方案的优缺点、改进方法和适用场景;介绍了常用的相关数据集,对比展现了各算法检测性能;对仍然存在的问题以及未来发展的方向进行了探讨和展望。
    参考文献 | 相关文章 | 多维度评价
    40. 不平衡数据集分类方法综述
    王乐,韩萌,李小娟,张妮,程浩东
    计算机工程与应用    2021, 57 (22): 42-52.   DOI: 10.3778/j.issn.1002-8331.2107-0097
    摘要149)      PDF(pc) (586KB)(135)    收藏

    不平衡数据集的特点导致了在分类时产生了诸多难题。对不平衡数据集的分类方法进行了分析与总结。在数据采样方法中从欠采样、过采样和混合采样三方面介绍不平衡数据集的分类方法;在欠采样方法中分为基于[K]近邻、Bagging和Boosting三种方法;在过采样方法中从合成少数过采样技术(Synthetic Minority Over-sampling Technology,SMOTE)、支持向量机(Support Vector Machine,SVM)两个角度来分析不平衡数据集的分类方法;对这两类采样方法的优缺点进行了比较,在相同数据集下比较算法的性能并进行分析与总结。从深度学习、极限学习机、代价敏感和特征选择四方面对不平衡数据集的分类方法进行了归纳。最后对下一步工作方向进行了展望。

    参考文献 | 相关文章 | 多维度评价