摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 一年内发表文章
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 水果采摘机器人视觉系统与机械手研究进展
    苟园旻, 闫建伟, 张富贵, 孙成宇, 徐勇
    计算机工程与应用    2023, 59 (9): 13-26.   DOI: 10.3778/j.issn.1002-8331.2209-0183
    摘要1278)      PDF(pc) (787KB)(849)    收藏
    水果采摘机器人对实现水果装备自动化智能化具有重要意义。对近年国内外水果采摘机器人领域关键技术研究工作进行总结,根据水果采摘机器人的重要组成结构与关键技术,对水果采摘机器人视觉系统的关键技术:传统基于水果特征的图像分割方法如阈值法、边缘检测法、基于颜色特征的聚类算法与基于区域的图像分割算法,基于深度学习的目标识别算法以及目标果实的定位等进行分析和对比;总结了水果采摘机器人机械臂与末端执行器的技术发展现状,指出水果采摘机器人存在的问题;对未来水果采摘机器人的发展趋势及方向进行了展望,可为水果采摘机器人相关研究提供参考。
    参考文献 | 相关文章 | 多维度评价
    2. 基于Transformer的目标检测算法综述
    李建, 杜建强, 朱彦陈, 郭永坤
    计算机工程与应用    2023, 59 (10): 48-64.   DOI: 10.3778/j.issn.1002-8331.2211-0133
    摘要864)      PDF(pc) (875KB)(487)    收藏
    深度学习框架Transformer具有强大的建模能力和并行计算能力,目前基于Transformer的目标检测算法已经成为研究的热点。为了进一步探索目标检测的新思路、新方向,对基于Transformer的目标检测算法进行了归纳总结。概述了多种目标检测数据集及其应用场景,从特征学习、目标估计、标签匹配策略和算法应用四方面梳理了Transformer目标检测的相关算法,并与基于卷积神经网络的目标检测算法进行对比,分析了Transformer在目标检测任务中的优点和局限性,并提出了Transformer目标检测模型的一般性框架。对Transformer在目标检测领域中的发展趋势进行了展望。
    参考文献 | 相关文章 | 多维度评价
    3. 道路交通流数据预测方法研究综述
    孟闯, 王慧, 林浩, 李科岑, 王鑫鹏
    计算机工程与应用    2023, 59 (14): 51-61.   DOI: 10.3778/j.issn.1002-8331.2209-0458
    摘要724)      PDF(pc) (605KB)(318)    收藏
    道路交通流预测作为智能交通系统中的重要分支,在道路拥堵预测、路径规划等方面起着重要作用。道路交通流数据时空多态、关联性复杂的特性迫使大数据时代下的道路交通流预测方法转型和升级。为了深入挖掘交通流时空性的特征,学者们相继提出各类方法,包括模型融合、模型算法改进、数据定义转换等方式,以求提高模型的预测精度。为了合理综述各类交通流的预测方法,根据所用方法的种类分为三大类:基于统计学的方法、基于机器学习的方法、基于深度学习的方法。通过综述各类交通流预测方法,对近年来新出现的模型与算法进行概括与分析,旨在为相关研究学者提供研究思路。对交通流预测方法进行了总结及展望,给出未来交通流预测领域的探索方向。
    参考文献 | 相关文章 | 多维度评价
    4. YOLO系列目标检测算法研究进展
    王琳毅, 白静, 李文静, 蒋金哲
    计算机工程与应用    2023, 59 (14): 15-29.   DOI: 10.3778/j.issn.1002-8331.2301-0081
    摘要720)      PDF(pc) (1009KB)(479)    收藏
    YOLO算法是目标检测中研究的热点方向之一。近几年,随着YOLO系列算法及其改进模型的不断提出,使其在目标检测领域取得了优异的成绩,被广泛应用于现实中各个领域。针对YOLO系列目标检测算法,整理了目标检测典型数据集及评价指标;回顾了YOLO整体框架以及YOLOv1~YOLOv7目标检测算法的发展历程;总结了在输入、特征提取和预测这三个阶段下的数据增强、轻量化网络构建和IOU损失优化等八个改进方向的模型及性能;介绍了YOLO算法应用领域;结合目标检测目前存在的实际问题,总结并展望了YOLO算法的发展方向。
    参考文献 | 相关文章 | 多维度评价
    5. 改进YOLOv5的无人机影像小目标检测算法
    谢椿辉, 吴金明, 徐怀宇
    计算机工程与应用    2023, 59 (9): 198-206.   DOI: 10.3778/j.issn.1002-8331.2212-0336
    摘要636)      PDF(pc) (808KB)(417)    收藏
    无人机航拍影像具有目标尺度变化大、背景复杂等诸多特性,导致现有的检测器难以检测出航拍影像中的小目标。针对无人机影像中小目标误检漏检的问题,提出了改进YOLOv5的算法模型Drone-YOLO。增加了检测分支以提高模型在多尺度下的检测能力。设计了多层次信息聚合的特征金字塔网络结构,实现跨层次信息的融合。设计了基于多尺度通道注意力机制的特征融合模块,提高对小目标的关注度。将预测头的分类任务与回归任务解耦,使用Alpha-IoU优化损失函数定义,提升模型检测的效果。通过无人机影像数据集VisDrone的实验结果表明,Drone-YOLO模型较YOLOv5模型在AP50指标上提高了4.91个百分点,推理延时仅需16.78?ms。对比其他主流模型对于小目标拥有更好的检测效果,能够有效完成无人机航拍影像的小目标检测任务。
    参考文献 | 相关文章 | 多维度评价
    6. 个性化学习中学科知识图谱构建与应用综述
    赵宇博, 张丽萍, 闫盛, 侯敏, 高茂
    计算机工程与应用    2023, 59 (10): 1-21.   DOI: 10.3778/j.issn.1002-8331.2209-0345
    摘要582)      PDF(pc) (929KB)(380)    收藏
    学科知识图谱是依赖大数据、人工智能等技术构建的支持教学活动的重要工具,作为一种学科知识语义网络,能够助力个性化学习体系的发展并促进数字教育资源新基建。对知识图谱的概念、分类等内容进行概述;总结了学科知识图谱的概念、特点、优势、内涵及其对个性化学习的支持等内容;重点梳理了学科知识图谱的构建流程:学科本体构建、学科知识抽取、学科知识融合以及学科知识加工,并介绍了学科知识图谱在个性化学习情境中的应用及其面临的挑战;展望了学科知识图谱以及个性化学习的未来趋势,为教育资源的组织方式及个性化学习的创新发展提供借鉴和启示。
    参考文献 | 相关文章 | 多维度评价
    7. 改进YOLOv7-tiny的目标检测轻量化模型
    刘浩翰, 樊一鸣, 贺怀清, 惠康华
    计算机工程与应用    2023, 59 (14): 166-175.   DOI: 10.3778/j.issn.1002-8331.2302-0115
    摘要570)      PDF(pc) (830KB)(215)    收藏
    当前目标检测算法参数量大、计算复杂度高,难以部署在计算资源有限的边缘终端设备上,为此,提出一种改进的YOLOv7-tiny模型。引入ShuffleNet v1网络,改进后作为新的特征提取网络,增强对图像特征的提取,降低计算复杂度,获取更多丰富的语义信息,进一步提升检测精度;引入GSConv(鬼影混洗卷积)模块改进网络的Neck层,在降低参数量和计算量前提下,提升检测效果;采用Mish激活函数,增加非线性表达,提高模型的泛化能力。实验结果表明,改进后的模型与原模型相比,精度提高了3.3%,参数量和计算量分别下降了4.8%和13.7%,模型规模降低了8.7%。改进后的YOLOv7-tiny在保持较高的精度下,降低了模型的参数量和计算量,进一步提升了检测效果,为在边缘终端设备部署提供了可行性。
    参考文献 | 相关文章 | 多维度评价
    8. 可解释人工智能研究综述
    赵延玉, 赵晓永, 王磊, 王宁宁
    计算机工程与应用    2023, 59 (14): 1-14.   DOI: 10.3778/j.issn.1002-8331.2208-0322
    摘要517)      PDF(pc) (683KB)(352)    收藏
    随着机器学习和深度学习的发展,人工智能技术已经逐渐应用在各个领域。然而采用人工智能的最大缺陷之一就是它无法解释预测的依据。模型的黑盒性质使得在医疗、金融和自动驾驶等关键任务应用场景中人类还无法真正信任模型,从而限制了这些领域中人工智能的落地应用。推动可解释人工智能(explainable artificial intelligence,XAI)的发展成为实现关键任务应用落地的重要问题。目前,国内外相关领域仍缺少有关可解释人工智能的研究综述,也缺乏对因果解释方法的关注以及对可解释性方法评估的研究。从解释方法的特点出发,将主要可解释性方法分为三类:独立于模型的方法、依赖于模型的方法和因果解释方法,分别进行总结分析,对解释方法的评估进行总结,列举出可解释人工智能的应用,讨论当前可解释性存在的问题并进行展望。
    参考文献 | 相关文章 | 多维度评价
    9. 视觉Transformer在医学图像分析中的应用研究综述
    石磊, 籍庆余, 陈清威, 赵恒毅, 张俊星
    计算机工程与应用    2023, 59 (8): 41-55.   DOI: 10.3778/j.issn.1002-8331.2206-0022
    摘要508)      PDF(pc) (869KB)(316)    收藏
    深度自注意力网络(Transformer)对输入信息全局特征和长距离相关性具有天然良好的建模能力,其与卷积神经网络(CNN)的归纳偏置特性具有较强互补性。受其在自然语言处理领域取得巨大成功的启发,Transformer已被广泛引入到计算机视觉各项任务特别是医学图像分析领域并已取得了不俗表现。对Transformer与自然图像结合的典型工作进行介绍,根据视觉Transformer在医学图像分割、医学图像分类以及医学图像配准等子领域对相关工作按照不同病灶及部位进行了整理和归纳,重点对一些代表性研究工作的实现思想进行了详细分析。对现有研究工作进行了讨论并对未来方向进行了展望,以期为该领域的进一步深入研究提供参考。
    参考文献 | 相关文章 | 多维度评价
    10. 基于深度域适应的跨域目标检测算法综述
    刘华玲, 皮常鹏, 赵晨宇, 乔梁
    计算机工程与应用    2023, 59 (8): 1-12.   DOI: 10.3778/j.issn.1002-8331.2210-0063
    摘要465)      PDF(pc) (583KB)(322)    收藏
    近年来,基于深度学习的目标检测算法在自动驾驶、人机交互等众多域上有着成功的应用,且因其检测性能较高引起学者的广泛关注。传统的深度学习方法一般基于源域与目标域服从同一分布的假设,但该假设不具备现实性,严重地降低了模型的泛化性能。如何对齐源域与目标域的分布,提高目标检测模型的泛化性成为近两年的研究热点。对跨域目标检测算法进行了综述,介绍了跨域目标检测的预备知识:深度域适应和目标检测,将跨域目标检测分解为两个子问题进行了概述,从底层逻辑理解其发展进程;给出了跨域目标检测算法的最新进展,从差异、对抗、重构、混合和其他等几个分类角度切入,梳理了每个类别的研究脉络并对比了在不同数据集上的性能;通过对目前跨域目标检测算法的梳理和总结,就其未来的研究方向进行展望。
    参考文献 | 相关文章 | 多维度评价
    11. 基于Transformer的多模态气象预测
    向德萍, 张普, 向世明, 潘春洪
    计算机工程与应用    2023, 59 (10): 94-103.   DOI: 10.3778/j.issn.1002-8331.2208-0486
    摘要456)      PDF(pc) (977KB)(319)    收藏
    随着气象观测技术的快速发展,气象行业积累了海量的气象大数据,为构建新型的数据驱动的气象预测模型提供了机遇。由于气象数据中存在的长时依赖关系和大范围空间关联关系,以及多模态气象要素间存在的复杂跨模态耦合关系,基于深度学习的气象预测是一个具有挑战性的研究课题。针对“温度、相对湿度、纬向风速、经向风速”四种经典气象要素组成的等气压层时序多模态数据,提出了一种基于多模态融合的气象预测深度学习模型。首先采用卷积网络来学习各个模态的特征,并在此基础上引入门控机制实现多模态加权融合;然后引入注意力机制,以并行时空轴向注意力代替传统的注意力机制,从而有效地学习长时依赖关系和大范围空间关联关系。整体结构上,采用了基于Transformer的编码器-解码器结构。在ERA5再分析数据集(子区域)上进行了对比实验,实验结果表明了所提方法在温度、相对湿度、风速等预测任务上的有效性和优越性。
    参考文献 | 相关文章 | 多维度评价
    12. 基于深度学习的目标检测算法研究与应用综述
    张阳婷, 黄德启, 王东伟, 贺佳佳
    计算机工程与应用    2023, 59 (18): 1-13.   DOI: 10.3778/j.issn.1002-8331.2305-0310
    摘要455)      PDF(pc) (662KB)(297)    收藏
    随着深度学习的不断发展,深度卷积神经网络在目标检测领域中的应用愈加广泛,现已被应用于农业、交通和医学等众多领域。与基于特征的传统手工方法相比,基于深度学习的目标检测方法可以学习低级和高级图像特征,有更好的检测精度和泛化能力。为了概括和总结目标检测领域的最新进展和技术,通过分析近年来基于深度学习的目标检测技术,对基于深度学习的目标检测算法与应用现状进行综述。归纳了两阶段与单阶段两种目标检测网络架构的发展及优缺点;从骨干网络、数据集和评价指标等方面进行叙述,对比了经典算法的检测精度,总结经典目标检测算法的改进策略;讨论了现阶段目标检测应用,并提出了目标检测领域今后的研究重点。
    参考文献 | 相关文章 | 多维度评价
    13. 改进YOLOv5的遥感图像目标检测算法
    李坤亚, 欧鸥, 刘广滨, 于泽峰, 李林
    计算机工程与应用    2023, 59 (9): 207-214.   DOI: 10.3778/j.issn.1002-8331.2209-0119
    摘要434)      PDF(pc) (665KB)(305)    收藏
    针对遥感图像中背景复杂度高、目标尺寸多样和小目标存在过多所导致的目标检测精度较低的问题,提出一种改进YOLOv5的遥感图像目标检测算法。该算法在主干网络引入通道-全局注意力机制(CGAM)以增强对不同尺度目标的特征提取能力和抑制冗余信息的干扰。引入密集上采样卷积(DUC)模块扩张低分辨率卷积特征图,有效增强不同卷积特征图的融合效果。将改进算法应用于公开遥感数据集RSOD中,改进YOLOv5算法平均精度AP值达到78.5%,较原算法提升了3.1个百分点。实验结果证明,改进后的算法能有效提高遥感图像目标检测精度。
    参考文献 | 相关文章 | 多维度评价
    14. 深度学习的目标检测算法改进综述
    杨锋, 丁之桐, 邢蒙蒙, 丁波
    计算机工程与应用    2023, 59 (11): 1-15.   DOI: 10.3778/j.issn.1002-8331.2209-0312
    摘要421)      PDF(pc) (691KB)(293)    收藏
    目标检测是当下计算机视觉领域的研究热点,随着深度学习的发展,基于深度学习的目标检测算法的应用越来越多,性能也不断被提升,通过总结目标检测过程中遇到的常见难题以及相应的改进方法,梳理了基于深度学习的目标检测方法的最新研究进展,重点针对基于深度学习目标检测算法的两大类型进行综述。此外还从注意力机制、轻量型网络、多尺度检测等方面对目标检测算法的最新改进思路进行总结梳理。针对当前目标检测领域存在的问题,对其未来的发展趋势进行展望,并提出可行的解决方案,以期为该领域后续的研究工作提供可借鉴的思路和方向。
    参考文献 | 相关文章 | 多维度评价
    15. 基于机器学习的信用卡交易欺诈检测研究综述
    蒋洪迅, 江俊毅, 梁循
    计算机工程与应用    2023, 59 (21): 1-25.   DOI: 10.3778/j.issn.1002-8331.2302-0129
    摘要386)      PDF(pc) (674KB)(263)    收藏
    机器学习在信用卡交易检测中有其特殊性,面对的环境更为复杂。由于有人的智力介入,战胜信用卡交易欺诈,其挑战性比人脸识别、无人驾驶等工程问题的难度更高,照搬工程学科的机器学习方法往往会失败。综述了2000年以来基于机器学习的信用卡欺诈检测研究历程,辨析了该领域的研究范畴、应用场景、技术流派等相关概念及其联系;解构了机器学习欺诈识别的一般性研究架构,从特征工程、模型算法、评价指标三个环节归纳总结了领域内研究的最新进展;从数据集是否具备标签角度,着重列举了面向欺诈识别的有监督的、无监督和半监督三类主流机器学习模型,讨论了这些模型的出发点、核心思想、求解方法以及优缺点;还分析了强化学习模型模拟欺诈者与机构之间的动态博弈过程;探讨了机器学习面临的海量数据、样本偏斜和概念漂移三大难点问题,并汇集整理了缓解这些问题的最新进展;总结了面向欺诈检测的机器学习研究目前存在的局限、争议和挑战,并为未来的研究方向提供趋势分析与建议。
    参考文献 | 相关文章 | 多维度评价
    16. FS-YOLOv5:轻量化红外目标检测方法
    黄磊, 杨媛, 杨成煜, 杨威, 李耀华
    计算机工程与应用    2023, 59 (9): 215-224.   DOI: 10.3778/j.issn.1002-8331.2210-0487
    摘要372)      PDF(pc) (815KB)(257)    收藏
    针对传统目标识别算法复杂场景下的道路目标识别精度低、实时性差、小目标检测难度大等问题,提出了基于红外场景下FS-YOLOv5轻量化模型。采用单阶段目标检测网络YOLOv5s作为基础网络,提出了一种新的FS-MobileNetV3网络代替原网络中的CSPDarknet主干网络来提取特征图像;在原网络CIoU损失函数的基础上引入Power变换,替换为α-CIoU,提高网络对小目标的检测能力;将K-means++聚类算法应用在FLIR红外数据集上重新生成Anchor,最后利用DIoU-NMS替换原网络的NMS后处理方法,改善对遮挡物体的检测能力,降低了模型的漏检率。通过在FLIR红外数据集上的消融实验验证了FS-YOLOv5轻量化算法满足红外场景下的道路目标检测任务,与原网络相比,在平均精度仅降低0.37个百分点的前提下,FS-YOLOv5模型的大小减少了26%,参数量减少了29%,检测速度提升了11?FPS,满足了在不同场景下移动端部署的需求。
    参考文献 | 相关文章 | 多维度评价
    17. 改进Yolov7-tiny的钢材表面缺陷检测算法
    齐向明, 董旭
    计算机工程与应用    2023, 59 (12): 176-183.   DOI: 10.3778/j.issn.1002-8331.2302-0191
    摘要363)      PDF(pc) (679KB)(205)    收藏
    为提高钢材表面缺陷小目标检测效率,提出一种改进Yolov7-tiny的钢材表面缺陷检测算法。将特征提取网络的激活函数更换为SiLU,提高特征提取能力;把特征融合网络的张量拼接操作与加权双向特征金字塔BiFPN结合,再把上采样部分的最邻近插值替换为轻量级算子CARAFE,提升特征融合能力;最后在输出端引入多头自注意力机制MHSA 和SPD卷积构建块,提升输出端对钢材表面缺陷小目标的检测性能。在NEU-DET数据集上做消融和对比实验,改进算法与原Yolov7-tiny算法比较,mAP提升11.7个百分点,Precision提升3.3个百分点,FPS值达到192,结果表明改进算法能有效提升钢材表面缺陷小目标检测效率;在VOC2012数据集上做通用性对比实验,结果表明改进算法具有通用性。
    参考文献 | 相关文章 | 多维度评价
    18. LSTFormer:基于Swin Transformer的轻量化语义分割网络
    杨承, 高建瓴, 郑美琳, 丁容
    计算机工程与应用    2023, 59 (12): 166-175.   DOI: 10.3778/j.issn.1002-8331.2210-0331
    摘要359)      PDF(pc) (801KB)(216)    收藏
    针对现有基于Transformer的语义分割网络普遍存在计算复杂度高的问题,提出了一种基于Swin Transformer的轻量化语义分割网络。该网络通过Swin Transformer获取多个尺度的特征图;采用全感知模块和改进的级联融合模块跨层融合不同尺度的特征图,减小不同层级特征图的语义差距;引入单个Swin Transformer block对初分割特征映射进行优化,通过移动窗口自注意力机制提升网络对不同像素点进行分类的能力;训练阶段加入Dice损失函数和交叉熵损失函数,提高网络的分割性能和收敛速度。实验结果表明,LSTFormer在数据集ADE20K和Cityscapes上mIoU分别达到49.47%和81.47%,相较于SETR和Swin-UPerNet等同类网络,LSTFormer在保持相当分割精度的同时具有更低的参数量和计算量。
    参考文献 | 相关文章 | 多维度评价
    19. 融合因果注意力Transformer模型的股价预测研究
    任佳屹, 王爱银
    计算机工程与应用    2023, 59 (13): 325-334.   DOI: 10.3778/j.issn.1002-8331.2212-0127
    摘要358)      PDF(pc) (654KB)(147)    收藏
    股票价格预测是金融研究和量化投资共同关注的重点话题,近年来利用深度学习技术揭示股票市场的行情规律成为研究热点。现有股票价格预测深度学习模型多数仅研究时间点数据,这种结构上的缺陷导致其不能反映出特征因子的累积作用对股价的影响。针对此,通过重新设计模型处理时间序列数据,提出一种基于Transformer的股票价格预测模型Stockformer。它通过因果自注意力机制挖掘股票价格与特征因子之间的时序依赖关系,采用趋势增强模块为模型提供序列的趋势特征,同时利用编码器的特定输入为预测提供输入特征的直接先验信息。实验结果表明,Stockformer的预测精度显著优于已有深度学习模型,且相较经典Transformer预测模型的平均绝对误差和均方根误差分别降低了23.2%和25.7%,预测值与真实值更为拟合;通过消融实验分别评估了Stockformer的因果注意力机制、时序特征提取手段以及特定的模型输入的效果及必要性,验证了所提模型的优越性及普适性。
    参考文献 | 相关文章 | 多维度评价
    20. 深度学习实时语义分割算法研究综述
    何家峰, 陈宏伟, 骆德汉
    计算机工程与应用    2023, 59 (8): 13-27.   DOI: 10.3778/j.issn.1002-8331.2210-0144
    摘要357)      PDF(pc) (1161KB)(258)    收藏
    语义分割是从像素的角度分割出图片中的不同对象,并对原始图片中的每个像素进行标注的一种技术。但由于无人机导航、遥感图像、医疗诊断等应用领域需要实时地进行语义分割处理。所以,基于深度学习的实时语义分割技术得到了迅速的发展。实时语义分割技术发展至今已有许多的技术与模型。基于此,在对相关文献进行研究的基础上,由语义分割技术引出了实时语义分割技术,并简单叙述了实时语义分割的优点。随后,研讨出目前实时语义分割存在的重难点。根据重难点进而对已存在的相关技术与模型进行阐述,并总结技术与模型的优缺点。最后,展望实时语义分割所面临的挑战,并对实时语义分割进行了总结与归纳,为后续的研讨提供了一些理论参考。
    参考文献 | 相关文章 | 多维度评价
    21. 改进SegFormer网络的遥感图像语义分割方法
    田雪伟, 汪佳丽, 陈明, 杜守庆
    计算机工程与应用    2023, 59 (8): 217-226.   DOI: 10.3778/j.issn.1002-8331.2204-0141
    摘要347)      PDF(pc) (951KB)(169)    收藏
    由于遥感图像存在目标尺度多、小目标的语义信息不足等问题,现有算法对遥感图像中小目标和目标边界难以精准分割。为此提出了一种改进SegFormer网络的遥感图像语义分割方法,以级联的方式合并SegFormer编码器输出的多个尺度的特征。在合并高层语义信息特征时使用语义特征融合模块保留模糊边界;在合并细节信息特征时使用门控注意力机制模块过滤部分高层语义信息特征,减少其对细节信息特征的干扰。之后将多个尺度的特征上采样后连接,使用多局部通道注意力模块根据通道上下文关系重新校准连接特征的映射关系,增强最终的分割效果。在UAVid和ISPRS Potsdam数据集上的实验结果表明,改进SegFormer的分割方法优于比较的当前主流分割方法,对遥感图像中的小目标和边界有更好的语义分割效果。
    参考文献 | 相关文章 | 多维度评价
    22. 药物-靶点相互作用预测的计算方法综述
    张然, 王学志, 汪嘉葭, 孟珍
    计算机工程与应用    2023, 59 (12): 1-13.   DOI: 10.3778/j.issn.1002-8331.2210-0108
    摘要342)      PDF(pc) (675KB)(238)    收藏
    药物-靶点相互作用预测旨在发现可作用于特定蛋白质的潜在药物,在药物重定位、药物副作用预测、多重药理学和耐药性的研究中都发挥着重要作用。随着计算机处理能力的进步和计算算法的不断更新,药物-靶点相互作用预测的计算方法展现出时间短、成本低、精度高、范围广的优势,受到了广泛的关注,并取得了显著的进展。为了梳理其研究发展历程,探讨未来的研究方向,就药物-靶点相互作用预测的背景和意义进行简要概述;将方法分为基于分子对接、基于药物结构、基于文本挖掘和基于化学基因组四类进行综述,并对每类方法进行对比分析,详细阐述每类方法的数据需求及应用场景;对现有研究存在的局限性和面临的挑战进行讨论,展望未来的研究方向,为后续研究提供参考和借鉴。
    参考文献 | 相关文章 | 多维度评价
    23. 基于深度神经网络的图像修复算法综述
    吕建峰, 邵立珍, 雷雪梅
    计算机工程与应用    2023, 59 (20): 1-12.   DOI: 10.3778/j.issn.1002-8331.2303-0111
    摘要334)      PDF(pc) (720KB)(354)    收藏
    深度学习的快速发展使计算机视觉技术应用越来越广泛,同时利用深度神经网络根据破损图像的已知信息对图像复原的修复技术成为关注的热点。对近年基于深度神经网络的图像修复方法进行了综述和分析:按照模型优化的方向,对图像修复方法进行分类综述;介绍了图像修复常用的数据集和性能评价指标,并在相关数据集上对各种基于深度神经网络的破损图像修复算法进行性能评价和分析;总结和分析了现有图像修复方法面临的挑战和未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    24. 完全合作类多智能体深度强化学习综述
    赵立阳, 常天庆, 褚凯轩, 郭理彬, 张雷
    计算机工程与应用    2023, 59 (12): 14-27.   DOI: 10.3778/j.issn.1002-8331.2209-0186
    摘要330)      PDF(pc) (661KB)(214)    收藏
    作为机器学习和人工智能领域的重要分支之一,完全合作类多智能体深度强化学习以一种通用的方式将深度强化学习的表达决策能力和多智能体系统的分布协作能力有效结合,为完全合作类多智能体系统中的无模型序贯决策问题提供了一种端对端的解决方案。对深度强化学习的基本原理进行阐述,并从基于值函数、基于策略梯度和基于演员-评论家三个主要方向对单智能体深度强化学习的发展进行了总结。分析了多智能体深度强化学习面临的主要挑战和主要的训练框架。依据实现最大团队联合奖励方式的不同,将完全合作类的多智能体深度强化学习划分为基于独立学习、基于通信学习、基于协作学习和基于奖励函数塑造四大类,并分别进行了总结分析。从解决实际问题的角度出发,对完全合作类多智能体深度强化学习算法的未来发展方向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    25. 深度学习小目标检测算法综述
    董刚, 谢维成, 黄小龙, 乔逸天, 毛骞
    计算机工程与应用    2023, 59 (11): 16-27.   DOI: 10.3778/j.issn.1002-8331.2211-0377
    摘要326)      PDF(pc) (646KB)(209)    收藏
    现有的目标检测算法,对大目标以及中目标的检测已具有较高的准确率,然而由于小目标在图像中的像素以及可利用的特征较少等原因,导致小目标的检测精度相较于大目标而言过低。通过融合特征层,小目标的检测已取得了不错的效果,但仍存在对于微小目标的定位等问题。基于此,解释了小目标的定义,指出了导致小目标检测精度低的五点原因。将近几年最新进展以及过往经典的小目标检测优化方法按照大致原理从多尺度特征、评估指标、超分辨率等方面进行叙述。归纳了针对特定场景下的小目标检测:航空遥感图像以及人脸行人的检测方法。总结并提出了未来小目标检测可能的研究方向。
    参考文献 | 相关文章 | 多维度评价
    26. 基于多模态融合的情感分析算法研究综述
    郭续, 买日旦·吾守尔, 古兰拜尔·吐尔洪
    计算机工程与应用    2024, 60 (2): 1-18.   DOI: 10.3778/j.issn.1002-8331.2305-0439
    摘要325)      PDF(pc) (954KB)(230)    收藏
    情感分析是一项新兴技术,其旨在探索人们对实体的态度,可应用于各种领域和场景,例如产品评价分析、舆情分析、心理健康分析和风险评估。传统的情感分析模型主要关注文本内容,然而一些特殊的表达形式,如讽刺和夸张,则很难通过文本检测出来。随着技术的不断进步,人们现在可以通过音频、图像和视频等多种渠道来表达自己的观点和感受,因此情感分析正向多模态转变,这也为情感分析带来了新的机遇。多模态情感分析除了包含文本信息外,还包含丰富的视觉和听觉信息,利用融合分析可以更准确地推断隐含的情感极性(积极、中性、消极)。多模态情感分析面临的主要挑战是跨模态情感信息的整合,因此,重点介绍了不同融合方法的框架和特点,并对近几年流行的融合算法进行了阐述,同时对目前小样本场景下的多模态情感分析进行了讨论,此外,还介绍了多模态情感分析的发展现状、常用数据集、特征提取算法、应用领域和存在的挑战。期望此综述能够帮助研究人员了解多模态情感分析领域的研究现状,并从中得到启发,开发出更加有效的模型。
    参考文献 | 相关文章 | 多维度评价
    27. 基于深度学习的MRI重建方法综述
    邓戈文, 魏国辉, 马志庆
    计算机工程与应用    2023, 59 (20): 67-76.   DOI: 10.3778/j.issn.1002-8331.2302-0057
    摘要319)      PDF(pc) (580KB)(181)    收藏
    磁共振成像(MRI)是临床中一种常用的成像技术,但过长的成像时间限制了其进一步的发展。从欠采样的k空间数据中进行图像重建是加速MRI成像的重要一环。近年来,深度学习在MRI重建方面显示出巨大的潜力,其重建结果和效率都优于传统的压缩感知方法。为梳理与总结当前基于深度学习的MRI重建方法,介绍了MRI重建问题的定义,分析了深度学习在数据驱动的端到端重建和模型驱动的展开优化重建中的应用,提供重建的评价指标和常用数据集,讨论了当前MRI重建所面临的挑战与未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    28. 改进YOLOv5的小目标检测算法
    俞军, 贾银山
    计算机工程与应用    2023, 59 (12): 201-207.   DOI: 10.3778/j.issn.1002-8331.2302-0157
    摘要318)      PDF(pc) (566KB)(242)    收藏
    虽然现在的深度学习技术在大中目标检测领域取得了惊人的进步,但是由于小目标的尺寸有限以及卷积网络的局限性,导致小目标检测仍然是一个具有挑战性的问题。通过改进YOLOv5算法,提出了一种针对小目标的YOLO-S模型。在原来三层输出层的基础上,利用级联网络,添加一个专门针对于小目标检测的输出层。为了补充上下文信息以及抑制多尺度特征融合冲突,设计了一种新的上下文信息提取模块CFM(Context Feature Module)以及基于通道和空间特征细化的模块FSM(feature specify module)。上采样方式由原来的最邻近插值替换为新设计的Transpose模块,可以将信息最大化恢复。数据集采用专门针对于小目标的VisDrone2019来验证算法的有效性。实验结果表明,YOLO-S比YOLOv5的mAP@0.5提高了6.9个百分点。
    参考文献 | 相关文章 | 多维度评价
    29. 低光照图像增强研究方法综述
    彭大鑫, 甄彤, 李智慧
    计算机工程与应用    2023, 59 (18): 14-27.   DOI: 10.3778/j.issn.1002-8331.2210-0143
    摘要310)      PDF(pc) (645KB)(148)    收藏
    低光照图像增强目的是从低光照条件下恢复细节完整的图像,并逐渐成为计算机图像处理研究的热点。图像成像的质量对于智能安防、视频监控等场景至关重要,且在相关行业中有着十分广阔的应用前景。为了深入研究低光照图像增强,对传统低光照图像增强方法进行详细地分类阐述与分析,列举了基于深度学习的图像增强方法,对所用到的各种网络以及所解决的问题进行了详细的梳理,并将所提到的方法进行了细致的对比。又对数据集进行了细致的分析和研究,并对一些常用的评价指标进行了简单梳理。对所述内容做出总结以及指出了当前研究中存在的困难,并指出了未来的研究目标。
    参考文献 | 相关文章 | 多维度评价
    30. 机器人导航的路径规划算法研究综述
    崔炜, 朱发证
    计算机工程与应用    2023, 59 (19): 10-20.   DOI: 10.3778/j.issn.1002-8331.2301-0088
    摘要309)      PDF(pc) (595KB)(185)    收藏
    路径规划算法是机器人导航的关键技术之一,优良的路径规划算法能够快速找出最佳无碰撞行走路径,提高运行效率。大多数现有的分类方法难以表述清楚算法间的区别与联系,根据机器人路径规划算法的设计原理,将其分为基于图搜索、基于仿生、基于势场、基于速度空间和基于采样的规划算法以更清晰地区分不同的路径规划算法。阐述了每类算法的概念、特点和发展现状,并从单查询算法和多查询算法的角度重点分析了应用更为广泛的基于采样的算法,对比总结了不同类型路径规划算法的优缺点,从多机器人协作、多算法融合和自适应规划等方面展望了机器人路径规划算法的未来发展趋势。
    参考文献 | 相关文章 | 多维度评价
    31. 面向边缘无服务器计算的WebAssembly应用研究综述
    王欣, 赵凯, 秦斌
    计算机工程与应用    2023, 59 (11): 28-36.   DOI: 10.3778/j.issn.1002-8331.2210-0308
    摘要292)      PDF(pc) (575KB)(167)    收藏
    WebAssembly(简称Wasm)是一个可移植、体积小、加载迅速且兼容Web的全新二进制格式,具有高效、安全、开放等特点。边缘计算的基本理念是将计算任务在接近数据源的计算资源上运行,而部署在边缘的设备性能和资源通常十分有限,在这种资源受限的环境下如何提供低延迟且安全的服务是边缘计算的重要研究方向。无服务器技术(Serverless)是一种基础设施上托管应用程序的新方式,目前主要基于容器技术实现程序的托管,因为其轻量,函数即服务(FaaS)、自动伸缩等特点,无服务器计算是目前最适合边缘计算的架构,但一直存在冷启动和内存占用大等问题。Wasm可以替代传统容器方式,为边缘无服务器计算提供一种更新、更快、资源占用更小且安全隔离的实现方式。介绍边缘无服务器计算的特性及其应用场景、Wasm的应用现状和发展趋势,分析了基于Wasm的边缘无服务器计算中关键问题的研究现状,阐述了Wasm运行时替代容器作为边缘无服务器计算载体的发展方向,探讨了边缘Wasm无服务器计算平台存在的问题以及未来基于深度强化学习等人工智能算法的优化方向。
    参考文献 | 相关文章 | 多维度评价
    32. 激光雷达SLAM算法综述
    刘铭哲, 徐光辉, 唐堂, 钱晓健, 耿明
    计算机工程与应用    2024, 60 (1): 1-14.   DOI: 10.3778/j.issn.1002-8331.2308-0455
    摘要288)      PDF(pc) (854KB)(192)    收藏
    即时定位与地图构建(simultaneous localization and mapping,SLAM)是自主移动机器人和自动驾驶的关键技术之一,而激光雷达则是支撑SLAM算法运行的重要传感器。基于激光雷达的SLAM算法,对激光雷达SLAM总体框架进行介绍,详细阐述前端里程计、后端优化、回环检测、地图构建模块的作用并总结所使用的算法;按由2D到3D,单传感器到多传感器融合的顺序,对经典的具有代表性的开源算法进行描述和梳理归纳;介绍常用的开源数据集,以及精度评价指标和测评工具;从深度学习、多传感器融合、多机协同和鲁棒性研究四个维度对激光雷达SLAM技术的发展趋势进行展望。
    参考文献 | 相关文章 | 多维度评价
    33. 改进视觉Transformer的人脸识别方法
    季瑞瑞, 谢宇辉, 骆丰凯, 梅远
    计算机工程与应用    2023, 59 (8): 117-126.   DOI: 10.3778/j.issn.1002-8331.2208-0182
    摘要262)      PDF(pc) (768KB)(155)    收藏
    目前大多数人脸识别方法依赖于卷积神经网络,通过级联的形式构建多层处理单元,利用卷积操作融合局部特征,忽略了人脸全局语义信息,缺乏对人脸重点区域的关注度。针对上述问题,提出一种基于改进视觉Transformer的人脸识别方法,引入Shuffle Transformer作为特征提取骨干网络,通过自注意力机制以及Shuffle操作捕捉特征图全局信息,建立特征点之间的长距离依赖关系,提高模型的特征感知能力;同时,结合ArcFace损失函数和中心损失函数的特点,设计融合损失作为目标函数,利用类内约束扩大角度间隔,提高特征空间的辨别性。该方法在LFW、CALFW、CPLFW、AgeDB-30和CFP五个具有挑战性的基准测试人脸数据集上分别取得了99.83%、95.87%、90.05%、98.05%、97.23%的平均准确率,能够有效提升人脸特征提取能力,识别效果优于同等规模卷积神经网络。
    参考文献 | 相关文章 | 多维度评价
    34. 机器学习在影像组学分析中的应用综述
    鲁慧民, 薛涵, 王奕龙, 王贵增, 桑鹏程
    计算机工程与应用    2023, 59 (17): 22-34.   DOI: 10.3778/j.issn.1002-8331.2210-0435
    摘要261)      PDF(pc) (5275KB)(167)    收藏
    影像组学(radiomics)是一种从标准医学影像中定量地提取特征的技术。借助机器学习构建预测或诊断模型,能够在临床决策支持系统中提取和应用数据,以提高诊断的准确性,该技术在肿瘤分期、癌症检测、生存分析等任务中得到了广泛的应用。回顾了机器学习在影像组学分析中的相关应用和研究进展;重点论述了机器学习算法在影像组学分析中各阶段的适用性和局限性,在原理和应用效果上对代表性算法进行了深入梳理与分析;综合介绍了在影像组学分析中对各阶段工作的评估方法;整理了公开的医学影像数据集以及用于影像组学特征提取的软件与工具包;最后讨论了机器学习在影像组学中的未来发展。
    参考文献 | 相关文章 | 多维度评价
    35. 符号执行技术及应用研究综述
    吴皓, 周世龙, 史东辉, 李强
    计算机工程与应用    2023, 59 (8): 56-72.   DOI: 10.3778/j.issn.1002-8331.2209-0359
    摘要257)      PDF(pc) (710KB)(132)    收藏
    符号执行是一种程序分析技术,通过收集程序路径上约束条件并利用约束求解器生成高覆盖率的测试用例,能发现深层次程序错误的优势。梳理了符号执行概念和发展历程,从符号执行系统核心设计切入,对符号执行技术的中间语言、路径搜索和约束求解进行分类阐述。调研现有研究工作进展,选取应用最突出的安全漏洞方面,从漏洞利用与漏洞检测上系统地分析符号执行技术应用细节。依据符号执行技术特点选取一些研究成果整理分析,探讨符号执行技术面临的局限与解决方案,并展望了未来趋势。
    参考文献 | 相关文章 | 多维度评价
    36. 单张图像三维人脸重建方法综述
    王静婷, 李慧斌
    计算机工程与应用    2023, 59 (17): 1-21.   DOI: 10.3778/j.issn.1002-8331.2210-0041
    摘要254)      PDF(pc) (961KB)(249)    收藏
    近年来,三维人脸重建任务作为“数字人”技术的重要组成部分,受到了学术界和工业界的广泛关注。基于单张图像的三维人脸重建任务在充分结合传统相机模型、光照模型、三维人脸统计形变模型与深度卷积网络、深度生成模型等方面技术之后取得了长足的进步。聚焦单张图像三维人脸重建问题,将现有研究工作分为基于隐空间编码和基于显空间回归两类。第一类研究工作对基础三维人脸统计模型的基系数求解、损失函数设计等进行优化,提升重建效果,在人脸拓扑结构变化方面具备鲁棒性优势,但缺乏细节特征。第二类工作以显空间多种数据形式表示三维人脸并直接通过深度网络进行回归,通常可获得更加个性化的三维人脸细节特征且对光照、遮挡等干扰因素具有较好的鲁棒性。进一步,基于常用数据集和评价指标,充分探讨并比较了两类方法中一些典型方法的优缺点。最后对全文进行总结,并给出了单张图像三维人脸重建任务面临的主要挑战及未来发展趋势。
    参考文献 | 相关文章 | 多维度评价
    37. 深度学习在符号音乐生成中的应用研究综述
    陈吉尚, 哈里旦木·阿布都克里木, 梁蕴泽, 阿布都克力木·阿布力孜, 米克拉依·艾山, 郭文强
    计算机工程与应用    2023, 59 (9): 27-45.   DOI: 10.3778/j.issn.1002-8331.2209-0305
    摘要252)      PDF(pc) (938KB)(133)    收藏
    符号音乐生成是音乐信息检索领域中的一个重要任务。对基于深度学习的符号音乐生成进行了全面总结,并对已有方法进行分类、分析和比较。详细介绍了符号音乐生成研究现状及其任务。阐述符号音乐表征及编码方法,并重点对基于深度学习的模型进行归纳比较与分析,根据不同的基础架构分为三类。阐述并归纳符号音乐生成领域的评价标准及数据集等资源,对代表性模型的性能进行评估对比。指出该领域目前存在的问题并提出相应的展望。
    参考文献 | 相关文章 | 多维度评价
    38. 基于生物信息学的蛋白质功能预测研究综述
    李昕晖, 钱育蓉, 岳海涛, 胡月, 陈嘉颖, 冷洪勇, 马梦楠
    计算机工程与应用    2023, 59 (16): 50-62.   DOI: 10.3778/j.issn.1002-8331.2212-0167
    摘要251)      PDF(pc) (761KB)(151)    收藏
    蛋白质功能预测任务旨在为缺失功能标签的蛋白质数据提供功能注释,随着蛋白质测序技术的发展,数据库中蛋白质数量迅速增长,由于蛋白质数据的复杂性和多元性,蛋白质功能预测任务极具挑战,受到研究人员的密切关注。梳理了机器学习在蛋白质功能预测中的发展历程;对近年来的蛋白质功能预测方法进行归类与总结,分析各类算法之间的异同;最后对蛋白质功能预测存在的问题进行讨论,并对该领域的未来研究进行展望。
    参考文献 | 相关文章 | 多维度评价
    39. 真实场景下图像超分辨率重建研究综述
    张艳青, 马建红, 韩颖, 曹仰杰, 李颉, 杨聪
    计算机工程与应用    2023, 59 (8): 28-40.   DOI: 10.3778/j.issn.1002-8331.2208-0223
    摘要250)      PDF(pc) (725KB)(148)    收藏
    单幅图像超分辨率是近几十年来计算机视觉领域的一个重要研究课题,基于深度学习的超分辨率重建算法已经取得突破性进展,但当大多数算法应用到真实场景中的图像时效果会大大降低,出现严重模糊、振铃效应等。在此背景下越来越多研究人员致力于研究真实场景下的图像超分辨率算法(real-world single image super-resolution,RSISR)。聚焦于真实场景下图像超分辨率重建算法,介绍了常用公共图像数据集和图像评估指标,从基于外部数据集SR方法和基于内部数据集SR方法两大方向分析对比了各种方法的特点、性能和不足。讨论了RSISR存在的困难和挑战,并对未来的发展趋势进行了思考与展望。
    参考文献 | 相关文章 | 多维度评价
    40. 多模态混合注意力机制的虚假新闻检测研究
    刘华玲, 陈尚辉, 乔梁, 刘雅欣
    计算机工程与应用    2023, 59 (9): 95-103.   DOI: 10.3778/j.issn.1002-8331.2202-0204
    摘要246)      PDF(pc) (622KB)(142)    收藏
    探索高效的模态表示和多模态信息交互方法一直是多模态虚假新闻检测领域的热门话题,提出了一项新的虚假新闻检测技术(MAM)。MAM方法使用结合位置编码的自注意力机制和预训练的卷积神经网络分别提取文本和图像特征;引入混合注意力机制模块进行文本与图像特征交互,该模块使用了层级特征处理方法来减少多模态交互时产生的冗余信息,又使用了双向的特征融合手段保证训练信息的完整性;加权融合多模态特征并将其输入全连接网络中进行真假新闻分类。对比实验结果表明:相比现有的多模态基准模型,该方法几乎在各个分类指标上都提高3个百分点左右,此外,可视化实验发现混合注意力机制获得的多模态特征具有更强的泛化能力。
    参考文献 | 相关文章 | 多维度评价