全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 一年内发表文章
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于深度学习的视觉里程计方法综述
    职恒辉, 尹晨阳, 李慧斌
    计算机工程与应用    2022, 58 (20): 1-15.   DOI: 10.3778/j.issn.1002-8331.2203-0480
    摘要653)      PDF(pc) (904KB)(370)    收藏
    视觉里程计(visual odometry,VO)是处理搭载视觉传感器的移动设备定位问题的一种常用方法,在自动驾驶、移动机器人、AR/VR等领域得到了广泛应用。与传统基于模型的方法相比,基于深度学习的方法可在不需显式计算的情况下从数据中学习高效且鲁棒的特征表达,从而提升其对于光照变化、少纹理等挑战性场景的鲁棒性。简略回顾了基于模型的视觉里程计方法,从监督学习方法、无监督学习方法、模型与学习融合方法、常用数据集、评价指标、模型法与深度学习方法对比分析六个方面全面介绍了基于深度学习的视觉里程计方法。指出了基于深度学习视觉里程计仍存在的问题和未来的发展趋势。
    参考文献 | 相关文章 | 多维度评价
    2. 小样本困境下的图像语义分割综述
    韦婷, 李馨蕾, 刘慧
    计算机工程与应用    2023, 59 (2): 1-11.   DOI: 10.3778/j.issn.1002-8331.2205-0496
    摘要461)      PDF(pc) (4301KB)(336)    收藏
    近年来,由于大规模数据集的出现,图像语义分割技术得到快速发展。但在实际场景中,并不容易获取到大规模、高质量的图像,图像的标注也需要消耗大量的人力和时间成本。为了摆脱对样本数量的依赖,小样本语义分割技术逐渐成为研究热点。当前小样本语义分割的方法主要利用了元学习的思想,按照不同的模型结构可划分为基于孪生神经网络、基于原型网络和基于注意力机制三大类。基于近年来小样本语义分割的发展现状,介绍了小样本语义分割各类方法的发展及优缺点,以及小样本语义分割任务中常用的数据集及实验设计。在此基础上,总结了小样本语义分割技术的应用场景及未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    3. 图异常检测在金融反欺诈中的应用研究进展
    刘华玲, 刘雅欣, 许珺怡, 陈尚辉, 乔梁
    计算机工程与应用    2022, 58 (22): 41-53.   DOI: 10.3778/j.issn.1002-8331.2203-0233
    摘要456)      PDF(pc) (1848KB)(332)    收藏
    随着数字金融的快速发展,欺诈呈现出智能化、产业化以及强隐蔽性等新特点,传统的专家规则和机器学习方法局限性日益显现。图异常检测技术对关联信息具有强大的处理能力,为金融反欺诈提供了新的思路。简要介绍了图异常检测的发展历程和优势;着重从个体反欺诈和群体反欺诈两个视角,将图异常检测划分为基于特征、基于邻近性、基于图表示学习和基于社区划分的个体欺诈检测,以及基于稠密子图、基于稠密子张量和基于深层网络结构的团伙欺诈检测,并对每类技术的基本思想、优缺点、研究进展和典型应用进行对比分析;同时归纳总结了常用的数据集和评价指标,并给出图异常检测在金融反欺诈中的发展前景和研究方向。
    参考文献 | 相关文章 | 多维度评价
    4. 2022年第22期目次
    计算机工程与应用    2022, 58 (22): 0-0.  
    摘要177)      PDF(pc) (176505KB)(331)    收藏
    相关文章 | 多维度评价
    5. 多智能体路径规划综述
    刘志飞, 曹雷, 赖俊, 陈希亮, 陈英
    计算机工程与应用    2022, 58 (20): 43-64.   DOI: 10.3778/j.issn.1002-8331.2203-0467
    摘要915)      PDF(pc) (1013KB)(317)    收藏
    多智能体路径规划(multi-agent path finding,MAPF)是为多个智能体规划路径的问题,关键约束是多个智能体同时沿着规划路径行进而不会发生冲突。MAPF在物流、军事、安防等领域有着大量应用。对国内外关于MAPF的主要研究成果进行系统整理和分类,按照规划方式不同,MAPF算法分为集中式规划算法和分布式执行算法。集中式规划算法是最经典和最常用的MAPF算法,主要分为基于[A*]搜索、基于冲突搜索、基于代价增长树和基于规约四种算法。分布式执行算法是人工智能领域兴起的基于强化学习的MAPF算法,按照改进技术不同,分布式执行算法分为专家演示型、改进通信型和任务分解型三种算法。基于上述分类,比较MAPF各种算法的特点和适用性,分析现有算法的优点和不足,指出现有算法面临的挑战并对未来工作进行了展望。
    参考文献 | 相关文章 | 多维度评价
    6. 基于用户签到的跨社交网络用户匹配
    戴军, 马强
    计算机工程与应用    2023, 59 (2): 76-84.   DOI: 10.3778/j.issn.1002-8331.2203-0581
    摘要74)      PDF(pc) (28513KB)(260)    收藏
    跨社交网络用户匹配技术可以融合多平台用户数据,从而实现更多元的应用,现有基于签到的社交网络用户匹配研究,忽略了多源社交网络签到数据的失衡性,导致算法在真实数据集下匹配精度下降的问题。针对此问题,提出一种基于用户签到的跨社交网络用户匹配方法。通过网格聚类算法对用户签到数据进行粗粒度化和过滤,选择出潜在相关性强的签到数据;从这些签到数据中提取时空特征,计算出不同属性相似度;通过优化多属性相似度的权重分配,综合计算用户匹配分。在多组数据集上的实验结果表明,所提出方法在签到数据失衡情况下的有效性。
    参考文献 | 相关文章 | 多维度评价
    7. 基于深度学习的烟雾与火灾检测算法综述
    祝玉华, 司艺艺, 李智慧
    计算机工程与应用    2022, 58 (23): 1-11.   DOI: 10.3778/j.issn.1002-8331.2206-0154
    摘要326)      PDF(pc) (782KB)(253)    收藏
    在各种灾害中,火灾是最经常、最普遍的威胁公众安全和社会发展的主要灾害之一。随着经济建设的迅猛发展,城市规模日趋扩大,重大火灾隐患急剧增加。然而,目前广泛使用的烟雾传感器探测火灾的方法,易受距离等因素影响,导致检测不及时。视频监控系统的引入为解决这一问题提供了新思路,基于视频的传统图像处理算法是较早提出的方法,最近机器视觉与图像处理技术快速发展,涌现出一系列使用深度学习技术来自动检测视频和图像中火灾的方法,在消防安全领域具有非常重要的实际应用价值。为了综合分析火灾检测的深度学习方法相关改进及应用,简要介绍了基于深度学习的火灾检测流程,重点从分类、检测、分割3个粒度对火灾检测的深度方法详细对比分析,阐述每类算法针对现有问题采取的相关改进。总结现阶段火灾检测存在的问题,并提出未来的研究方向。
    参考文献 | 相关文章 | 多维度评价
    8. Transformer在计算机视觉领域的研究综述
    李翔, 张涛, 张哲, 魏宏杨, 钱育蓉
    计算机工程与应用    2023, 59 (1): 1-14.   DOI: 10.3778/j.issn.1002-8331.2204-0207
    摘要318)      PDF(pc) (1285KB)(234)    收藏
    Transformer是一种基于自注意力机制的深度神经网络。近几年,基于Transformer的模型已成为计算机视觉领域的热门研究方向,其结构也在不断改进和扩展,比如局部注意力机制、金字塔结构等。通过对基于Transformer结构改进的视觉模型,分别从性能优化和结构改进两个方面进行综述和总结;也对比分析了Transformer和CNN各自结构的优缺点,并介绍了一种新型的CNN+Transformer的混合结构;最后,对Transformer在计算机视觉上的发展进行总结和展望。
    参考文献 | 相关文章 | 多维度评价
    9. 深度强化学习求解车辆路径问题的研究综述
    杨笑笑, 柯琳, 陈智斌
    计算机工程与应用    2023, 59 (5): 1-13.   DOI: 10.3778/j.issn.1002-8331.2210-0153
    摘要276)      PDF(pc) (1036KB)(226)    收藏
    车辆路径问题(VRP)是组合优化问题中经典的NP难问题,广泛应用于交通、物流等领域,随着问题规模和动态因素的增多,传统算法很难快速、智能地求解复杂的VRP问题。近年来随着人工智能技术的发展,尤其是深度强化学习(DRL)在AlphaGo中的成功应用,为路径问题求解提供了全新思路。鉴于此,针对近年来利用DRL求解VRP及其变体问题的模型进行文献综述。回顾了DRL求解VRP的相关思路,并梳理基于DRL求解VRP问题的关键步骤,对基于指针网络、图神经网络、Transformer和混合模型的四类求解方法分类总结,同时对目前基于DRL求解VRP及其变体问题的模型性能进行对比分析,总结了基于DRL求解VRP问题时遇到的挑战以及未来的研究方向。
    参考文献 | 相关文章 | 多维度评价
    10. 基于深度域适应的跨域目标检测算法综述
    刘华玲, 皮常鹏, 赵晨宇, 乔梁
    计算机工程与应用    2023, 59 (8): 1-12.   DOI: 10.3778/j.issn.1002-8331.2210-0063
    摘要302)      PDF(pc) (583KB)(224)    收藏
    近年来,基于深度学习的目标检测算法在自动驾驶、人机交互等众多域上有着成功的应用,且因其检测性能较高引起学者的广泛关注。传统的深度学习方法一般基于源域与目标域服从同一分布的假设,但该假设不具备现实性,严重地降低了模型的泛化性能。如何对齐源域与目标域的分布,提高目标检测模型的泛化性成为近两年的研究热点。对跨域目标检测算法进行了综述,介绍了跨域目标检测的预备知识:深度域适应和目标检测,将跨域目标检测分解为两个子问题进行了概述,从底层逻辑理解其发展进程;给出了跨域目标检测算法的最新进展,从差异、对抗、重构、混合和其他等几个分类角度切入,梳理了每个类别的研究脉络并对比了在不同数据集上的性能;通过对目前跨域目标检测算法的梳理和总结,就其未来的研究方向进行展望。
    参考文献 | 相关文章 | 多维度评价
    11. 基于深度学习的相机位姿估计方法综述
    王静, 金玉楚, 郭苹, 胡少毅
    计算机工程与应用    2023, 59 (7): 1-14.   DOI: 10.3778/j.issn.1002-8331.2209-0280
    摘要294)      PDF(pc) (702KB)(196)    收藏
    相机位姿估计是指在已知环境下精确地估计相机在世界坐标系中六自由度位姿的技术,该技术是机器人技术和自动驾驶中的关键技术。随着深度学习的飞速发展,使用深度学习来优化相机位姿估计算法已经成为了当前的研究热点之一。为了掌握目前相机位姿估计算法的研究现状与趋势,对基于深度学习的相机位姿估计的主流算法进行了综述。简单介绍了传统的基于特征点的相机位姿估计方法。重点介绍了基于深度学习的方法:根据核心算法的不同,从端到端的相机位姿估计、场景坐标回归、基于检索的相机位姿估计、层级结构、多信息融合和跨场景的相机位姿估计六个方面进行了详细的阐述和分析。对研究现状进行了总结,并基于深入的性能分析指出了相机位姿估计领域面临的挑战,展望了其发展动向。
    参考文献 | 相关文章 | 多维度评价
    12. 深度学习的目标检测算法改进综述
    杨锋, 丁之桐, 邢蒙蒙, 丁波
    计算机工程与应用    2023, 59 (11): 1-15.   DOI: 10.3778/j.issn.1002-8331.2209-0312
    摘要237)      PDF(pc) (691KB)(195)    收藏
    目标检测是当下计算机视觉领域的研究热点,随着深度学习的发展,基于深度学习的目标检测算法的应用越来越多,性能也不断被提升,通过总结目标检测过程中遇到的常见难题以及相应的改进方法,梳理了基于深度学习的目标检测方法的最新研究进展,重点针对基于深度学习目标检测算法的两大类型进行综述。此外还从注意力机制、轻量型网络、多尺度检测等方面对目标检测算法的最新改进思路进行总结梳理。针对当前目标检测领域存在的问题,对其未来的发展趋势进行展望,并提出可行的解决方案,以期为该领域后续的研究工作提供可借鉴的思路和方向。
    参考文献 | 相关文章 | 多维度评价
    13. 深度长时目标跟踪算法综述
    梁义涛, 韩永波, 李磊
    计算机工程与应用    2023, 59 (4): 1-17.   DOI: 10.3778/j.issn.1002-8331.2206-0507
    摘要237)      PDF(pc) (918KB)(191)    收藏
    在视觉目标跟踪领域,长时跟踪因存在更为复杂的遮挡、相似物干扰和目标消失等具有现实意义的挑战场景,而越来越被研究者所重视。传统长时跟踪算法存在精度低和效率低等问题,已经无法满足如视频监控和自动驾驶等领域对跟踪器性能的应用需求。目前,大量的研究工作通过引入深度神经网络快速推动了长时跟踪技术的发展。为了深入分析深度长时跟踪算法的现状与未来发展,通过对比长短时跟踪数据集及评价指标,初步界定了长时跟踪任务范畴,归纳了长时跟踪任务的需求和难点,并介绍了长时跟踪数据集及评价体系的发展。基于深度长时目标跟踪算法的设计框架,详细描述了框架各组成部分的设计思路。以长时跟踪策略为切入点深入分析了现有研究工作,归纳了不同模型的优缺点及特性。依据对现有研究工作的整理和总结,讨论了该领域面临的挑战,并对未来的发展方向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    14. 个性化学习中学科知识图谱构建与应用综述
    赵宇博, 张丽萍, 闫盛, 侯敏, 高茂
    计算机工程与应用    2023, 59 (10): 1-21.   DOI: 10.3778/j.issn.1002-8331.2209-0345
    摘要206)      PDF(pc) (929KB)(187)    收藏
    学科知识图谱是依赖大数据、人工智能等技术构建的支持教学活动的重要工具,作为一种学科知识语义网络,能够助力个性化学习体系的发展并促进数字教育资源新基建。对知识图谱的概念、分类等内容进行概述;总结了学科知识图谱的概念、特点、优势、内涵及其对个性化学习的支持等内容;重点梳理了学科知识图谱的构建流程:学科本体构建、学科知识抽取、学科知识融合以及学科知识加工,并介绍了学科知识图谱在个性化学习情境中的应用及其面临的挑战;展望了学科知识图谱以及个性化学习的未来趋势,为教育资源的组织方式及个性化学习的创新发展提供借鉴和启示。
    参考文献 | 相关文章 | 多维度评价
    15. 基于深度学习和Transformer的目标检测算法
    付苗苗, 邓淼磊, 张德贤
    计算机工程与应用    2023, 59 (1): 37-48.   DOI: 10.3778/j.issn.1002-8331.2205-0354
    摘要304)      PDF(pc) (947KB)(183)    收藏
    目标检测是实现目标跟踪、实例分割等高级视觉任务的基础,在智慧交通、缺陷检测、智能安防等现实场景有着重要应用。现有高精度检测算法都是在深度学习的指导下实现,同时伴有锚框技术,但是锚框自身的不足对检测器性能有着较大影响,无锚点碰撞检测成为了近几年目标检测领域新的研究方向。与此同时,Transformer表现出的巨大潜力为视觉领域开辟了图像与Transformer结合这个新方向,基于Transformer的目标检测也成为一个新的研究热点。系统地总结了深度学习时代的目标检测算法,调查并研究了近五年目标检测的相关论文,重点从Anchor-free和Transformer两个角度对这些算法进行深入分析,介绍了这些算法在现实场景具体应用情况以及目标检测领域常用数据集,基于目前的研究现状对目标检测的未来可研究方向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    16. 改进YOLOv5的遥感图像目标检测算法
    李坤亚, 欧鸥, 刘广滨, 于泽峰, 李林
    计算机工程与应用    2023, 59 (9): 207-214.   DOI: 10.3778/j.issn.1002-8331.2209-0119
    摘要233)      PDF(pc) (665KB)(179)    收藏
    针对遥感图像中背景复杂度高、目标尺寸多样和小目标存在过多所导致的目标检测精度较低的问题,提出一种改进YOLOv5的遥感图像目标检测算法。该算法在主干网络引入通道-全局注意力机制(CGAM)以增强对不同尺度目标的特征提取能力和抑制冗余信息的干扰。引入密集上采样卷积(DUC)模块扩张低分辨率卷积特征图,有效增强不同卷积特征图的融合效果。将改进算法应用于公开遥感数据集RSOD中,改进YOLOv5算法平均精度AP值达到78.5%,较原算法提升了3.1个百分点。实验结果证明,改进后的算法能有效提高遥感图像目标检测精度。
    参考文献 | 相关文章 | 多维度评价
    17. YOLO系列目标检测算法研究进展
    王琳毅, 白静, 李文静, 蒋金哲
    计算机工程与应用    2023, 59 (14): 15-29.   DOI: 10.3778/j.issn.1002-8331.2301-0081
    摘要172)      PDF(pc) (1009KB)(178)    收藏
    YOLO算法是目标检测中研究的热点方向之一。近几年,随着YOLO系列算法及其改进模型的不断提出,使其在目标检测领域取得了优异的成绩,被广泛应用于现实中各个领域。针对YOLO系列目标检测算法,整理了目标检测典型数据集及评价指标;回顾了YOLO整体框架以及YOLOv1~YOLOv7目标检测算法的发展历程;总结了在输入、特征提取和预测这三个阶段下的数据增强、轻量化网络构建和IOU损失优化等八个改进方向的模型及性能;介绍了YOLO算法应用领域;结合目标检测目前存在的实际问题,总结并展望了YOLO算法的发展方向。
    参考文献 | 相关文章 | 多维度评价
    18. 改进YOLOv5的无人机影像小目标检测算法
    谢椿辉, 吴金明, 徐怀宇
    计算机工程与应用    2023, 59 (9): 198-206.   DOI: 10.3778/j.issn.1002-8331.2212-0336
    摘要224)      PDF(pc) (808KB)(176)    收藏
    无人机航拍影像具有目标尺度变化大、背景复杂等诸多特性,导致现有的检测器难以检测出航拍影像中的小目标。针对无人机影像中小目标误检漏检的问题,提出了改进YOLOv5的算法模型Drone-YOLO。增加了检测分支以提高模型在多尺度下的检测能力。设计了多层次信息聚合的特征金字塔网络结构,实现跨层次信息的融合。设计了基于多尺度通道注意力机制的特征融合模块,提高对小目标的关注度。将预测头的分类任务与回归任务解耦,使用Alpha-IoU优化损失函数定义,提升模型检测的效果。通过无人机影像数据集VisDrone的实验结果表明,Drone-YOLO模型较YOLOv5模型在AP50指标上提高了4.91个百分点,推理延时仅需16.78?ms。对比其他主流模型对于小目标拥有更好的检测效果,能够有效完成无人机航拍影像的小目标检测任务。
    参考文献 | 相关文章 | 多维度评价
    19. 可解释人工智能研究综述
    赵延玉, 赵晓永, 王磊, 王宁宁
    计算机工程与应用    2023, 59 (14): 1-14.   DOI: 10.3778/j.issn.1002-8331.2208-0322
    摘要162)      PDF(pc) (683KB)(175)    收藏
    随着机器学习和深度学习的发展,人工智能技术已经逐渐应用在各个领域。然而采用人工智能的最大缺陷之一就是它无法解释预测的依据。模型的黑盒性质使得在医疗、金融和自动驾驶等关键任务应用场景中人类还无法真正信任模型,从而限制了这些领域中人工智能的落地应用。推动可解释人工智能(explainable artificial intelligence,XAI)的发展成为实现关键任务应用落地的重要问题。目前,国内外相关领域仍缺少有关可解释人工智能的研究综述,也缺乏对因果解释方法的关注以及对可解释性方法评估的研究。从解释方法的特点出发,将主要可解释性方法分为三类:独立于模型的方法、依赖于模型的方法和因果解释方法,分别进行总结分析,对解释方法的评估进行总结,列举出可解释人工智能的应用,讨论当前可解释性存在的问题并进行展望。
    参考文献 | 相关文章 | 多维度评价
    20. 跨模态检索技术研究综述
    徐文婉, 周小平, 王佳
    计算机工程与应用    2022, 58 (23): 12-23.   DOI: 10.3778/j.issn.1002-8331.2205-0160
    摘要464)      PDF(pc) (769KB)(171)    收藏
    跨模态检索可以通过一种模态检索出其他模态的信息,已经成为大数据时代的研究热点。研究者基于实值表示和二进制表示两种方法来减小不同模态信息的语义差距并进行有效的相似度对比,但仍会有检索效率低或信息丢失的问题。目前,如何进一步提高检索效率和信息利用率是跨模态检索研究面临的关键挑战。介绍了跨模态检索研究中基于实值表示和二进制表示两种方法的发展现状;分析对比了包含两种表示技术下以建模技术和相似性对比为主线的五种跨模态检索方法:子空间学习、主题统计模型学习、深度学习、传统哈希和深度哈希;对最新的多模态数据集进行总结,为相关的研究和工程人员提供有价值的参考资料;分析了跨模态检索面临的挑战并指出了该领域未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    21. 药物-靶点相互作用预测的计算方法综述
    张然, 王学志, 汪嘉葭, 孟珍
    计算机工程与应用    2023, 59 (12): 1-13.   DOI: 10.3778/j.issn.1002-8331.2210-0108
    摘要189)      PDF(pc) (675KB)(164)    收藏
    药物-靶点相互作用预测旨在发现可作用于特定蛋白质的潜在药物,在药物重定位、药物副作用预测、多重药理学和耐药性的研究中都发挥着重要作用。随着计算机处理能力的进步和计算算法的不断更新,药物-靶点相互作用预测的计算方法展现出时间短、成本低、精度高、范围广的优势,受到了广泛的关注,并取得了显著的进展。为了梳理其研究发展历程,探讨未来的研究方向,就药物-靶点相互作用预测的背景和意义进行简要概述;将方法分为基于分子对接、基于药物结构、基于文本挖掘和基于化学基因组四类进行综述,并对每类方法进行对比分析,详细阐述每类方法的数据需求及应用场景;对现有研究存在的局限性和面临的挑战进行讨论,展望未来的研究方向,为后续研究提供参考和借鉴。
    参考文献 | 相关文章 | 多维度评价
    22. 深度学习实时语义分割算法研究综述
    何家峰, 陈宏伟, 骆德汉
    计算机工程与应用    2023, 59 (8): 13-27.   DOI: 10.3778/j.issn.1002-8331.2210-0144
    摘要193)      PDF(pc) (1161KB)(160)    收藏
    语义分割是从像素的角度分割出图片中的不同对象,并对原始图片中的每个像素进行标注的一种技术。但由于无人机导航、遥感图像、医疗诊断等应用领域需要实时地进行语义分割处理。所以,基于深度学习的实时语义分割技术得到了迅速的发展。实时语义分割技术发展至今已有许多的技术与模型。基于此,在对相关文献进行研究的基础上,由语义分割技术引出了实时语义分割技术,并简单叙述了实时语义分割的优点。随后,研讨出目前实时语义分割存在的重难点。根据重难点进而对已存在的相关技术与模型进行阐述,并总结技术与模型的优缺点。最后,展望实时语义分割所面临的挑战,并对实时语义分割进行了总结与归纳,为后续的研讨提供了一些理论参考。
    参考文献 | 相关文章 | 多维度评价
    23. 深度多模态表示学习的研究综述
    潘梦竹, 李千目, 邱天
    计算机工程与应用    2023, 59 (2): 48-64.   DOI: 10.3778/j.issn.1002-8331.2206-0145
    摘要191)      PDF(pc) (6521KB)(159)    收藏
    尽管深度学习因为强大的非线性表示能力已广泛应用于许多领域,多源异构模态数据间结构和语义上的鸿沟严重阻碍了后续深度学习模型的应用。虽然已经有许多学者提出了大量的表示学习方法以探索不同模态间的相关性和互补性,并提高深度学习预测和泛化性能。然而,多模态表示学习研究还处于初级阶段,依然存在许多科学问题尚需解决。迄今为止,多模态表示学习仍缺乏统一的认知,多模态表示学习研究的体系结构和评价指标尚不完全明确。根据不同模态的特征结构、语义信息和表示能力,从表示融合和表示对齐两个角度研究和分析了深度多模态表示学习的进展,并对现有研究工作进行了系统的总结和科学的分类。同时,解析了代表性框架和模型的基本结构、应用场景和关键问题,分析了深度多模态表示学习的理论基础和最新发展,并且指出了多模态表示学习研究当前面临的挑战和今后的发展趋势,以进一步推动深度多模态表示学习的发展和应用。
    参考文献 | 相关文章 | 多维度评价
    24. 表格检测与结构识别综述
    张宇童, 李启元, 刘树衎
    计算机工程与应用    2022, 58 (22): 1-11.   DOI: 10.3778/j.issn.1002-8331.2206-0337
    摘要192)      PDF(pc) (859KB)(155)    收藏
    针对当前文档分析领域中表格分析的发展现状,整理了近年来领域内的相关文献,分别对表格检测和表格结构识别两个关键任务进行研究。针对表格检测任务,将其划分为基于目标检测、图神经网络、生成对抗网络、可变卷积网络的方法;针对表格结构识别任务,将其划分为基于目标检测、图神经网络、循环神经网络、可变卷积与扩张卷积网络的方法。总结了各类模型的方法路径和局限性,梳理了相关任务及其对应的数据集。更广泛地总结了表格分析领域常用的公开数据集,并对各数据集的来源、规模、适用范围及文件类型进行详细介绍。列举了表格分析领域常用的评价指标,并按照实验数据集的不同对现有模型的实验结果进行对比。总结了当前表格分析领域的发展状况,并对未来发展方向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    25. 知识图谱增强的图神经网络推荐研究进展
    吴国栋, 王雪妮, 刘玉良
    计算机工程与应用    2023, 59 (4): 18-29.   DOI: 10.3778/j.issn.1002-8331.2205-0268
    摘要208)      PDF(pc) (638KB)(155)    收藏
    已有推荐方法主要基于用户与项目的历史交互行为,未充分运用用户及项目相关特征信息,推荐效果并不理想。知识图谱(knowledge graph,KG)增强的图神经网络(graph neural network,GNN)推荐,是以用户与项目交互行为构建的交互图为基础,引入同为图结构的知识图谱,并运用图神经网络技术进行处理,从而实现个性化推荐。深入探讨了现有知识图谱增强的图神经网络推荐研究进展。首先在对图神经网络推荐和知识图谱推荐进行探讨的基础上,从项目知识图谱和协同知识图谱视角,深入分析了当前知识图谱增强的图神经网络推荐取得的相关研究成果;然后从大规模动态知识图谱处理、用户对项目属性的偏好挖掘、知识图谱的图嵌入学习等方面,指出了已有知识图谱增强的图神经网络推荐研究存在的主要问题;最后从动态时序知识图谱增强的GNN推荐、元学习的知识图谱增强GNN推荐、多模态知识图谱增强的GNN推荐、知识图谱增强的GNN跨领域推荐等方面,展望了知识图谱增强的图神经网络推荐未来主要研究方向。
    参考文献 | 相关文章 | 多维度评价
    26. 全景图像质量评价方法最新进展
    艾达, 白岩松, 于可欣, 元辉, 刘颖
    计算机工程与应用    2022, 58 (24): 1-11.   DOI: 10.3778/j.issn.1002-8331.2206-0157
    摘要179)      PDF(pc) (952KB)(152)    收藏
    随着虚拟现实技术的快速发展,全景视频图像已成为一种新的媒体展示形式被投入使用。全景图像的质量评价方法对促进虚拟现实技术具有重要的现实意义。研究了近五年来全景图像质量评价新方法。分析了全景图像客观评价指标,包括基于峰值信噪比的改进方法和基于结构相似性的改进方法。归纳总结了基于深度学习的全景图像质量评价方法以及其特有的缝合失真和投影失真的评价方法。搜集整理了常用的全景图像质量评价公共数据集与专有自建数据集。采用皮尔森相关系数、斯皮尔曼秩相关系数与均方根误差作为评价指标,根据客观评分与人眼主观感受的相关程度对现有全景图像质量评价方法进行了对比分析。对全景图像质量评价方法的发展方向进行展望。
    参考文献 | 相关文章 | 多维度评价
    27. 自动导引车与机器集成调度问题研究现状
    吴斌, 丁钰超, ABLA Basri
    计算机工程与应用    2023, 59 (6): 1-12.   DOI: 10.3778/j.issn.1002-8331.2207-0427
    摘要160)      PDF(pc) (727KB)(151)    收藏
    随着自动导引车(automated guided vehicles,AGV)的广泛应用,柔性制造车间中机器设备与AGV之间的协同配合日益受到重视。AGV与机器的集成调度主要研究机器分配、工序排序、搬运任务的AGV分配以及AGV路径规划。该问题是极为复杂的组合优化问题,对其研究具有重要的学术意义和应用价值。围绕问题特征,从模型与算法两个方面,对国内外最新的研究文献进行了梳理。对现有模型中的约束条件和优化目标进行了详细分类,从遗传算法、混合优化算法、仿真优化算法等五个方面综述了现有算法研究中的代表性成果。在此基础上,指出了现有研究中的不足,提出了未来的研究内容和方向。
    参考文献 | 相关文章 | 多维度评价
    28. 深度学习在安全帽佩戴检测中的应用研究综述
    高腾, 张先武, 李柏
    计算机工程与应用    2023, 59 (6): 13-29.   DOI: 10.3778/j.issn.1002-8331.2207-0434
    摘要199)      PDF(pc) (832KB)(151)    收藏
    在深度学习的推动下,目标检测方法在工业安防领域取得了很大的进展,安全帽佩戴检测任务逐渐成为智能图像识别领域的一项重要研究课题。为了综合分析深度学习技术在安全帽佩戴检测任务中的研究现状,方便后续科研人员开展研究性工作。对近年来国内外学者在深度学习环境下的安全帽佩戴检测算法总结归纳,对比分析这些方法的优点和局限性。分别从数据集的建立和用途、安全帽佩戴检测主要检测算法归纳、当前安全帽佩戴检测领域的难点这三个方面进行分析。对安全帽佩戴检测领域未来的研究方向进行展望,并提出该领域今后研究重点。
    参考文献 | 相关文章 | 多维度评价
    29. 基于Transformer的目标检测算法综述
    李建, 杜建强, 朱彦陈, 郭永坤
    计算机工程与应用    2023, 59 (10): 48-64.   DOI: 10.3778/j.issn.1002-8331.2211-0133
    摘要233)      PDF(pc) (875KB)(151)    收藏
    深度学习框架Transformer具有强大的建模能力和并行计算能力,目前基于Transformer的目标检测算法已经成为研究的热点。为了进一步探索目标检测的新思路、新方向,对基于Transformer的目标检测算法进行了归纳总结。概述了多种目标检测数据集及其应用场景,从特征学习、目标估计、标签匹配策略和算法应用四方面梳理了Transformer目标检测的相关算法,并与基于卷积神经网络的目标检测算法进行对比,分析了Transformer在目标检测任务中的优点和局限性,并提出了Transformer目标检测模型的一般性框架。对Transformer在目标检测领域中的发展趋势进行了展望。
    参考文献 | 相关文章 | 多维度评价
    30. 基于Transformer的多模态气象预测
    向德萍, 张普, 向世明, 潘春洪
    计算机工程与应用    2023, 59 (10): 94-103.   DOI: 10.3778/j.issn.1002-8331.2208-0486
    摘要153)      PDF(pc) (977KB)(148)    收藏
    随着气象观测技术的快速发展,气象行业积累了海量的气象大数据,为构建新型的数据驱动的气象预测模型提供了机遇。由于气象数据中存在的长时依赖关系和大范围空间关联关系,以及多模态气象要素间存在的复杂跨模态耦合关系,基于深度学习的气象预测是一个具有挑战性的研究课题。针对“温度、相对湿度、纬向风速、经向风速”四种经典气象要素组成的等气压层时序多模态数据,提出了一种基于多模态融合的气象预测深度学习模型。首先采用卷积网络来学习各个模态的特征,并在此基础上引入门控机制实现多模态加权融合;然后引入注意力机制,以并行时空轴向注意力代替传统的注意力机制,从而有效地学习长时依赖关系和大范围空间关联关系。整体结构上,采用了基于Transformer的编码器-解码器结构。在ERA5再分析数据集(子区域)上进行了对比实验,实验结果表明了所提方法在温度、相对湿度、风速等预测任务上的有效性和优越性。
    参考文献 | 相关文章 | 多维度评价
    31. 改进YOLOv5的轻量化口罩检测算法
    刘翀豪, 潘理虎, 杨帆, 张睿
    计算机工程与应用    2023, 59 (7): 232-241.   DOI: 10.3778/j.issn.1002-8331.2209-0013
    摘要153)      PDF(pc) (906KB)(146)    收藏
    为了提高现有口罩检测算法检测效率,降低算法参数量以及模型大小,提出了一种改进的轻量化口罩检测算法YOLOv5-MBF。用GELU激活函数替换MobileNetV3深层网络的hard-swish激活函数,优化了模型收敛效果,将改进的MobileNetV3网络替换YOLOv5s主干网络,降低计算量提高模型检测速度。增加BiFPN特征金字塔结构与不同特征层融合,提高了检测精度。在数据处理方面使用Mosaic和Mixup数据增强提高该模型的泛化性和鲁棒性。边框回归损失函数使用Focal-Loss EIoU,优化了模型训练收敛速度且提高了口罩和人脸边框定位精度。最后添加CBAM注意力机制使得模型更关注重要特征抑制不显著特征提高检测性能。实验结果表明,该算法在佩戴口罩目标和无佩戴口罩目标上的平均精度均值达到了89.5%,模型推理速度提升了43%,模型参数了减少了49%,模型大小降低了48%,满足口罩检测任务的实时性和检测精度要求。
    参考文献 | 相关文章 | 多维度评价
    32. FS-YOLOv5:轻量化红外目标检测方法
    黄磊, 杨媛, 杨成煜, 杨威, 李耀华
    计算机工程与应用    2023, 59 (9): 215-224.   DOI: 10.3778/j.issn.1002-8331.2210-0487
    摘要169)      PDF(pc) (815KB)(140)    收藏
    针对传统目标识别算法复杂场景下的道路目标识别精度低、实时性差、小目标检测难度大等问题,提出了基于红外场景下FS-YOLOv5轻量化模型。采用单阶段目标检测网络YOLOv5s作为基础网络,提出了一种新的FS-MobileNetV3网络代替原网络中的CSPDarknet主干网络来提取特征图像;在原网络CIoU损失函数的基础上引入Power变换,替换为α-CIoU,提高网络对小目标的检测能力;将K-means++聚类算法应用在FLIR红外数据集上重新生成Anchor,最后利用DIoU-NMS替换原网络的NMS后处理方法,改善对遮挡物体的检测能力,降低了模型的漏检率。通过在FLIR红外数据集上的消融实验验证了FS-YOLOv5轻量化算法满足红外场景下的道路目标检测任务,与原网络相比,在平均精度仅降低0.37个百分点的前提下,FS-YOLOv5模型的大小减少了26%,参数量减少了29%,检测速度提升了11?FPS,满足了在不同场景下移动端部署的需求。
    参考文献 | 相关文章 | 多维度评价
    33. 改进YOLOv5的钢丝绳损伤图像识别实验方法研究
    王红尧, 韩爽, 李勤怡
    计算机工程与应用    2023, 59 (17): 99-106.   DOI: 10.3778/j.issn.1002-8331.2210-0505
    摘要86)      PDF(pc) (3673KB)(140)    收藏
    钢丝绳在煤矿设备中发挥着非常重要的作用。为了能够及早发现钢丝绳损伤,提前进行预警和故障处理,保护矿下人员安全,提出了一种基于深度学习的钢丝绳损伤识别检测方法,采用目标检测算法YOLOv5并对其进行改进。采用快速自适应加权中值滤波进行图像预处理,提高钢丝绳损伤图像识别精度,改进后运行速度提升到187?ms/张,且增强效果良好;将CBAM模块和Transformer prediction heads(TPH)集成到YOLOv5,数据集扩充后输入到改进的模型中进行训练测试。实验结果表明,改进后的模型检测性能良好,最终平均准确率达到了0.893,比原算法高了0.037,比传统检测算法SSD、Faster R-CNN以及原始YOLOv3分别高0.196、0.162、0.102,表明该算法精度较高,有效提高了钢丝绳损伤图像的识别准确率。
    参考文献 | 相关文章 | 多维度评价
    34. 驾驶员疲劳驾驶检测方法研究综述
    张瑞, 朱天军, 邹志亮, 宋瑞
    计算机工程与应用    2022, 58 (21): 53-66.   DOI: 10.3778/j.issn.1002-8331.2204-0053
    摘要205)      PDF(pc) (946KB)(139)    收藏
    由于疲劳驾驶导致的交通事故占比逐年上涨,引起了研究人员的广泛关注。目前疲劳驾驶检测的研究受限于科技水平、环境、道路等各种因素的影响,导致疲劳驾驶检测技术难以进一步发展。介绍了近10年内驾驶员疲劳驾驶检测方法的最新进展。阐述并回顾了主动检测法和被动检测法两大类。根据两大类检测方法各自不同的特征进行细致的分类。进一步分析了各类疲劳驾驶检测方法的优势和局限,同时对主动检测法中基于面部特征的检测方法近3年内所使用的检测算法进行了分析和总结。归纳了各类疲劳驾驶检测方法存在的不足,同时提出疲劳检测领域未来的研究趋势,为研究人员进一步的研究提供新的思路。
    参考文献 | 相关文章 | 多维度评价
    35. 视觉Transformer在医学图像分析中的应用研究综述
    石磊, 籍庆余, 陈清威, 赵恒毅, 张俊星
    计算机工程与应用    2023, 59 (8): 41-55.   DOI: 10.3778/j.issn.1002-8331.2206-0022
    摘要208)      PDF(pc) (869KB)(138)    收藏
    深度自注意力网络(Transformer)对输入信息全局特征和长距离相关性具有天然良好的建模能力,其与卷积神经网络(CNN)的归纳偏置特性具有较强互补性。受其在自然语言处理领域取得巨大成功的启发,Transformer已被广泛引入到计算机视觉各项任务特别是医学图像分析领域并已取得了不俗表现。对Transformer与自然图像结合的典型工作进行介绍,根据视觉Transformer在医学图像分割、医学图像分类以及医学图像配准等子领域对相关工作按照不同病灶及部位进行了整理和归纳,重点对一些代表性研究工作的实现思想进行了详细分析。对现有研究工作进行了讨论并对未来方向进行了展望,以期为该领域的进一步深入研究提供参考。
    参考文献 | 相关文章 | 多维度评价
    36. 利用知识图谱的推荐系统研究综述
    张明星, 张骁雄, 刘姗姗, 田昊, 杨琴琴
    计算机工程与应用    2023, 59 (4): 30-42.   DOI: 10.3778/j.issn.1002-8331.2209-0033
    摘要240)      PDF(pc) (702KB)(135)    收藏
    随着互联网的快速发展,如何从海量数据中筛选实际需要的信息变得尤为重要。推荐系统作为一种信息过滤的方法,旨在为用户推荐个性化内容。传统推荐算法中普遍存在数据稀疏和冷启动问题,近年来,研究者利用知识图谱中丰富的实体与关系信息,不仅能够缓解以上问题,同时增强了推荐系统的整体性能。利用知识图谱的推荐系统研究主要包括三方面内容:介绍推荐系统和知识图谱的基本概念,指出现有推荐算法的不足之处;根据不同核心技术详细分析利用知识图谱的推荐系统研究现状,评估不同方法的技术优势与挑战;总结相关应用场景和数据集信息,并展望未来发展前景。
    参考文献 | 相关文章 | 多维度评价
    37. 少样本关系分类综述
    刘涛, 柯尊旺, 吾守尔·斯拉木
    计算机工程与应用    2023, 59 (9): 1-12.   DOI: 10.3778/j.issn.1002-8331.2208-0027
    摘要149)      PDF(pc) (687KB)(134)    收藏
    少样本关系分类旨在通过少量的有标注训练样本,来挖掘自然语言文本中目标实体之间所蕴含的语义关系,以应对传统的关系分类方法所面临的资源匮乏问题,从而能够较好地推广到医学、金融以及民语处理等数据稀缺的特定领域。目前,少样本关系分类的相关研究工作均在元学习的训练策略下学习先验知识,并以此快速适应新的任务,其大体上可以划分为基于原型网络、基于预训练语言模型、基于参数优化以及基于图神经网络四种方式。回顾少样本关系分类的发展,对不同研究方法的优势和局限性进行深入剖析和总结,在此基础上,分析该领域当前所面临的棘手问题和挑战,并进一步对其未来的研究方向进行展望。
    参考文献 | 相关文章 | 多维度评价
    38. 单张图像三维人脸重建方法综述
    王静婷, 李慧斌
    计算机工程与应用    2023, 59 (17): 1-21.   DOI: 10.3778/j.issn.1002-8331.2210-0041
    摘要96)      PDF(pc) (961KB)(133)    收藏
    近年来,三维人脸重建任务作为“数字人”技术的重要组成部分,受到了学术界和工业界的广泛关注。基于单张图像的三维人脸重建任务在充分结合传统相机模型、光照模型、三维人脸统计形变模型与深度卷积网络、深度生成模型等方面技术之后取得了长足的进步。聚焦单张图像三维人脸重建问题,将现有研究工作分为基于隐空间编码和基于显空间回归两类。第一类研究工作对基础三维人脸统计模型的基系数求解、损失函数设计等进行优化,提升重建效果,在人脸拓扑结构变化方面具备鲁棒性优势,但缺乏细节特征。第二类工作以显空间多种数据形式表示三维人脸并直接通过深度网络进行回归,通常可获得更加个性化的三维人脸细节特征且对光照、遮挡等干扰因素具有较好的鲁棒性。进一步,基于常用数据集和评价指标,充分探讨并比较了两类方法中一些典型方法的优缺点。最后对全文进行总结,并给出了单张图像三维人脸重建任务面临的主要挑战及未来发展趋势。
    参考文献 | 相关文章 | 多维度评价
    39. LSTFormer:基于Swin Transformer的轻量化语义分割网络
    杨承, 高建瓴, 郑美琳, 丁容
    计算机工程与应用    2023, 59 (12): 166-175.   DOI: 10.3778/j.issn.1002-8331.2210-0331
    摘要175)      PDF(pc) (801KB)(131)    收藏
    针对现有基于Transformer的语义分割网络普遍存在计算复杂度高的问题,提出了一种基于Swin Transformer的轻量化语义分割网络。该网络通过Swin Transformer获取多个尺度的特征图;采用全感知模块和改进的级联融合模块跨层融合不同尺度的特征图,减小不同层级特征图的语义差距;引入单个Swin Transformer block对初分割特征映射进行优化,通过移动窗口自注意力机制提升网络对不同像素点进行分类的能力;训练阶段加入Dice损失函数和交叉熵损失函数,提高网络的分割性能和收敛速度。实验结果表明,LSTFormer在数据集ADE20K和Cityscapes上mIoU分别达到49.47%和81.47%,相较于SETR和Swin-UPerNet等同类网络,LSTFormer在保持相当分割精度的同时具有更低的参数量和计算量。
    参考文献 | 相关文章 | 多维度评价
    40. 2023年第14期目次
    计算机工程与应用    2023, 59 (14): 0-0.  
    摘要98)      PDF(pc) (702KB)(130)    收藏
    相关文章 | 多维度评价