摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 一年内发表文章
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 改进RTMDet的SAR舰船检测算法
    张玉宁, 贾渊, 陈越
    计算机工程与应用    2024, 60 (22): 314-322.   DOI: 10.3778/j.issn.1002-8331.2307-0175
    摘要664)      PDF(pc) (5257KB)(96)    收藏
    针对合成孔径雷达(synthetic aperture radar,SAR)图像中小目标舰船和复杂背景下舰船检测精度低的问题,提出一种改进RTMDet(real-time models for object detection)的SAR舰船检测算法。优化主干网络结构中的基本构建单元,并引入全局注意力机制SimAM(simple,parameter-free attention module),在不增加额外参数的情况下提高模型对关键特征信息的提取能力;为了在特征融合过程中减少小目标特征信息流失和增加其在浅层特征图中的融合占比,构建新的轻量级特征融合模块SPD-RPAFPN(space to depth reverse path aggregation feature pyramid network);在预测模块中将回归损失函数替换为KFIoU(Kalman filter based intersection over union),提高模型对小目标舰船的检测能力。在公开数据集RSDD上进行了实验对比,改进后的算法相比RTMDet,模型参数量和计算量分别下降4.5%和10.8%,同时近岸AP提高14.6个百分点,总AP提高2.7个百分点,达到90.7%。与目前的主流算法对比,SAR舰船检测精度也明显提升,证明了改进RTMDet算法的有效性。
    参考文献 | 相关文章 | 多维度评价
    2. 融合多层次卷积神经网络的知识图谱嵌入模型
    李敏, 李学俊, 廖竞
    计算机工程与应用    2025, 61 (6): 192-198.   DOI: 10.3778/j.issn.1002-8331.2310-0360
    摘要365)      PDF(pc) (748KB)(81)    收藏
    知识图谱嵌入将实体和关系投影到连续的低维嵌入空间中来学习三元组特征。基于翻译类的模型无法提取深层知识且特征表达能力有限,基于神经网络的模型虽然能提取出深层知识但容易丢失浅层知识,并且对于实体和关系间的特征交互能力较弱。为了在基于神经网络的模型中充分提取三元组浅层与深层特征,提出一种融合多层次卷积神经网络的知识图谱嵌入模型(ConvM),该模型使用头实体与关系交叉排列的重组嵌入方式来加强实体关系间的特征交互,并采用空洞卷积与一维、三维卷积核并列结合的特征提取模块来捕获实体关系间的多尺度交互特征,除此之外引入残差连接以改善原始信息遗忘问题。在五个公开数据集上对ConvM模型进行链接预测实验,实验结果表明,ConvM模型在FB15k、FB15k-237和Kinship数据集上的MRR指标相比ConvE模型分别提升了23.3%、10.8%、12.2%,体现了ConvM模型优秀的特征表达能力,有效提升了链接预测性能。
    参考文献 | 相关文章 | 多维度评价
    3. 基于大语言模型的智能问答系统研究综述
    任海玉, 刘建平, 王健, 顾勋勋, 陈曦, 张越, 赵昌顼
    计算机工程与应用    2025, 61 (7): 1-24.   DOI: 10.3778/j.issn.1002-8331.2409-0300
    摘要352)      PDF(pc) (1720KB)(398)    收藏
    智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥有数十亿甚至上千亿个参数,不仅能够理解和生成自然语言,还能显著提升问答系统的准确性和效率,推动智能问答技术的发展。近年来,基于大模型技术的智能问答逐渐成为研究热点,但对该领域的系统性综述仍然较为欠缺。因此,针对大模型的智能问答系统进行系统综述,介绍了问答系统的基本概念和数据集及其评价指标;介绍了基于大模型的问答系统,其中包括基于提示学习的问答系统、基于知识图谱的问答系统、基于检索增强生成的问答系统和基于智能代理的问答系统以及微调在问答任务中的技术路线,并对比了五种方法在问答系统中的优缺点和应用场景;对于当前基于大语言模型的问答系统面临的研究挑战和未来发展趋势进行了总结。
    参考文献 | 相关文章 | 多维度评价
    4. 人工智能在中医诊疗领域的研究综述
    苏尤丽, 胡宣宇, 马世杰, 张雨宁, 阿布都克力木·阿布力孜, 哈里旦木·阿布都克里木
    计算机工程与应用    2024, 60 (16): 1-18.   DOI: 10.3778/j.issn.1002-8331.2312-0400
    摘要331)      PDF(pc) (6171KB)(306)    收藏
    中医诊疗领域正逐步迈向标准化、客观化、现代化与智能化。在此过程中,人工智能的融入极大地推动了中医诊疗、科学研究及中医传承的发展。从人工智能在中医领域的研究现状出发,梳理了从最初的专家系统和规则引擎,到逐渐成熟的传统机器学习算法,再到如今引领潮流的深度学习三个阶段,人工智能在中医领域的应用发展情况。总结了近年来涌现出的中医知识管理工具和大型模型,这些工具和模型为中医诊疗的智能化提供了坚实的支持。最后针对现阶段人工智能在中医领域中存在的数据公平性、多模态数据理解、模型鲁棒性、个性化医疗及可解释性等多重挑战进行分析。为应对这些挑战,需要持续探索并提出可能的解决方案,以推动中医诊疗智能化的深入发展,更好地满足人民健康需求。
    参考文献 | 相关文章 | 多维度评价
    5. 轻量化深度卷积神经网络设计研究进展
    周志飞, 李华, 冯毅雄, 陆见光, 钱松荣, 李少波
    计算机工程与应用    2024, 60 (22): 1-17.   DOI: 10.3778/j.issn.1002-8331.2404-0372
    摘要321)      PDF(pc) (6330KB)(382)    收藏
    轻量化设计是解决深度卷积神经网络(deep convolutional neural network,DCNN)对设备性能和硬件资源依赖性的流行范式,轻量化的目的是在不牺牲网络性能的前提下,提高计算速度和减少内存占用。综述了DCNN的轻量化设计方法,着重回顾了近年来DCNN的研究进展,包括体系设计和模型压缩两大轻量化策略,深入比较了这两类方法的创新性、优势与局限性,并探讨了支撑轻量化模型的底层框架。此外,对轻量化网络已经成功应用的场景进行了描述,并对DCNN轻量化的未来发展趋势进行了预测,旨在为深度卷积神经网络的轻量化研究提供有益的见解和参考。
    参考文献 | 相关文章 | 多维度评价
    6. 基于深度学习的基础设施表面裂纹检测方法研究进展
    胡翔坤, 李华, 冯毅雄, 钱松荣, 李键, 李少波
    计算机工程与应用    2025, 61 (1): 1-23.   DOI: 10.3778/j.issn.1002-8331.2407-0407
    摘要310)      PDF(pc) (9136KB)(324)    收藏
    民用基础设施在长期使用后容易发生物理结构或性能状态的改变,对其功能和使用安全造成一定的损害,因此,对这类设施的结构健康监测是十分必要的。裂纹检测是结构健康监测中极其重要的一部分,及时检测并识别这类损伤,能有效避免事故的发生。基于计算机视觉的表面裂纹检测方法操作简单、检测速度快、准确率高,被广泛应用于民用基础设施的表面裂纹检测。从图像分类、目标检测、语义分割三个不同的检测方向综述了基于深度学习的基础设施表面裂纹检测方法,总结了常见的数据采集方法和常用的公共裂纹数据集。最后讨论了基于深度学习的基础设施表面裂纹检测方法存在的困难与挑战,并展望了未来可能的发展方向。
    参考文献 | 相关文章 | 多维度评价
    7. 推荐算法研究进展及知识图谱可视化分析
    林素青, 罗定南, 张书华
    计算机工程与应用    2024, 60 (21): 1-17.   DOI: 10.3778/j.issn.1002-8331.2312-0032
    摘要306)      PDF(pc) (1215KB)(348)    收藏
    互联网技术的应用普及使网络数据资源呈指数级增长,从海量数据中获取需求信息愈加困难。推荐算法因能有效解决信息过载问题而备受关注,相关研究成果层出不穷。以中国知网(CNKI)和科学网(WOS)核心合集为主要数据源,采集2012—2024年间出版的4?773篇和4?531篇中英文文献,利用可视化分析工具CiteSpace和VOSviewer绘制文献基本信息与关键词共现图谱;借助图谱分析,提炼核心技术关键词:知识图谱、图神经网络和深度学习,并选取与之关联的代表性推荐算法;通过图表直观展示算法核心机制和基本原理,聚焦现有研究的不足与挑战以及针对性解决方案;基于挑战-方案-来源文献的格式,绘制各核心技术关键词所关联算法的知识架构图,实现推荐原理的可视化。
    参考文献 | 相关文章 | 多维度评价
    8. 改进YOLOv11n的无人机小目标检测算法
    李彬, 李生林
    计算机工程与应用    2025, 61 (7): 96-104.   DOI: 10.3778/j.issn.1002-8331.2411-0072
    摘要297)      PDF(pc) (1241KB)(291)    收藏
    为了有效应对无人机航拍中小目标检测面临的复杂背景、目标密集、目标微小化和移动端部署等挑战,对YOLOv11n模型进行了改进。使用RFCBAMConv模块改进C3k2,增强了特征提取能力。设计了膨胀特征金字塔卷积(dilated feature pyramid convolution,DFPC)模块,替代了原有的SPPF层。通过多尺度膨胀卷积,加强了对无人机小目标细节特征的提取。提出了一种新的特征金字塔结构,在P2层增加160×160尺寸的特征图输出,以提取小目标特征信息。该方法替代了传统通过添加P2小目标检测头的做法。引入了CSPOK模块和ContextGuidedBlock_Down(CGBD)卷积,显著提升了全局特征的提取能力和多尺度特征的融合能力。采用动态检测头(DyHead)替代了原有的检测头,提升了模型的目标检测精度。实验结果表明,改进模型在VisDrone数据集上的mAP@0.5和mAP@0.5:0.95指标分别提高了0.071和0.049。此外,在AI-TOD和SODA-A等数据集上的泛化实验也显示,改进模型在mAP@0.5上分别获得0.055和0.048的提升,充分验证了模型的有效性和泛用性。
    参考文献 | 相关文章 | 多维度评价
    9. 基于卷积神经网络的图像分类深度学习模型综述
    刘鸿达, 孙旭辉, 李沂滨, 韩琳, 张宇
    计算机工程与应用    2025, 61 (11): 1-21.   DOI: 10.3778/j.issn.1002-8331.2411-0196
    摘要297)      PDF(pc) (1675KB)(330)    收藏
    使用神经网络模型进行图像分类任务一直是非常重要的研究方向,随着深度学习技术的发展,对神经网络模型的要求也越来越高。在识别率高的同时,对模型的参数量、训练时间也都有较高的要求。卷积神经网络一直是深度学习中针对图像处理的主流方法,主要介绍基于卷积神经网络的分类模型的发展历程,分析其不同阶段各个模型的搭建思路;介绍Transformer与卷积神经网络结合的相关模型以及各模型在其他领域的应用情况。最后,对卷积神经网络的发展进行了探讨。
    参考文献 | 相关文章 | 多维度评价
    10. 面向通用目标检测的YOLO方法研究综述
    米增, 连哲
    计算机工程与应用    2024, 60 (21): 38-54.   DOI: 10.3778/j.issn.1002-8331.2404-0130
    摘要295)      PDF(pc) (5798KB)(280)    收藏
    作为深度学习时代首个单阶段目标检测算法,YOLO以其强大且独特的范式在计算机视觉领域掀起了一股热潮,并成为目标检测算法的里程碑式成果,至今为止仍是在速度与精度之间实现最佳平衡的典型算法,广泛应用于自动驾驶、智能视觉系统等工业领域。过去的八年里,在深度学习技术的驱动下, YOLO方法有了快速发展并对整个目标检测领域产生深远影响。从技术进化角度深入调查YOLO方法相关工作,对最初的YOLO v1到最新的YOLO v9与YOLO v10每一次迭代创新和贡献进行全面总结,根据不同时间节点的和技术的重大改进将YOLO方法分为早期基础YOLO、标准版本YOLO、标准改进YOLO和独特改进YOLO四部分,详细介绍每个时期改进方法的独特视角。此外,总结评估YOLO方法的数据集与指标,收集了不同版本YOLO、同一版本YOLO不同型号的详细实验结果,从宏观层面与微观层面归纳YOLO的发展变化,通过分析揭示各版本YOLO之间的开发框架、骨干网络架构、先验框使用情况等技术的差异和内在联系,强调了YOLO在速度与准确率之间平衡的重要性。最后通过系统的梳理,凝练YOLO方法未来的发展趋势。
    参考文献 | 相关文章 | 多维度评价
    11. 视觉大模型SAM在医学图像分割中的应用综述
    孙兴, 蔡肖红, 李明, 张帅, 马金刚
    计算机工程与应用    2024, 60 (17): 1-16.   DOI: 10.3778/j.issn.1002-8331.2401-0136
    摘要290)      PDF(pc) (7912KB)(262)    收藏
    随着大模型技术的不断发展,以分割一切模型(segment anything model,SAM)为代表的视觉大模型在图像分割领域取得重要突破。SAM通过提示驱动完成一系列下游分割任务,旨在统一解决所有的图像分割问题。因此,将SAM应用于医学图像分割具有重要意义,其泛化性能够适应多种医学图像,为医生提供更全面的解剖结构和病变信息。介绍了图像分割常用的数据集;对SAM的网络结构和泛化性进行细致阐述;重点对SAM应用在全切片成像、磁共振成像、计算机断层扫描、超声和多模态图像的五大类医学图像进行梳理分析,总结优缺点和相应的改进方法;结合当前医学图像分割领域中存在的实际问题,讨论并展望了SAM未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    12. 图着色问题的算法研究综述
    宋家欢, 王晓峰, 胡思敏, 贾璟伟, 颜冬
    计算机工程与应用    2024, 60 (18): 66-77.   DOI: 10.3778/j.issn.1002-8331.2403-0434
    摘要276)      PDF(pc) (4612KB)(205)    收藏
    图着色问题(graph coloring problem,GCP)是一个经典的组合优化问题,已广泛应用于数学、计算机科学和生物科学等多个领域。由于图着色问题的NP难特性,目前还没有多项式时间内的精确算法求解该问题,为了给出求解该问题的高效算法,需要对现有算法进行梳理。主要分为智能优化算法、启发式算法、强化学习算法等,从算法原理、改进思路、性能和精度等方面进行对比分析,归纳出算法的优缺点,并指出GCP的研究方向和算法设计路径,对于相关问题的研究有指导意义。
    参考文献 | 相关文章 | 多维度评价
    13. 大模型在垂直领域应用的现状与挑战
    籍欣萌, 昝红英, 崔婷婷, 张坤丽
    计算机工程与应用    2025, 61 (12): 1-11.   DOI: 10.3778/j.issn.1002-8331.2409-0181
    摘要265)      PDF(pc) (839KB)(271)    收藏
    近年来,以ChatGPT为代表的大语言模型在多个领域受到广泛的关注,并取得优异的表现,推动了人工智能技术的新一轮发展浪潮。目前国产大模型数量已有上百个,覆盖多个行业领域,应用场景也不断扩展。为了更好地应对大模型在自然语言处理中的发展及其对通用任务和领域应用带来的冲击,对自然语言处理和大模型的发展历程进行回顾,阐述了当前大模型的相关技术以及大模型在医疗、法律、金融等垂直领域的应用,并对大模型在应用过程中面临的挑战如能力缺陷、协同问题等作出分析。最后,针对这些问题探讨了大模型在实际应用中的未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    14. 改进YOLOv8的道路缺陷检测算法
    王雪秋, 高焕兵, 郏泽萌
    计算机工程与应用    2024, 60 (17): 179-190.   DOI: 10.3778/j.issn.1002-8331.2404-0288
    摘要262)      PDF(pc) (5995KB)(232)    收藏
    道路在长期使用后路面会出现各种缺陷,未能及时侦测和修补这些缺陷可能严重缩短道路寿命并危害行车安全。因此,道路缺陷的即时检测是一项重要的任务。传统的检测方法存在检测速度慢,成本要求高的问题。为了解决这些问题,在YOLOv8的基础上提出了一种名为DML-YOLO新型道路检测算法,该算法在主干网络中加入MPCA(MultiPath coordinate attention)注意力机制,提高主干网络的特征提取能力,在此基础上提出了C2f-MPDC模块,动态调整感受野,提高检测能力;重新设计了网络的颈部结构,提出新的特征融合金字塔结构DFPN(diversity feature pyramid network),减小模型的体积并融合低层的特征图获得丰富的细节信息,提高检测小目标的成功率;设计一种轻量级共享卷积检测头(LSCD head),减少模型尺寸,提高检测效率。大量实验结果表明,DML-YOLO在RDD2022数据集和VOC2007数据集上平均检测精度mAP@0.5分别为89.6%和73.6%,优于其他测试模型,并且参数量和计算量相较于YOLOv8模型分别减少了32.37%和14.49%,更加适合部署在嵌入式系统、移动设备等计算资源受限和边缘计算的场景。
    参考文献 | 相关文章 | 多维度评价
    15. 大语言模型微调技术的研究综述
    张钦彤, 王昱超, 王鹤羲, 王俊鑫, 陈海
    计算机工程与应用    2024, 60 (17): 17-33.   DOI: 10.3778/j.issn.1002-8331.2312-0035
    摘要261)      PDF(pc) (6335KB)(282)    收藏
    大型语言模型的崛起是深度学习领域的全新里程碑,而微调技术在优化模型性能方面的起到了关键作用。对大型语言模型微调技术进行了全面的综述,回顾了语言模型的统计语言模型、神经网络语言模型、预训练语言模型和大语言模型四个阶段的发展历程和微调技术的基本概念,从经典参数微调、高效参数微调、提示微调和强化学习微调方法四大部分,探讨总结了各微调技术的原理与发展,并进行了一定的对比分析。最后,总结了当前微调技术的研究状况与发展重点,强调了该领域的潜在研究价值,并展望了未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    16. 基于图神经网络的文本分类方法研究综述
    苏易礌, 李卫军, 刘雪洋, 丁建平, 刘世侠, 李浩南, 李贯峰
    计算机工程与应用    2024, 60 (19): 1-17.   DOI: 10.3778/j.issn.1002-8331.2403-0142
    摘要247)      PDF(pc) (3425KB)(272)    收藏
    文本分类是自然语言处理领域中的一个重要任务,旨在将给定的文本数据分配到预定义的一组类别中。传统的文本分类方法只能处理欧氏空间的数据,不能处理图这种非欧氏数据。而对于图结构的文本数据无法直接处理,无法捕捉图中的非欧氏结构。因此,如何将图神经网络应用到文本分类任务中是目前的研究热点之一。对基于图神经网络的文本分类方法进行了综述,概述了基于机器学习和基于深度学习的传统文本分类方法,总结了图卷积神经网络的背景和原理;根据不同类型的图网络详细阐述了基于图神经网络的文本分类方法,同时对图神经网络模型在文本分类中的应用进行了深入分析;对目前基于图神经网络的文本分类模型进行了对比实验,讨论了模型的分类性能;提出了未来的研究方向,以推动该领域的进一步发展。
    参考文献 | 相关文章 | 多维度评价
    17. 多智能体深度强化学习及可扩展性研究进展
    刘延飞, 李超, 王忠, 王杰铃
    计算机工程与应用    2025, 61 (4): 1-24.   DOI: 10.3778/j.issn.1002-8331.2407-0034
    摘要241)      PDF(pc) (2161KB)(281)    收藏
    多智能体深度强化学习近年来在解决智能体协作、竞争和通信问题上展现出巨大潜力。然而伴随着其在更多领域的应用,可扩展性问题备受关注,是理论研究到大规模工程应用的重要问题。回顾了强化学习理论和深度强化学习的典型算法,介绍了多智能体深度强化学习三类学习范式及其代表算法,并简要整理出当前主流的开源实验平台。详细探讨了多智能体深度强化学习在数量和场景上的可扩展性研究进展,分析了各自面临的核心问题并给出了现有的解决思路。展望了多智能体深度强化学习的应用前景和发展趋势,为推动该领域的进一步研究提供参考和启示。
    参考文献 | 相关文章 | 多维度评价
    18. 多模态驾驶员情绪识别研究综述
    周欣颖, 李雷孝, 林浩, 张虎成
    计算机工程与应用    2025, 61 (10): 1-18.   DOI: 10.3778/j.issn.1002-8331.2410-0153
    摘要234)      PDF(pc) (1630KB)(321)    收藏
    准确识别驾驶员情绪可以有效预防潜在的危险驾驶行为,减少交通事故的发生,是提升道路安全和驾驶体验的重要技术。随着人工智能和多模态数据处理技术的进步,情绪识别技术从单模态方法逐步发展为多模态方法。梳理了当前多模态驾驶员情绪识别的研究进展,重点总结了面部表情、语音信号、生理信号以及车辆行为四种模态的识别流程,关键步骤包括数据预处理、特征提取和多模态融合。通过分析现有研究,总结了不同方法的优势与不足,介绍了多个驾驶员情绪相关数据集。最后结合当前研究所面临的挑战,提出了未来多模态驾驶员情绪识别研究领域的五个研究方向。
    参考文献 | 相关文章 | 多维度评价
    19. 基于大型语言模型的检索增强生成综述
    刘雪颖, 云静, 李博, 史晓国, 张钰莹
    计算机工程与应用    2025, 61 (13): 1-25.   DOI: 10.3778/j.issn.1002-8331.2410-0088
    摘要231)      PDF(pc) (1412KB)(246)    收藏
    最近,智能体代理能在复杂任务中提供高效的解决方案,在工业界备受关注。作为智能体代理的常见范式之一,检索增强生成(retrieval-augmented generation,RAG)旨在结合信息检索和内容生成技术增强生成响应质量,已逐步成为研究的重点。在对国内外检索增强生成方法研究的基础上,阐述了RAG的基本概念及工作流程,归纳了技术现状,分析了现有RAG技术的优缺点,梳理了现有评估指标、数据集和基准。最后探讨了RAG技术在未来应用场景下所面临的挑战,并展望了其未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    20. 改进RT-DETR的无人机图像目标检测算法
    姜贸翔, 司占军, 王晓喆
    计算机工程与应用    2025, 61 (1): 98-108.   DOI: 10.3778/j.issn.1002-8331.2405-0331
    摘要216)      PDF(pc) (5878KB)(220)    收藏
    针对轻小型无人机图像目标检测中由于目标灵活多样、环境复杂多变导致的检测精度低等问题,提出基于改进RT-DETR无人机目标检测算法。综合考虑轻量级SimAM注意力和倒置残差模块改进ResNet-r18主干网络,提高目标检测模型的特征提取能力。采用级联分组注意力机制优化倒置残差模块和特征交互模块,提升特征选择能力,实现目标检测信息的精细化获取。颈部网络中引入160×160检测层,提升特征融合阶段小目标的感知能力。基于VisDrone2019数据集的实验结果表明,改进后的模型具有更低的参数量和更高的检测精度。在Alver_Lab_Ulastirma和HIT-UAV数据集上进一步验证了改进方法的有效性和鲁棒性。
    参考文献 | 相关文章 | 多维度评价
    21. 无人机集群弹性评估及重构技术研究
    韦宸越, 何明, 韩伟, 徐昕, 高宏
    计算机工程与应用    2024, 60 (15): 1-10.   DOI: 10.3778/j.issn.1002-8331.2401-0452
    摘要216)      PDF(pc) (4418KB)(249)    收藏
    无人机集群在实际应用中常受地形地貌、风雪雨雾、防空打击等扰动因素影响,导致集群性能下降、任务完成能力降低。为有效评估和提升集群抗扰能力,从无人机集群弹性评估指标和弹性重构方法两方面展开深入研究。梳理分析无人机集群弹性评估指标研究现状;从预测性重构和抗扰动重构两方面对无人机集群弹性重构方法进行了研究总结;针对评估指标不全面及多任务、多扰动情况下集群无法自适应重构问题,分别提出多维弹性评估指标和无人机集群相变重构方法,进一步考虑了覆盖率、能耗等因素对集群性能的影响,实现了不同任务类型和扰动种类自适应相变,大幅提升了集群应对扰动能力。最后,总结展望无人机集群弹性重构未来发展趋势。
    参考文献 | 相关文章 | 多维度评价
    22. 改进YOLOv8n的道路目标检测算法
    高德勇, 陈泰达, 缪兰
    计算机工程与应用    2024, 60 (16): 186-197.   DOI: 10.3778/j.issn.1002-8331.2403-0383
    摘要213)      PDF(pc) (9556KB)(174)    收藏
    针对道路场景中目标尺度多变、复杂背景干扰导致检测精度低、漏检率高的问题,提出一种改进YOLOv8n的道路目标检测算法。引入多样化分支块(diverse branch block,DBB)构建C2fDBB模块,替代原算法中的C2f模块,增强网络多尺度特征提取能力。在路径聚合网络(path aggregation network,PANet)的基础上结合渐进特征金字塔网络(asymptotic feature pyramid network,AFPN)思想,提出PA-AFPN(path aggregation progressive feature pyramid network)特征融合方式,提升网络对多尺度特征的融合能力。设计SPPF2_TA(SPPF with dual-branch structure incorporating triplet attention)模块,通过在SPPF(spatial pyramid pooling fast)中引入平均池化分支和三重注意力机制(triplet attention,TA),有效整合多尺度信息,降低背景干扰对检测的影响。采用MPDIoU作为新边界回归损失函数,替代原损失函数,加速算法收敛,提高目标定位精度。在公开道路目标数据集BDD100K和SODA10M上的实验结果显示,改进方法的mAP@0.5相较于基线算法分别提升了5.7个百分点和7.3个百分点,计算量降低了0.6 GFLOPs。与其他主流目标检测方法相比,改进方法在计算量、FPS和mAP@0.5等方面均展现出显著优势,更加契合道路场景下的目标检测任务需求。
    参考文献 | 相关文章 | 多维度评价
    23. 基于深度学习的肺部CT图像病灶区域分割研究综述
    李小童, 马素芬, 生慧, 魏国辉, 李欣桐
    计算机工程与应用    2025, 61 (4): 25-42.   DOI: 10.3778/j.issn.1002-8331.2403-0315
    摘要213)      PDF(pc) (4394KB)(223)    收藏
    肺癌严重威胁人们的生命健康。肺部CT图像病灶区域形态复杂多样,实现高精度的肺部CT图像病变区域分割,成为计算机辅助诊断领域的一个极具挑战性的关键问题。基于深度学习的肺部病灶区域分割不仅可以帮助医生快速、准确地诊断出早期肺癌,而且对于肺癌的治疗也具有重要的临床价值。为了深入研究肺部病灶区域分割技术,介绍了常用的数据集及评价指标;重点从基于卷积神经网络、基于U-Net模型、基于生成对抗网络三个方面对深度学习肺部病灶区域分割模型进行了综述;结合具体实验总结了近5年国内外研究的创新点,对比分析了各个模型的分割性能;最后总结了各类模型的优缺点,展望了该领域的未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    24. 因果学习方法和应用概述
    龙享福, 李少波, 张仪宗, 杨磊, 李传江
    计算机工程与应用    2024, 60 (24): 1-19.   DOI: 10.3778/j.issn.1002-8331.2405-0407
    摘要212)      PDF(pc) (6887KB)(242)    收藏
    机器学习是人工智能和数据科学的核心所在,被广泛应用于教育、交通运输和制造业等领域;随着机器学习的发展及应用领域的延伸,模型在可解释性和公平性等方面显现了一些需要解决的问题。因果学习作为一种将因果关系和机器学习技术相结合的方法,可以增强模型的可解释性,解决公平性等问题,其研究已逐渐成为学术界的热点。因此,在介绍因果学习的相关理论知识的基础上,根据因果学习所能解决的问题对因果解释、因果监督学习、因果公平、因果强化学习等技术进行了全方位的分析概述;从多角度归纳了因果学习在医学、农业和智能制造等领域的应用。最后,总结了因果学习存在的一些开放性问题和挑战,并给出了未来的研究方向,旨在推动因果学习的不断发展。
    参考文献 | 相关文章 | 多维度评价
    25. BEV感知学习在自动驾驶中的应用综述
    黄德启, 黄海峰, 黄德意, 刘振航
    计算机工程与应用    2025, 61 (6): 1-21.   DOI: 10.3778/j.issn.1002-8331.2407-0501
    摘要212)      PDF(pc) (2079KB)(227)    收藏
    自动驾驶感知模块中作为采集输入的传感器种类不断发展,要使多模态数据统一地表征出来变得愈加困难。BEV感知学习在自动驾驶感知任务模块中可以使多模态数据统一融合到一个特征空间,相比于其他感知学习模型拥有更好的发展潜力。从研究意义、空间部署、准备工作、算法发展及评价指标五个方面总结了BEV感知模型具有良好发展潜力的原因。BEV感知模型从框架角度概括为四个系列:Lift-Splat-Lss系列、IPM逆透视转换、MLP视图转换及Transformer视图转换;从输入数据概括为两类:第一类是纯图像特征的输入包括单目摄像头输入和多摄像头输入,第二类在融合数据输入中不仅是简单的点云数据和图像特征的数据融合,还包括了以点云数据为引导或监督的知识蒸馏融合和以引导切片方式去划分高度段的融合。概述了多目标追踪、地图分割、车道线检测及3D目标检测四种自动驾驶任务在BEV感知模型当中的应用,并总结了目前BEV感知学习四个系列框架的缺点。
    参考文献 | 相关文章 | 多维度评价
    26. 太赫兹图像超分辨率重建方法的研究进展
    蒋玉英, 江梦蝶, 葛宏义, 张元, 李广明, 陈心雨, 温茜茜, 陈浩
    计算机工程与应用    2024, 60 (18): 1-16.   DOI: 10.3778/j.issn.1002-8331.2401-0161
    摘要211)      PDF(pc) (6043KB)(238)    收藏
    图像超分辨率是近几十年来图像处理领域的一个重要研究课题,旨在从低分辨率图像中重建出高分辨率图像,其突破了传感器和光学器件制造工艺和成本的限制,从算法方面提高图像分辨率,是一种简单、高效、低成本的方法。太赫兹(Terahertz,THz)图像受到THz波衍射和散射的影响,会产生图像模糊、纹理细节不清晰等问题,越来越多的学者致力于开发THz图像的超分辨率重建方法。根据近年来THz技术与超分辨率重建技术相关文献的研究,对THz图像的三大重建方法进行了详细阐述,重点对基于深度学习的方法进行介绍,并对比了各类算法的重建效果与优缺点;回顾了THz图像质量评价指标和常用数据集,并总结THz图像超分辨率重建技术的相关应用。最后,探讨了THz图像超分辨率重建技术的未来发展趋势。
    参考文献 | 相关文章 | 多维度评价
    27. LOL-YOLO:融合多注意力机制的低照度目标检测
    蒋畅江, 何旭颖, 向杰
    计算机工程与应用    2024, 60 (24): 177-187.   DOI: 10.3778/j.issn.1002-8331.2406-0424
    摘要208)      PDF(pc) (7039KB)(214)    收藏
    针对低照度图像中目标检测面临的夜间模糊场景、边界不明显场景、明暗差异较大场景等挑战,提出了一种动态特征融合的的检测方法LOL-YOLO(low-light YOLO)。引入了自校正照明模块改善低光照图片的质量,应对低照度下的目标不明显问题;提出了动态特征提取模块,采用结合了大卷积核和可变形卷积的注意力机制,广泛灵活的捕捉图像的上下文信息;设计动态检测头增强对不同尺度、空间位置和任务的感知能力,进一步提升目标检测的精度和鲁棒性。采用ExDark、DarkFace、NPD(nighttime pedestrian detection)数据集进行实验验证,实验结果表明,提出的方法与主流算法相比检测精度明显提升,充分验证了该方法的有效性。
    参考文献 | 相关文章 | 多维度评价
    28. 改进YOLOv8算法的城市车辆目标检测
    许德刚, 王双臣, 王再庆, 尹柯栋
    计算机工程与应用    2024, 60 (18): 136-146.   DOI: 10.3778/j.issn.1002-8331.2401-0277
    摘要205)      PDF(pc) (6421KB)(184)    收藏
    针对复杂交通场景下城市车辆目标检测算法存在的漏检、精度低、泛化能力弱的问题,提出一种改进的YOLOv8城市车辆目标检测算法。采用一种改进的GAM-C2f结构来代替主干网络中的C2f模块,平衡模型的计算效率和准确性;设计一种SPPFAPGC模块,防止SPPF结构因最大池化操作所导致的局部特征丢失问题,提高特征图的丰富度,并进一步结合小目标检测头来加强对远处小目标车辆的检测能力,加强局部特征与全局特征的融合。为抑制低质量图像产生的有害梯度,使用WIOU损失函数代替CIoU,以提升网络的边界框回归性能,提高模型的收敛速度和回归精度。在Streets车辆数据集上的实验结果表明,与基准模型YOLOv8n相比,改进算法的mAP50和Recall分别提高了1.6和2.0个百分点,有效改善了城市交通场景下小目标车辆检测性能不佳的问题;在VisDrone2019数据集上进行验证,mAP50和Recall也分别提高了1.1和1.6个百分点,充分证明了改进算法的优越性。与其他先进主流算法相比,改进算法表现出了更高的准确率和查全率,表明改进算法在城市车辆检测任务中具有更好的性能。
    参考文献 | 相关文章 | 多维度评价
    29. 面向无人机航拍小目标检测的轻量级YOLOv8检测算法
    李岩超, 史卫亚, 冯灿
    计算机工程与应用    2024, 60 (17): 167-178.   DOI: 10.3778/j.issn.1002-8331.2402-0230
    摘要204)      PDF(pc) (7882KB)(173)    收藏
    针对在无人机图像目标检测中复杂场景下目标特征难提取且小目标容易被淹没在噪声中的问题,提出一种基于YOLOv8s的无人机目标检测算法SC-YOLO。为了能够学习到感兴趣区域的位置细节,基于CA(coordinate attention)提出了SPM(self-position module)注意力。为了缓解Carafe上采样算子因为通道压缩所带来的影响,提出了CEM(Carafe enhancer module)。通过分析梯度增益函数与数据集中目标大小的关系,使WIoU_v3能够更加关注中、小目标的普通质量锚框,并且在VisDrone2019数据集上进行验证,得到WIoU_v3能够更加关注中、小目标的普通质量锚框的参数设置范围。改进后的YOLOv8s算法在VisDrone2019验证集上的平均均值精度(mAP)提高到43.1%,在测试集上的mAP提高到34.8%,在近几年同等规模的算法中拥有较好的检测性能;改进算法相较基准算法参数量仅增加1.1×106,浮点运算次数(FLOPs)增加1.5 GFLOPs,但在验证集以及测试集上检测精度分别提升了2.0和2.1个百分点;在Tinyperson数据集上的检测精度提高了1.4个百分点。
    参考文献 | 相关文章 | 多维度评价
    30. 深度学习驱动下的目标检测研究进展综述
    山显英, 张琳, 李泽慧
    计算机工程与应用    2025, 61 (1): 24-41.   DOI: 10.3778/j.issn.1002-8331.2407-0038
    摘要200)      PDF(pc) (7781KB)(184)    收藏
    近年来,深度学习在GPU高性能计算能力的加持下得到了迅速推广,并在安防、医疗、工业等领域实现了广泛应用。目标检测模型的性能也在稳步提高,从传统的目标检测方法逐渐过渡到基于卷积神经网络(CNN)深度学习的进一步应用,极大地节省了人力物力。通过参考大量文献,按照两阶段脉络梳理了目标检测的发展历程以及近年深度学习在目标检测领域内的研究进展,对比了在不同数据集上模型网络的性能,总结不同方法的优势与不足,并对领域内重要数据集作了归纳,还对目标检测算法的落地效果做了总结,特别是生活与科技中的实际应用(无人驾驶、医学图像、遥感等)。最后,还对深度学习驱动下目标检测在未来研究上的机遇和挑战作了展望。
    参考文献 | 相关文章 | 多维度评价
    31. 语义信息处理方式分类的车道线检测技术研究综述
    洪书颖, 张东霖
    计算机工程与应用    2025, 61 (5): 1-17.   DOI: 10.3778/j.issn.1002-8331.2406-0160
    摘要194)      PDF(pc) (2981KB)(215)    收藏
    随着自动驾驶技术的迅猛发展,车道线检测作为其关键组成部分,引起了广泛关注,并在智能交通系统中展现出巨大的应用潜力。然而,在应对复杂环境挑战时,传统车道线检测技术往往难以提供足够的识别精度。回顾车道线检测技术的发展轨迹,系统性地梳理了84种先进算法,并创新性地根据语义处理方式划分为四类别:语义分割辅助类、语义信息融合类、语义信息增强类和语义关系建模类。通过深入剖析算法的技术特点和优势,揭示了当前车道线检测技术所面临的主要局限。最后,对未来车道线检测技术的发展方向提出见解,特别是在语义信息利用方面,指出了潜在的研究方向。
    参考文献 | 相关文章 | 多维度评价
    32. 视觉惯性联合标定发展综述
    赵军阳, 吕慎华, 李永旭, 祝慧鑫, 张克凡
    计算机工程与应用    2025, 61 (8): 1-16.   DOI: 10.3778/j.issn.1002-8331.2409-0330
    摘要191)      PDF(pc) (1197KB)(229)    收藏
    相机和IMU联合可充分利用两个传感器的互补优势,实现数据融合与相互校正。近年来,更多智能化的联合标定方法不断出现,但缺少统一的归纳分析。为此,将视觉惯性联合标定方法统一分类整理,旨在分析各类方法的应用特点与局限性,为相机与IMU联合标定方法应用层面或是研究层面提供更好的选择基础。介绍了相机与IMU标定参数以及标定原理,并从时间、空间两个角度展开论述。分别对在线、离线的时间标定方法,进行分类归纳并作对比分析;从空间的角度,基于IMU和相机的标定方法原理不同将标定方法分为四类:基于优化的标定、基于解耦模型的标定、基于滤波的标定、基于机器学习的标定,深入分析每种方法的优势与局限性等。最后,总结全文并提出未来联合标定的发展趋势:时空统一标定、更多标定工具包、机器学习的扩展、多传感器联合标定等。
    参考文献 | 相关文章 | 多维度评价
    33. 深度学习下的医学图像分割综述
    邢素霞, 李珂娴, 方俊泽, 郭正, 赵士杭
    计算机工程与应用    2025, 61 (7): 25-41.   DOI: 10.3778/j.issn.1002-8331.2409-0142
    摘要186)      PDF(pc) (1527KB)(156)    收藏
    针对医学图像的高维性、复杂性和高精度要求等特性,深度学习下的医学图像分割方法凭借其强大的特征提取能力和对复杂模式的学习能力,能够自适应地从大量数据中学习并提取多层次特征,展现出高精度、高鲁棒性和可扩展性强等优势。通过端到端地提取感兴趣的器官、组织或病变区域,为医生在疾病诊断、制定治疗策略和临床研究等领域提供有力帮助。重点综述了U-Net、Transformer、Mamba、分割一切模型(segment anything model,SAM)及其各自变体模型在医学图像分割中的应用情况和发展脉络,从多个维度进行了综合对比分析,对开展医学影像研究、临床疾病诊断与治疗决策,以及医疗技术创新产品开发均具有一定参考价值。在此基础上,总结了目前医学图像分割研究中面临的挑战,并对该领域未来的研究前景进行展望。
    参考文献 | 相关文章 | 多维度评价
    34. 改进RT-DETR的航拍小目标检测算法
    刘思元, 高凯, 雍龙泉
    计算机工程与应用    2025, 61 (4): 272-281.   DOI: 10.3778/j.issn.1002-8331.2407-0399
    摘要184)      PDF(pc) (1975KB)(238)    收藏
    针对现有的目标检测算法在航拍图像中的小目标上易出现的漏检和误检问题,提出了基于改进RT-DETR(real-time detection transformer)的算法。在主干网络中引入了部分卷积(partial convolution,PConv),设计了PConvBlock结构,并通过由PConvBlock组成的BasicBlock-PConvBlock模块替代原有BasicBlock,有效减少了模型参数。采用双向特征金字塔网络(bidirectional feature pyramid network,BiFPN)结构优化特征融合模块,并引入S2特征进一步提升小目标的检测能力。引入CARAFE上采样算子,增强了多尺度特征的快速融合。实验表明,在VisDrone测试集上,改进后的模型在参数量上比RT-DETR模型降低了13.9%,同时在mAP0.5和mAP0.5:0.95指标上分别提升了2.4和1.9个百分点。在TT100K和DOTA数据集上均优于RT-DETR算法。改进模型在保持较小参数量和计算量的同时,提高了检测精度,满足了无人机航拍图像实时检测的应用需求。
    参考文献 | 相关文章 | 多维度评价
    35. 提示学习研究综述
    崔金满, 李冬梅, 田萱, 孟湘皓, 杨宇, 崔晓晖
    计算机工程与应用    2024, 60 (23): 1-27.   DOI: 10.3778/j.issn.1002-8331.2407-0436
    摘要180)      PDF(pc) (9840KB)(189)    收藏
    经过微调的预训练语言模型在各领域任务中均取得了显著的性能。但是,预训练和微调之间在训练数据和目标函数方面存在着巨大差距,阻碍了预训练语言模型对下游任务的有效适应。提示学习的提出缩小了预训练和微调之间的差距,并可以很好地应用到小样本甚至零样本场景中。提示学习的核心思想是将提示模板插入到原始输入中,将下游任务数据转化为自然语言的形式输入到预训练模型中,输出预测结果,然后通过语言表达器将输出映射到相应的标签。系统地梳理了当前提示学习的相关工作,根据提示学习的实现步骤,从提示模板和语言表达器构建两个阶段介绍该类方法的研究进展。将基于提示模板的方法细分为人工构建、自动构建、引入外部知识构建提示和思维提示方法4种;将基于语言表达器的方法细分为人工构建的表达器、基于搜索的表达器、软表达器和引入外部知识构建表达器的方法4种。总结了提示学习在自然语言处理、计算机视觉和多模态领域的主要应用,并对提示学习相关实验进行了分析。最后,概述了提示学习的现状和挑战,展望了提示学习的未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    36. 知识图谱嵌入方法的链接预测研究综述
    刘海超, 柳林, 王海龙, 赵巍伟, 刘静
    计算机工程与应用    2025, 61 (8): 17-34.   DOI: 10.3778/j.issn.1002-8331.2407-0158
    摘要177)      PDF(pc) (1109KB)(218)    收藏
    知识图谱中普遍存在实体和关系缺失等不足,知识图谱补全能够有效解决上述不足被研究者广泛关注。知识图谱嵌入方法的链接预测作为知识补全的重要研究方向,能够预测出知识图谱中缺失的实体或关系,来补全知识图谱并增强其完整性。阐述了知识图谱链接预测的研究背景、意义和定义;以嵌入单位的实体个数为分类标准,将知识图谱嵌入的链接预测模型划分为双实体嵌入链接预测模型和多实体嵌入链接预测模型,详细阐述模型构建思路,分析实验结果并总结各类模型优缺点。最后,展望知识图谱嵌入链接预测现状以及未来研究方向,为后续的发展提供启示和指导。
    参考文献 | 相关文章 | 多维度评价
    37. 深度学习在知识图谱构建及推理中的应用
    孙宇, 刘川, 周扬
    计算机工程与应用    2025, 61 (6): 36-52.   DOI: 10.3778/j.issn.1002-8331.2408-0280
    摘要176)      PDF(pc) (892KB)(180)    收藏
    知识图谱作为自然语言处理领域的一种结构化知识表示形式,能够描述现实世界中的概念及相互关系,常被应用于信息检索、数据管理等领域。深度学习因其具有自动学习多元数据内在规律和表示层次的特性,可用于大规模、高质量知识图谱的精准构建及有效推理,已逐渐成为新兴研究热点。为进一步促进深度学习和知识图谱的技术融合,以知识图谱构建及推理过程为主线,全面介绍深度学习在知识表示、知识抽取、知识融合、知识推理领域的相关理论及最新研究成果;同时,根据近年来的研究趋势,重点归纳与总结了适用于图数据特征推理的图深度学习与知识推理相融合的最新研究成果。最后,对深度学习和知识图谱的融合发展做了概要总结和技术展望,为未来研究发展提供参考和思路。
    参考文献 | 相关文章 | 多维度评价
    38. 改进YOLOv8的轻量级军事飞机检测算法
    刘丽, 张硕, 白宇昂, 李宇健, 张初夏
    计算机工程与应用    2024, 60 (18): 114-125.   DOI: 10.3778/j.issn.1002-8331.2404-0058
    摘要175)      PDF(pc) (5596KB)(138)    收藏
    遥感图像军事飞机检测在侦察预警、情报分析等领域具有重要意义。为使军事飞机检测模型能在算力受限的设备上高效运行,从网络设计与模型压缩两个方面对YOLOv8n进行轻量化改进。在网络设计方面,使用FAS_C2f替换原始主干网络中的C2f模块,减少计算冗余并加快网络特征提取的速度;根据军事飞机目标的尺度特征对网络结构进行优化,缓解因过度下采样导致的小目标信息丢失问题;使用Inner-SIoU作为新的定位回归损失函数,提升对小目标样本的学习能力并加快回归边界框的收敛。在模型压缩方面,使用基于LAMP分数的通道剪枝对重设计后的模型进行压缩,进一步减少参数和模型大小;并利用通道级知识蒸馏(channel-wise knowledge distillation,CWD)将模型精度恢复到接近剪枝前的水平。实验结果表明,在公开军用飞机数据集MAR20上,轻量化后的模型mAP为97.2%,体积仅有0.7 MB,较原始模型缩小了88.3%,FPS提高了14帧/s,满足军事飞机目标检测的实时性要求。
    参考文献 | 相关文章 | 多维度评价
    39. 面向工业场景带钢表面缺陷检测的LF-YOLO
    马肖瑶, 黎睿, 李自力, 翟文正
    计算机工程与应用    2024, 60 (18): 78-87.   DOI: 10.3778/j.issn.1002-8331.2404-0411
    摘要172)      PDF(pc) (4872KB)(178)    收藏
    针对工业场景下带钢表面缺陷尺寸大小不一、采集图像模糊导致传统缺陷检测算法在实际应用中精度低的问题,提出一种面向工业场景带钢表面缺陷检测的LF-YOLO算法。模型通过设计一种局部填充上采样模块对输入像素进行上采样,提高模型对模糊图片的识别能力,降低模型对小目标缺陷的漏检率。通过引入专注视觉任务的FReLU激活函数,提高模型定位缺陷的准确率。提出一种轻量级的漏斗注意力机制并与特征提取模块C2f进行结合,增强模型对不同尺寸缺陷的特征提取能力。在开源数据集NEU-DET与GC10-DET上的实验结果表明,改进后的模型平均检测精度比原始YOLOv8算法精度分别高7.0和15.4个百分点,且相较于其他目标缺陷检测模型在平均检测精度方面具有优势,并进一步通过消融实验验证了每个模块的有效性。
    参考文献 | 相关文章 | 多维度评价
    40. 优化改进YOLOv8无人机视角下目标检测算法
    孙佳宇, 徐民俊, 张俊鹏, 炎梦雪, 操文, 侯阿临
    计算机工程与应用    2025, 61 (1): 109-120.   DOI: 10.3778/j.issn.1002-8331.2405-0030
    摘要169)      PDF(pc) (6040KB)(151)    收藏
    针对无人机视角下的目标存在多尺度、目标小、被遮挡与背景复杂等问题,提出了一种基于动态样本注意力尺度序列的YOLOv8改进算法BDAD-YOLO。通过引入BiFormer的思想来改造原模型骨干结构,提高模型对关键信息的关注度,更好地保留目标细粒度细节信息。由于目标存在大小、位置等多变性,传统卷积并不能很好地处理这一情况,因此基于DCN(deformable convolutional network)的思想,设计了一种可以增强对小目标特征提取的C2_DCf模块,从而进一步提高颈部网络中小目标层对特征信息的融合。提出一种基于动态样本的注意力尺度序列融合框架AFD(attention-scale sequence fusion framework based on dynamic samples),使用轻量化动态点采样并通过融合不同尺度的特征图来增强网络提取多尺度信息的能力。使用WIoU损失函数,改善小目标低质量数据对梯度的不利影响,以加快网络收敛速度。实验结果表明,在VisDrone数据集中的val集与test集上平均精度(mAP@0.5)分别提升了4.6个百分点、3.7个百分点,在DOTA数据集上平均精度(mAP@0.5)提升了2.4个百分点,证明了改进算法的有效性和普适性。
    参考文献 | 相关文章 | 多维度评价