摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 一年内发表文章
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于大语言模型的智能问答系统研究综述
    任海玉, 刘建平, 王健, 顾勋勋, 陈曦, 张越, 赵昌顼
    计算机工程与应用    2025, 61 (7): 1-24.   DOI: 10.3778/j.issn.1002-8331.2409-0300
    摘要689)      PDF(pc) (1720KB)(712)    收藏
    智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥有数十亿甚至上千亿个参数,不仅能够理解和生成自然语言,还能显著提升问答系统的准确性和效率,推动智能问答技术的发展。近年来,基于大模型技术的智能问答逐渐成为研究热点,但对该领域的系统性综述仍然较为欠缺。因此,针对大模型的智能问答系统进行系统综述,介绍了问答系统的基本概念和数据集及其评价指标;介绍了基于大模型的问答系统,其中包括基于提示学习的问答系统、基于知识图谱的问答系统、基于检索增强生成的问答系统和基于智能代理的问答系统以及微调在问答任务中的技术路线,并对比了五种方法在问答系统中的优缺点和应用场景;对于当前基于大语言模型的问答系统面临的研究挑战和未来发展趋势进行了总结。
    参考文献 | 相关文章 | 多维度评价
    2. 改进YOLOv11n的无人机小目标检测算法
    李彬, 李生林
    计算机工程与应用    2025, 61 (7): 96-104.   DOI: 10.3778/j.issn.1002-8331.2411-0072
    摘要686)      PDF(pc) (1241KB)(626)    收藏
    为了有效应对无人机航拍中小目标检测面临的复杂背景、目标密集、目标微小化和移动端部署等挑战,对YOLOv11n模型进行了改进。使用RFCBAMConv模块改进C3k2,增强了特征提取能力。设计了膨胀特征金字塔卷积(dilated feature pyramid convolution,DFPC)模块,替代了原有的SPPF层。通过多尺度膨胀卷积,加强了对无人机小目标细节特征的提取。提出了一种新的特征金字塔结构,在P2层增加160×160尺寸的特征图输出,以提取小目标特征信息。该方法替代了传统通过添加P2小目标检测头的做法。引入了CSPOK模块和ContextGuidedBlock_Down(CGBD)卷积,显著提升了全局特征的提取能力和多尺度特征的融合能力。采用动态检测头(DyHead)替代了原有的检测头,提升了模型的目标检测精度。实验结果表明,改进模型在VisDrone数据集上的mAP@0.5和mAP@0.5:0.95指标分别提高了0.071和0.049。此外,在AI-TOD和SODA-A等数据集上的泛化实验也显示,改进模型在mAP@0.5上分别获得0.055和0.048的提升,充分验证了模型的有效性和泛用性。
    参考文献 | 相关文章 | 多维度评价
    3. DMF-YOLOv11:基于改进YOLOv11n的无人机航拍图像目标检测算法
    贺智轩, 陈里里, 王翔, 李荣华
    计算机工程与应用    2025, 61 (14): 88-100.   DOI: 10.3778/j.issn.1002-8331.2502-0223
    摘要556)      PDF(pc) (1893KB)(336)    收藏
    针对无人机航拍视角下目标检测中存在的小尺寸目标密集、多尺度变化显著及复杂场景干扰导致的检测精度不足问题,提出一种基于YOLOv11n改进的无人机航拍图像目标检测算法DMF-YOLOv11。设计双重双向辅助特征金字塔网络(dual bidirectional auxiliary feature pyramid network,DBAFPN)作为Neck结构,通过多层级特征双向融合机制增强极小目标与常规小目标的特征表征能力;构建多分支混合卷积模块(multi-branch hybrid convolution,MBHConv),采用并行异构卷积路径提升模型对小尺度目标的感知灵敏度;将自调特征聚合网络(self-modulating feature aggregation network, SMFANet)与主干网络C3K2模块深度融合,提出C3K2_FMB模块以协同提取局部细节与非全局上下文特征。在VisDrone2019数据集上的实验表明,DMF-YOLOv11的mAP50与mAP50-95分别达到46.2%和28.4%,较基准模型YOLOv11n分别提升11.5和8.3个百分点,召回率提升9.4个百分点至44.6%。改进算法有效提升了无人机航拍场景下的目标检测精度。
    参考文献 | 相关文章 | 多维度评价
    4. 基于大型语言模型的检索增强生成综述
    刘雪颖, 云静, 李博, 史晓国, 张钰莹
    计算机工程与应用    2025, 61 (13): 1-25.   DOI: 10.3778/j.issn.1002-8331.2410-0088
    摘要483)      PDF(pc) (1412KB)(464)    收藏
    最近,智能体代理能在复杂任务中提供高效的解决方案,在工业界备受关注。作为智能体代理的常见范式之一,检索增强生成(retrieval-augmented generation,RAG)旨在结合信息检索和内容生成技术增强生成响应质量,已逐步成为研究的重点。在对国内外检索增强生成方法研究的基础上,阐述了RAG的基本概念及工作流程,归纳了技术现状,分析了现有RAG技术的优缺点,梳理了现有评估指标、数据集和基准。最后探讨了RAG技术在未来应用场景下所面临的挑战,并展望了其未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    5. 面向交通流预测的时空图神经网络发展综述
    闫佳和, 李红辉, 孙婧, 刘杰, 张骏温, 杨晓睿, 徐邑
    计算机工程与应用    2025, 61 (22): 1-19.   DOI: 10.3778/j.issn.1002-8331.2502-0225
    摘要461)      PDF(pc) (1418KB)(333)    收藏
    近年来,深度学习在交通流预测中的应用受到了广泛关注,特别是时空图神经网络在捕捉时空依赖关系和交通特征预测等方面取得了显著成效。已有一些综述探讨了时空图神经网络的应用,但这些研究大多以应用场景为分类依据,未能从模型设计的角度提供深入的总结分析,更缺乏统一的模型分类体系。提出了一种综合考虑“模块选择、融合机制、架构设计、训练策略”的层次分类方法,并将时空图神经网络分为六类:循环图卷积网络、时空全卷积网络、时空注意力网络、时空编码器网络、时空混搭架构网络、附加策略时空网络。针对每一个类别,详细分析了其特有的模型建模方法、时空融合机制,并对比了主要变体的特点。通过分析代表性工作和最新工作,探讨了时空图神经网络的发展规律,并给出了开源模型的源代码地址。收集了常用的公开数据集,并在对比前人实验结果的基础上,对最新先进模型的性能进行可视化分析。最后总结了该领域的发展机遇与挑战,为后续研究提供启发。
    参考文献 | 相关文章 | 多维度评价
    6. 基于卷积神经网络的图像分类深度学习模型综述
    刘鸿达, 孙旭辉, 李沂滨, 韩琳, 张宇
    计算机工程与应用    2025, 61 (11): 1-21.   DOI: 10.3778/j.issn.1002-8331.2411-0196
    摘要460)      PDF(pc) (1675KB)(435)    收藏
    使用神经网络模型进行图像分类任务一直是非常重要的研究方向,随着深度学习技术的发展,对神经网络模型的要求也越来越高。在识别率高的同时,对模型的参数量、训练时间也都有较高的要求。卷积神经网络一直是深度学习中针对图像处理的主流方法,主要介绍基于卷积神经网络的分类模型的发展历程,分析其不同阶段各个模型的搭建思路;介绍Transformer与卷积神经网络结合的相关模型以及各模型在其他领域的应用情况。最后,对卷积神经网络的发展进行了探讨。
    参考文献 | 相关文章 | 多维度评价
    7. 大模型在垂直领域应用的现状与挑战
    籍欣萌, 昝红英, 崔婷婷, 张坤丽
    计算机工程与应用    2025, 61 (12): 1-11.   DOI: 10.3778/j.issn.1002-8331.2409-0181
    摘要446)      PDF(pc) (839KB)(353)    收藏
    近年来,以ChatGPT为代表的大语言模型在多个领域受到广泛的关注,并取得优异的表现,推动了人工智能技术的新一轮发展浪潮。目前国产大模型数量已有上百个,覆盖多个行业领域,应用场景也不断扩展。为了更好地应对大模型在自然语言处理中的发展及其对通用任务和领域应用带来的冲击,对自然语言处理和大模型的发展历程进行回顾,阐述了当前大模型的相关技术以及大模型在医疗、法律、金融等垂直领域的应用,并对大模型在应用过程中面临的挑战如能力缺陷、协同问题等作出分析。最后,针对这些问题探讨了大模型在实际应用中的未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    8. 融合多注意力机制的轻量级无人机航拍小目标检测模型
    涂育智, 王法翔, 吴春霖
    计算机工程与应用    2025, 61 (11): 93-104.   DOI: 10.3778/j.issn.1002-8331.2412-0324
    摘要422)      PDF(pc) (1953KB)(140)    收藏
    无人机航拍中的目标检测面临诸多挑战,如检测目标小、尺度变化大以及计算能力受限等问题。针对现有小目标检测模型体积大、计算量高,难以在边缘设备上高效部署的问题,提出了一种基于YOLOv11改进的轻量化模型MA-YOLOv11s(multi-attention YOLOv11s)。选择性地引入小目标检测层,在提高检测能力的同时控制计算量增长。设计了融合多种注意力机制的轻量级特征提取模块C2SCSA和C2MCA,增强了模型对复杂背景中小目标的特征提取能力,同时保持了较低的计算开销。采用Soft-NMS-SIOU替代传统的NMS方法,显著提升了模型在密集重叠目标场景中的检测精度与鲁棒性。在VisDrone2019数据集的实验中,与YOLOv11s模型相比,MA-YOLOv11s仅用2.291×106的参数量和22.4 GFLOPs的计算量就将精确率、召回率、mAP50、mAP50:95分别提升8.9、1.3、10.9、9.7个百分点。实验结果表明,改进后的模型在保持小体积的同时展现了卓越的小目标检测性能。
    参考文献 | 相关文章 | 多维度评价
    9. 融合多层次卷积神经网络的知识图谱嵌入模型
    李敏, 李学俊, 廖竞
    计算机工程与应用    2025, 61 (6): 192-198.   DOI: 10.3778/j.issn.1002-8331.2310-0360
    摘要407)      PDF(pc) (748KB)(100)    收藏
    知识图谱嵌入将实体和关系投影到连续的低维嵌入空间中来学习三元组特征。基于翻译类的模型无法提取深层知识且特征表达能力有限,基于神经网络的模型虽然能提取出深层知识但容易丢失浅层知识,并且对于实体和关系间的特征交互能力较弱。为了在基于神经网络的模型中充分提取三元组浅层与深层特征,提出一种融合多层次卷积神经网络的知识图谱嵌入模型(ConvM),该模型使用头实体与关系交叉排列的重组嵌入方式来加强实体关系间的特征交互,并采用空洞卷积与一维、三维卷积核并列结合的特征提取模块来捕获实体关系间的多尺度交互特征,除此之外引入残差连接以改善原始信息遗忘问题。在五个公开数据集上对ConvM模型进行链接预测实验,实验结果表明,ConvM模型在FB15k、FB15k-237和Kinship数据集上的MRR指标相比ConvE模型分别提升了23.3%、10.8%、12.2%,体现了ConvM模型优秀的特征表达能力,有效提升了链接预测性能。
    参考文献 | 相关文章 | 多维度评价
    10. 基于大语言模型的施工安全多模态知识图谱的构建与应用
    董磊, 吴福居, 史健勇, 潘龙飞
    计算机工程与应用    2025, 61 (9): 325-333.   DOI: 10.3778/j.issn.1002-8331.2408-0036
    摘要397)      PDF(pc) (1439KB)(208)    收藏
    现有施工安全管理方法难以有效整合文本与图片多模态信息,针对施工现场安全事故的领域内知识表达和推理能力有限,并且处理和应用数据需要广泛的领域知识和专业背景。针对这一问题,提出一种基于多模态大语言模型的多模态知识图谱构建方法。基于施工安全管理的基本理论和实践经验,构建施工安全知识本体,在此基础上运用多模态大模型构建出多模态知识图谱,解决文本与图片多模态整合以及领域内知识表达和推理能力有限的问题。构建出的知识图谱不仅整合了文本中的事故安全知识,还包含了现场图片信息,提升了知识的全面性和实用性。通过计算准确率、召回率、F1值三个指标对抽取结果进行评价,均得到了很高的分数,验证了大模型对于图片抽取的合理性和准确性。在实际应用中,该方法有助于安全管理人员及时的发现施工现场的安全事故,为管理决策和智能推理提供了重要支持。
    参考文献 | 相关文章 | 多维度评价
    11. 基于深度学习的基础设施表面裂纹检测方法研究进展
    胡翔坤, 李华, 冯毅雄, 钱松荣, 李键, 李少波
    计算机工程与应用    2025, 61 (1): 1-23.   DOI: 10.3778/j.issn.1002-8331.2407-0407
    摘要387)      PDF(pc) (9136KB)(374)    收藏
    民用基础设施在长期使用后容易发生物理结构或性能状态的改变,对其功能和使用安全造成一定的损害,因此,对这类设施的结构健康监测是十分必要的。裂纹检测是结构健康监测中极其重要的一部分,及时检测并识别这类损伤,能有效避免事故的发生。基于计算机视觉的表面裂纹检测方法操作简单、检测速度快、准确率高,被广泛应用于民用基础设施的表面裂纹检测。从图像分类、目标检测、语义分割三个不同的检测方向综述了基于深度学习的基础设施表面裂纹检测方法,总结了常见的数据采集方法和常用的公共裂纹数据集。最后讨论了基于深度学习的基础设施表面裂纹检测方法存在的困难与挑战,并展望了未来可能的发展方向。
    参考文献 | 相关文章 | 多维度评价
    12. 多无人机协同规划研究综述
    宁聪, 范菁, 孙书魁
    计算机工程与应用    2025, 61 (1): 42-58.   DOI: 10.3778/j.issn.1002-8331.2405-0110
    摘要383)      PDF(pc) (6173KB)(245)    收藏
    无人机在各行各业中发挥重要作用,多无人机之间的合作已成为研究热点。针对任务分配与路径规划两个核心问题,整理和分析了多无人机协同规划两个关键问题之间的复杂性,以及子问题间的信息耦合因素,并重点探讨了解耦策略;从数学模型方面对多无人机协同规划问题的通用模型进行描述,整理归纳出常见环境建模方法和多目标优化求解的约束条件;综述了基于集中式控制和分布式控制的任务规划方法,以及启发式算法在多无人机协同规划中的应用和研究进展,并重点介绍了多无人机协同规划问题面临实时性要求下的协同规划方法;结合典型研究,讨论了多无人机协同规划问题的未来研究方法与挑战,展望多无人机协同规划的发展。
    参考文献 | 相关文章 | 多维度评价
    13. 深度学习下的医学图像分割综述
    邢素霞, 李珂娴, 方俊泽, 郭正, 赵士杭
    计算机工程与应用    2025, 61 (7): 25-41.   DOI: 10.3778/j.issn.1002-8331.2409-0142
    摘要376)      PDF(pc) (1527KB)(246)    收藏
    针对医学图像的高维性、复杂性和高精度要求等特性,深度学习下的医学图像分割方法凭借其强大的特征提取能力和对复杂模式的学习能力,能够自适应地从大量数据中学习并提取多层次特征,展现出高精度、高鲁棒性和可扩展性强等优势。通过端到端地提取感兴趣的器官、组织或病变区域,为医生在疾病诊断、制定治疗策略和临床研究等领域提供有力帮助。重点综述了U-Net、Transformer、Mamba、分割一切模型(segment anything model,SAM)及其各自变体模型在医学图像分割中的应用情况和发展脉络,从多个维度进行了综合对比分析,对开展医学影像研究、临床疾病诊断与治疗决策,以及医疗技术创新产品开发均具有一定参考价值。在此基础上,总结了目前医学图像分割研究中面临的挑战,并对该领域未来的研究前景进行展望。
    参考文献 | 相关文章 | 多维度评价
    14. 多智能体深度强化学习及可扩展性研究进展
    刘延飞, 李超, 王忠, 王杰铃
    计算机工程与应用    2025, 61 (4): 1-24.   DOI: 10.3778/j.issn.1002-8331.2407-0034
    摘要362)      PDF(pc) (2161KB)(331)    收藏
    多智能体深度强化学习近年来在解决智能体协作、竞争和通信问题上展现出巨大潜力。然而伴随着其在更多领域的应用,可扩展性问题备受关注,是理论研究到大规模工程应用的重要问题。回顾了强化学习理论和深度强化学习的典型算法,介绍了多智能体深度强化学习三类学习范式及其代表算法,并简要整理出当前主流的开源实验平台。详细探讨了多智能体深度强化学习在数量和场景上的可扩展性研究进展,分析了各自面临的核心问题并给出了现有的解决思路。展望了多智能体深度强化学习的应用前景和发展趋势,为推动该领域的进一步研究提供参考和启示。
    参考文献 | 相关文章 | 多维度评价
    15. 融合时空特征的多模态车辆轨迹预测方法
    史昕, 王浩泽, 纪艺, 马峻岩
    计算机工程与应用    2025, 61 (7): 325-333.   DOI: 10.3778/j.issn.1002-8331.2311-0240
    摘要357)      PDF(pc) (1627KB)(82)    收藏
    针对考虑车辆行驶不确定性的轨迹分布准确快速预测问题,提出了一种融合时空特征的多模态车辆轨迹预测方法(GCNTA)。利用空间关联度系数和图卷积神经网络(GCN)实现空间关联特征提取。构建具有时间注意力机制的时域卷积网络(TCN)完成时间特征提取。通过特征融合门控单元实现每个时间步长对应时空特征的自适应融合,并利用门控循环单元(GRU)网络构建解码器进一步生成未来车辆轨迹的概率分布。利用公开的NGSIM数据集对所提出模型进行消融实验及预测精度分析。仿真结果表明,GCNTA模型在预测误差均方根(RMSE)平均值相比GCN、图注意力网络(GAT)和长短期记忆网络(LSTM)模型分别减少15.6%、16.3%和23.8%。
    参考文献 | 相关文章 | 多维度评价
    16. 基于多模态融合的无人机识别研究综述
    李旻姝, 周莫涵, 支瑞聪
    计算机工程与应用    2025, 61 (21): 1-14.   DOI: 10.3778/j.issn.1002-8331.2501-0014
    摘要344)      PDF(pc) (17525KB)(410)    收藏
    随着无人机技术的迅速发展,在相关技术应用越来越多的同时也带来了许多安全隐患和监管难题。反无人机检测技术作为应对这些挑战的重要手段,受到了广泛的关注。传统的无人机检测方法依赖于单一的模态数据,例如视觉、音频、雷达及射频信号等,但这些单一模态数据在复杂场景下所获取的信息有限。近年来,深度学习方法在小目标检测领域取得良好进展,同时多模态融合技术的相关研究也使目标检测的精度和鲁棒性得到进一步的提升。综述了无人机检测领域的研究进展,重点梳理了多模态融合技术的研究现状;此外,整理了相关无人机检测的评价指标和公开数据集,分析了现有技术的局限性,并指出了未来提升检测精度与鲁棒性的研究方向。
    参考文献 | 相关文章 | 多维度评价
    17. 融合多尺度层级特征的航拍小目标检测
    杨鸿丹, 付贵, 邵慧超, 汪艺欣, 邵延华, 楚红雨, 邓琥
    计算机工程与应用    2025, 61 (9): 230-241.   DOI: 10.3778/j.issn.1002-8331.2408-0105
    摘要338)      PDF(pc) (4334KB)(283)    收藏
    针对航拍图像大视野、小尺寸、分布密集从而导致小目标检测精度低的问题,提出一种基于YOLOv8改进的融合多尺度特征的航拍检测算法,构建了轻量化的L-MobileViT模块捕获特征间的有效关系,减缓信息丢失,提高模型的检测性能。提出了多层级的多尺度融合模块HF(hierarchical fusion),融合深层级的语义信息与底层级空间纹理信息,提高密集场景下小目标的检测能力。在YOLOv8基础上增加小目标检测头删减大目标检测头,提升小目标检测能力,减少小目标的漏检。实验结果表明,改进后的模型在VisDrone2019与UAV航拍交通小目标数据集(UAV-TrafficTinyDataset)中取得了较优的效果,与基线模型相比,mAP@50分别提高17.6%、15.7%,对小目标的检测效果有明显的提升,综合性能优于主流的航拍检测算法,表明改进算法具有更优泛化性与鲁棒性,适用于航拍场景下的检测任务。
    参考文献 | 相关文章 | 多维度评价
    18. 改进YOLOv11的无人机小目标检测算法
    刘玉萍, 尚翠娟, 李明明
    计算机工程与应用    2025, 61 (15): 124-131.   DOI: 10.3778/j.issn.1002-8331.2503-0274
    摘要338)      PDF(pc) (1400KB)(214)    收藏
    针对无人机小目标检测任务中小目标像素少、尺度变化大、易受背景干扰的问题,提出一种基于YOLOv11的改进算法。设计新的ELAN-DC模块改进主干网络,在高效层聚合网络ELAN的CBS模块中结合双卷积DC,增强模型主干部分的特征提取能力。设计一种新的全局到局部双向特征融合结构GLBiFPN,提升多尺度特征融合的效果。引入动态检测头DyHead,进一步增强模型的检测精度。实验结果表明,在VisDrone2019数据集上,改进算法的检测精度mAP50和mAP50-95相比YOLOv11n分别提高5.1和3.5个百分点。
    参考文献 | 相关文章 | 多维度评价
    19. 多模态驾驶员情绪识别研究综述
    周欣颖, 李雷孝, 林浩, 张虎成
    计算机工程与应用    2025, 61 (10): 1-18.   DOI: 10.3778/j.issn.1002-8331.2410-0153
    摘要324)      PDF(pc) (1630KB)(363)    收藏
    准确识别驾驶员情绪可以有效预防潜在的危险驾驶行为,减少交通事故的发生,是提升道路安全和驾驶体验的重要技术。随着人工智能和多模态数据处理技术的进步,情绪识别技术从单模态方法逐步发展为多模态方法。梳理了当前多模态驾驶员情绪识别的研究进展,重点总结了面部表情、语音信号、生理信号以及车辆行为四种模态的识别流程,关键步骤包括数据预处理、特征提取和多模态融合。通过分析现有研究,总结了不同方法的优势与不足,介绍了多个驾驶员情绪相关数据集。最后结合当前研究所面临的挑战,提出了未来多模态驾驶员情绪识别研究领域的五个研究方向。
    参考文献 | 相关文章 | 多维度评价
    20. 改进RT-DETR的航拍小目标检测算法
    刘思元, 高凯, 雍龙泉
    计算机工程与应用    2025, 61 (4): 272-281.   DOI: 10.3778/j.issn.1002-8331.2407-0399
    摘要322)      PDF(pc) (1975KB)(326)    收藏
    针对现有的目标检测算法在航拍图像中的小目标上易出现的漏检和误检问题,提出了基于改进RT-DETR(real-time detection transformer)的算法。在主干网络中引入了部分卷积(partial convolution,PConv),设计了PConvBlock结构,并通过由PConvBlock组成的BasicBlock-PConvBlock模块替代原有BasicBlock,有效减少了模型参数。采用双向特征金字塔网络(bidirectional feature pyramid network,BiFPN)结构优化特征融合模块,并引入S2特征进一步提升小目标的检测能力。引入CARAFE上采样算子,增强了多尺度特征的快速融合。实验表明,在VisDrone测试集上,改进后的模型在参数量上比RT-DETR模型降低了13.9%,同时在mAP0.5和mAP0.5:0.95指标上分别提升了2.4和1.9个百分点。在TT100K和DOTA数据集上均优于RT-DETR算法。改进模型在保持较小参数量和计算量的同时,提高了检测精度,满足了无人机航拍图像实时检测的应用需求。
    参考文献 | 相关文章 | 多维度评价
    21. 融合反事实推理的多模态情感分析算法研究
    王淑娴, 杨海, 冯程, 李雪
    计算机工程与应用    2025, 61 (15): 199-208.   DOI: 10.3778/j.issn.1002-8331.2404-0424
    摘要318)      PDF(pc) (1075KB)(61)    收藏
    在多模态情感分析中,现有的情感识别模型大多在测试集上准确率高,但在实际应用中,模型情感识别准确率比测试集中低,即模型的泛化能力不强。许多研究表明,这种现象归因于:多模态情感分析模型在训练阶段严重依赖于文本模态,进而学习到了文本模态和情感标签之间关于社会、种族、性别等刻板印象,也称为文本偏见。提出一种基于反事实推理的多模态情感分析模型(counterfactual reasoning for multimodal sentiment analysis,CRFM),构建因果图并分析情感识别结果的因果效应,利用反事实推理从情感识别结果总效应中去除文本偏见直接效应,从而去除文本偏见不良影响,提高模型情感识别准确率,进而增强模型泛化能力。利用MOSI和MOSEI两种数据集,分别与六种基线模型进行对比实验,CRFM准确率达87.05%,优于其他基线模型。此外,CRFM在两种数据集中准确率更稳定,模型泛化能力更强。
    参考文献 | 相关文章 | 多维度评价
    22. 改进RT-DETR的无人机图像目标检测算法
    姜贸翔, 司占军, 王晓喆
    计算机工程与应用    2025, 61 (1): 98-108.   DOI: 10.3778/j.issn.1002-8331.2405-0331
    摘要290)      PDF(pc) (5878KB)(256)    收藏
    针对轻小型无人机图像目标检测中由于目标灵活多样、环境复杂多变导致的检测精度低等问题,提出基于改进RT-DETR无人机目标检测算法。综合考虑轻量级SimAM注意力和倒置残差模块改进ResNet-r18主干网络,提高目标检测模型的特征提取能力。采用级联分组注意力机制优化倒置残差模块和特征交互模块,提升特征选择能力,实现目标检测信息的精细化获取。颈部网络中引入160×160检测层,提升特征融合阶段小目标的感知能力。基于VisDrone2019数据集的实验结果表明,改进后的模型具有更低的参数量和更高的检测精度。在Alver_Lab_Ulastirma和HIT-UAV数据集上进一步验证了改进方法的有效性和鲁棒性。
    参考文献 | 相关文章 | 多维度评价
    23. BEV感知学习在自动驾驶中的应用综述
    黄德启, 黄海峰, 黄德意, 刘振航
    计算机工程与应用    2025, 61 (6): 1-21.   DOI: 10.3778/j.issn.1002-8331.2407-0501
    摘要283)      PDF(pc) (2079KB)(241)    收藏
    自动驾驶感知模块中作为采集输入的传感器种类不断发展,要使多模态数据统一地表征出来变得愈加困难。BEV感知学习在自动驾驶感知任务模块中可以使多模态数据统一融合到一个特征空间,相比于其他感知学习模型拥有更好的发展潜力。从研究意义、空间部署、准备工作、算法发展及评价指标五个方面总结了BEV感知模型具有良好发展潜力的原因。BEV感知模型从框架角度概括为四个系列:Lift-Splat-Lss系列、IPM逆透视转换、MLP视图转换及Transformer视图转换;从输入数据概括为两类:第一类是纯图像特征的输入包括单目摄像头输入和多摄像头输入,第二类在融合数据输入中不仅是简单的点云数据和图像特征的数据融合,还包括了以点云数据为引导或监督的知识蒸馏融合和以引导切片方式去划分高度段的融合。概述了多目标追踪、地图分割、车道线检测及3D目标检测四种自动驾驶任务在BEV感知模型当中的应用,并总结了目前BEV感知学习四个系列框架的缺点。
    参考文献 | 相关文章 | 多维度评价
    24. 优化改进YOLOv8无人机视角下目标检测算法
    孙佳宇, 徐民俊, 张俊鹏, 炎梦雪, 操文, 侯阿临
    计算机工程与应用    2025, 61 (1): 109-120.   DOI: 10.3778/j.issn.1002-8331.2405-0030
    摘要282)      PDF(pc) (6040KB)(174)    收藏
    针对无人机视角下的目标存在多尺度、目标小、被遮挡与背景复杂等问题,提出了一种基于动态样本注意力尺度序列的YOLOv8改进算法BDAD-YOLO。通过引入BiFormer的思想来改造原模型骨干结构,提高模型对关键信息的关注度,更好地保留目标细粒度细节信息。由于目标存在大小、位置等多变性,传统卷积并不能很好地处理这一情况,因此基于DCN(deformable convolutional network)的思想,设计了一种可以增强对小目标特征提取的C2_DCf模块,从而进一步提高颈部网络中小目标层对特征信息的融合。提出一种基于动态样本的注意力尺度序列融合框架AFD(attention-scale sequence fusion framework based on dynamic samples),使用轻量化动态点采样并通过融合不同尺度的特征图来增强网络提取多尺度信息的能力。使用WIoU损失函数,改善小目标低质量数据对梯度的不利影响,以加快网络收敛速度。实验结果表明,在VisDrone数据集中的val集与test集上平均精度(mAP@0.5)分别提升了4.6个百分点、3.7个百分点,在DOTA数据集上平均精度(mAP@0.5)提升了2.4个百分点,证明了改进算法的有效性和普适性。
    参考文献 | 相关文章 | 多维度评价
    25. 多尺度特征聚合扩散和边缘信息增强的小目标检测算法
    江旺玉, 王乐, 姚叶鹏, 毛国君
    计算机工程与应用    2025, 61 (7): 105-116.   DOI: 10.3778/j.issn.1002-8331.2410-0084
    摘要278)      PDF(pc) (11489KB)(190)    收藏
    无人机航拍图像中,目标尺寸变化剧烈、背景复杂且小目标比例较高等特点为目标检测任务带来巨大挑战。尽管现有的基于卷积的目标检测算法能有效获取空间信息,但在实现不同尺度特征的全局交互及边缘细节信息的有效利用上仍存在不足。因此,提出了一种结合多尺度特征聚合扩散和边缘信息增强的小目标检测算法ADE-YOLO。构建了多尺度特征聚合扩散金字塔网络(MFADPN),通过在中间层聚合不同层级特征,并将其直接扩散至相邻层以缩短传播路径,有效减少了信息在传递过程中的损失,增强了模型的多尺度表达能力,显著提升了对不同尺度目标的检测能力。设计了自适应上下文融合模块(ACFM),利用通道注意力机制自适应地调整不同特征图的贡献,进一步强化多尺度特征的融合效果,使得重要特征在信息融合过程中更加突出。提出的C2f-Sobel模块通过额外分支结合Sobel算子来提取图像的边缘信息,从而为模型提供了更丰富的细节信息,提升了其在复杂场景下目标定位能力。实验结果表明,ADE-YOLO相较于基线YOLOv10s,在VisDrone2019和TinyPerson数据集上分别提高了8.6个百分点和4.0个百分点(mAP0.5),并且在与其他先进模型的对比中也展示了显著的优势。
    参考文献 | 相关文章 | 多维度评价
    26. 深度学习驱动下的目标检测研究进展综述
    山显英, 张琳, 李泽慧
    计算机工程与应用    2025, 61 (1): 24-41.   DOI: 10.3778/j.issn.1002-8331.2407-0038
    摘要267)      PDF(pc) (7781KB)(211)    收藏
    近年来,深度学习在GPU高性能计算能力的加持下得到了迅速推广,并在安防、医疗、工业等领域实现了广泛应用。目标检测模型的性能也在稳步提高,从传统的目标检测方法逐渐过渡到基于卷积神经网络(CNN)深度学习的进一步应用,极大地节省了人力物力。通过参考大量文献,按照两阶段脉络梳理了目标检测的发展历程以及近年深度学习在目标检测领域内的研究进展,对比了在不同数据集上模型网络的性能,总结不同方法的优势与不足,并对领域内重要数据集作了归纳,还对目标检测算法的落地效果做了总结,特别是生活与科技中的实际应用(无人驾驶、医学图像、遥感等)。最后,还对深度学习驱动下目标检测在未来研究上的机遇和挑战作了展望。
    参考文献 | 相关文章 | 多维度评价
    27. 基于深度学习的肺部CT图像病灶区域分割研究综述
    李小童, 马素芬, 生慧, 魏国辉, 李欣桐
    计算机工程与应用    2025, 61 (4): 25-42.   DOI: 10.3778/j.issn.1002-8331.2403-0315
    摘要265)      PDF(pc) (4394KB)(238)    收藏
    肺癌严重威胁人们的生命健康。肺部CT图像病灶区域形态复杂多样,实现高精度的肺部CT图像病变区域分割,成为计算机辅助诊断领域的一个极具挑战性的关键问题。基于深度学习的肺部病灶区域分割不仅可以帮助医生快速、准确地诊断出早期肺癌,而且对于肺癌的治疗也具有重要的临床价值。为了深入研究肺部病灶区域分割技术,介绍了常用的数据集及评价指标;重点从基于卷积神经网络、基于U-Net模型、基于生成对抗网络三个方面对深度学习肺部病灶区域分割模型进行了综述;结合具体实验总结了近5年国内外研究的创新点,对比分析了各个模型的分割性能;最后总结了各类模型的优缺点,展望了该领域的未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    28. DCD-YOLOv8n:一种高效的钢材表面缺陷检测算法
    梁礼明, 陈康泉, 钟奕, 龙鹏威, 冯耀
    计算机工程与应用    2025, 61 (7): 117-127.   DOI: 10.3778/j.issn.1002-8331.2409-0248
    摘要262)      PDF(pc) (2671KB)(241)    收藏
    针对现有钢材表面缺陷检测算法资源消耗较大、检测精度和效率较低等问题,提出一种基于YOLOv8n的高效钢材缺陷检测算法(DCD-YOLOv8n)。该方法一是设计轻量化的多分支特征聚合网络,有效精简模型体积并提升检测速度;二是利用跨维度聚合模块,通过自适应机制建模多维度特征,以提升检测精度;三是采用可变形多头注意力机制,动态调整注意力的形状和范围,有效应对形态多样和结构复杂的缺陷特征,从而提升检测性能。在Severstal和NEU-DET钢材缺陷数据集上进行实验验证,相较于YOLOv8n算法,DCD-YOLOv8n算法的mAP分别提高2.4个百分点和1.9个百分点;参数量和复杂度分别降低0.5×106和1.9×109;FPS分别提升22帧和7帧。实验结果表明,该算法在平衡计算开销、检测精度和效率方面表现优异,具有一定的实际部署应用价值。
    参考文献 | 相关文章 | 多维度评价
    29. 深度学习的多视角三维重建技术综述
    王文举, 唐邦, 顾泽骅, 王森
    计算机工程与应用    2025, 61 (6): 22-35.   DOI: 10.3778/j.issn.1002-8331.2405-0328
    摘要261)      PDF(pc) (3077KB)(223)    收藏
    为解决经典的多视角三维重建方法难以重建复杂物体、重建效果不佳以及在高分辨率上的扩展等问题,深度学习方法被引入用以重建具有更高精度的三维模型。系统地总结归纳、分析和比较了使用深度学习方法的多视角三维重建算法,并按照显式几何和隐式几何两种几何表示方式对近几年的多视角三维重建算法进行了分类与梳理。重点介绍了目前具有较高重建精度的将隐式函数以及体渲染相结合的神经隐式三维重建算法,并分别定量、定性分析了该类部分算法在数据集上的结果;另外列举了常用数据集和评价指标,并对未来的研究趋势和发展方向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    30. 深度学习框架下的红外与可见光图像融合方法综述
    李淑慧, 蔡伟, 王鑫, 高蔚洁, 狄星雨
    计算机工程与应用    2025, 61 (9): 25-40.   DOI: 10.3778/j.issn.1002-8331.2410-0012
    摘要260)      PDF(pc) (25398KB)(263)    收藏
    红外与可见光图像融合(infrared and visible image fusion,IVIF)将红外图像与可见光图像的互补信息融合,提升图像质量以支持下游任务。鉴于深度学习在图像融合方面的优势,将其应用在IVIF领域已成为研究热点。对深度学习框架下的红外与可见光图像融合方法进行梳理分析,根据不同的融合框架将融合方法分为基于自编码器、卷积神经网络、生成对抗网络和变换器,并对比分析这四类方法的特点;综述了IVIF的主要应用领域、常用的6个数据集和8个评价指标,并在典型数据集上对各类主流IVIF方法进行定性和定量评估。最后,总结了现有IVIF方法的局限性,并展望了IVIF的未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    31. 面向边缘智能的协同推理方法研究综述
    赵婵婵, 吕飞, 石宝, 尉晓敏, 杨星辰, 岳效灿
    计算机工程与应用    2025, 61 (3): 1-20.   DOI: 10.3778/j.issn.1002-8331.2406-0040
    摘要259)      PDF(pc) (7788KB)(219)    收藏
    随着边缘智能的兴起,协同推理技术通过云、边缘和终端设备之间的协作在提升智能应用的效率和性能方面取得了明显的进展。阐述了边缘智能的性能指标和应用场景及挑战,并以边缘智能的评级架构引出协同推理技术下的四种推理范式:端端协同、边端协同、边边协同和云边端协同推理。根据协同推理技术应用场景的局限性和差异性,对不同推理范式中协同推理技术的优势、局限性、原理及优化目标进行了全面分析对比。详细探讨了协同推理技术在不同应用场景下所解决的计算资源分配、推理时延优化和吞吐量优化等问题,指出了边缘智能中协同推理技术在隐私安全、通信服务资源管理、协同训练方面的挑战,并对其未来的发展趋势和研究方向进行了讨论,为该领域的研究提供参考和借鉴。
    参考文献 | 相关文章 | 多维度评价
    32. 深度学习的点云语义分割方法综述
    蔡子悦, 袁振岳, 庞明勇
    计算机工程与应用    2025, 61 (11): 22-30.   DOI: 10.3778/j.issn.1002-8331.2408-0033
    摘要252)      PDF(pc) (605KB)(185)    收藏
    点云语义分割将点云中每个点赋予语义标签,实现对场景中不同物体的分割,是场景理解的基础。近年来,随着深度学习技术的发展,将深度学习与点云语义分割方法相结合,提升了点云语义分割的处理效率和分割精度,展现出卓越的性能,被广泛应用于交通、医学、建筑设计、虚拟现实等众多领域。在回顾点云语义分割发展历程的基础上,对已有研究进行分类综述,然后分析相关数据集和评价指标,对比已有方法的性能。最后,总结现有研究的不足,并展望未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    33. 基于深度学习的短时交通流预测研究综述
    熊章友, 李卫军, 朱晓娟, 杨国梁, 马馨瑜
    计算机工程与应用    2025, 61 (11): 67-82.   DOI: 10.3778/j.issn.1002-8331.2407-0410
    摘要248)      PDF(pc) (1148KB)(144)    收藏
    交通流预测是智能交通系统的重要组成部分,旨在准确估计未来特定时间间隔内特定区域的交通流量。随着车辆的增长和路网中不同区域之间的复杂时空关系,传统的交通预测方法难以准确描述交通数据的特征,而深度学习的预测方法能够更好地处理复杂的特征结构,因此,深度学习的方法已成为短时交通流预测的研究热点。总结了传统交通流预测方法和深度学习交通流预测方法的研究现状,详细介绍了深度学习架构卷积神经网络、自编码器、循环神经网络、图卷积神经网络、注意力机制与Transformer以及深度学习混合神经网络,并且对深度学习的交通流预测文献、深度学习的超参数和场景进行了总结分析。总结了现有文献中常用的国内外公共数据集。根据前人的模型实验对交通预测模型的性能进行了对比分析。最后,讨论了基于深度学习的交通预测领域的未来研究方向。
    参考文献 | 相关文章 | 多维度评价
    34. 视觉惯性联合标定发展综述
    赵军阳, 吕慎华, 李永旭, 祝慧鑫, 张克凡
    计算机工程与应用    2025, 61 (8): 1-16.   DOI: 10.3778/j.issn.1002-8331.2409-0330
    摘要247)      PDF(pc) (1197KB)(245)    收藏
    相机和IMU联合可充分利用两个传感器的互补优势,实现数据融合与相互校正。近年来,更多智能化的联合标定方法不断出现,但缺少统一的归纳分析。为此,将视觉惯性联合标定方法统一分类整理,旨在分析各类方法的应用特点与局限性,为相机与IMU联合标定方法应用层面或是研究层面提供更好的选择基础。介绍了相机与IMU标定参数以及标定原理,并从时间、空间两个角度展开论述。分别对在线、离线的时间标定方法,进行分类归纳并作对比分析;从空间的角度,基于IMU和相机的标定方法原理不同将标定方法分为四类:基于优化的标定、基于解耦模型的标定、基于滤波的标定、基于机器学习的标定,深入分析每种方法的优势与局限性等。最后,总结全文并提出未来联合标定的发展趋势:时空统一标定、更多标定工具包、机器学习的扩展、多传感器联合标定等。
    参考文献 | 相关文章 | 多维度评价
    35. 深度学习在知识图谱构建及推理中的应用
    孙宇, 刘川, 周扬
    计算机工程与应用    2025, 61 (6): 36-52.   DOI: 10.3778/j.issn.1002-8331.2408-0280
    摘要243)      PDF(pc) (892KB)(203)    收藏
    知识图谱作为自然语言处理领域的一种结构化知识表示形式,能够描述现实世界中的概念及相互关系,常被应用于信息检索、数据管理等领域。深度学习因其具有自动学习多元数据内在规律和表示层次的特性,可用于大规模、高质量知识图谱的精准构建及有效推理,已逐渐成为新兴研究热点。为进一步促进深度学习和知识图谱的技术融合,以知识图谱构建及推理过程为主线,全面介绍深度学习在知识表示、知识抽取、知识融合、知识推理领域的相关理论及最新研究成果;同时,根据近年来的研究趋势,重点归纳与总结了适用于图数据特征推理的图深度学习与知识推理相融合的最新研究成果。最后,对深度学习和知识图谱的融合发展做了概要总结和技术展望,为未来研究发展提供参考和思路。
    参考文献 | 相关文章 | 多维度评价
    36. 知识图谱与大语言模型协同共生模式及其教育应用综述
    李晓理, 刘春芳, 耿劭坤
    计算机工程与应用    2025, 61 (15): 1-13.   DOI: 10.3778/j.issn.1002-8331.2410-0481
    摘要243)      PDF(pc) (1158KB)(222)    收藏
    近年,人工智能技术,特别是大语言模型、知识图谱技术的迅速发展,为教育的数字化、智能化转型提供了重要的技术条件。分别分析了大语言模型与知识图谱两技术在智能教育领域的应用优势、现状以及存在的问题。在此基础上,深入探讨了知识图谱与大语言模型的协同共生模式,包括两者相互增强的方式方法,并对协同技术研究现状进行了归纳分析,总结了近年来在教育领域的相关应用。最后,对知识图谱与大语言模型技术联合应用于教育领域的发展趋势进行了总结与展望。
    参考文献 | 相关文章 | 多维度评价
    37. 语义信息处理方式分类的车道线检测技术研究综述
    洪书颖, 张东霖
    计算机工程与应用    2025, 61 (5): 1-17.   DOI: 10.3778/j.issn.1002-8331.2406-0160
    摘要240)      PDF(pc) (2981KB)(251)    收藏
    随着自动驾驶技术的迅猛发展,车道线检测作为其关键组成部分,引起了广泛关注,并在智能交通系统中展现出巨大的应用潜力。然而,在应对复杂环境挑战时,传统车道线检测技术往往难以提供足够的识别精度。回顾车道线检测技术的发展轨迹,系统性地梳理了84种先进算法,并创新性地根据语义处理方式划分为四类别:语义分割辅助类、语义信息融合类、语义信息增强类和语义关系建模类。通过深入剖析算法的技术特点和优势,揭示了当前车道线检测技术所面临的主要局限。最后,对未来车道线检测技术的发展方向提出见解,特别是在语义信息利用方面,指出了潜在的研究方向。
    参考文献 | 相关文章 | 多维度评价
    38. 可见光-红外图像融合的目标检测综述
    朱自文, 宋晓鸥, 崔巍, 岂峰利
    计算机工程与应用    2025, 61 (17): 17-32.   DOI: 10.3778/j.issn.1002-8331.2501-0206
    摘要238)      PDF(pc) (1610KB)(213)    收藏
    随着人工智能技术的快速发展,目标检测与识别的地位日益凸显。基于深度学习的可见光-红外图像融合的目标检测技术具有强大的特征提取和泛化能力,能够有效提取和融合可见光与红外图像特征。对基于双模态图像融合检测的发展现状进行概述,并在基于深度学习的目标检测基础上分析双模态图像融合检测的优势,对比介绍常用的数据集和主要的技术难题。对基于不同阶段融合的目标检测算法进行总结分析,指出特征级融合检测的优势与主导地位;重点对基于不同基础模型的融合检测算法进行分析和总结,探讨了Transformer在双模态融合检测领域的优势和主导地位,以及Mamba在未来研究中的巨大潜力。根据当前可见光-红外图像融合的目标检测研究现状,对未来以实际的开发应用为导向进行了展望。
    参考文献 | 相关文章 | 多维度评价
    39. 面向单目标追踪的对抗攻击技术综述
    陆正之, 黄希宸, 彭勃
    计算机工程与应用    2025, 61 (16): 1-15.   DOI: 10.3778/j.issn.1002-8331.2410-0308
    摘要233)      PDF(pc) (5480KB)(281)    收藏
    单目标追踪是计算机视觉中的关键任务之一。随着人工智能技术的发展,基于深度学习的追踪方法已经成为单目标追踪的主流,显著提升了追踪的精度和可用性。然而深度学习方法易受到对抗攻击威胁,攻击者能够诱使深度追踪模型产生错误的追踪结果,严重影响追踪的鲁棒性和安全性。综述了近年来单目标追踪领域对抗性攻击技术的研究进展,揭示了深度学习追踪模型所面临的潜在安全风险,并分析了该领域所面临的挑战和难题。依据攻击方法是否与视频追踪的在线特性相适应,对现有的单目标追踪对抗性攻击技术进行了分类总结,阐述了基本原理、特征以及代表性工作。最后从构建安全可靠的追踪模型和面向实际应用的追踪攻击等视角,对追踪对抗技术的未来发展趋势进行了展望,探讨了当前追踪攻击研究中的关键问题,包括追踪对抗防御、多模态追踪攻击、物理可实现追踪攻击及非合作追踪攻击等,以推动该领域创新与进步。
    参考文献 | 相关文章 | 多维度评价
    40. 基于大模型检索增强生成的气象数据库问答模型实现
    江双五, 张嘉玮, 华连生, 杨菁林
    计算机工程与应用    2025, 61 (5): 113-121.   DOI: 10.3778/j.issn.1002-8331.2406-0230
    摘要231)      PDF(pc) (1198KB)(249)    收藏
    随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索智能问答技术实现方案。该方案设计了一种基于关系型数据库(SQL)与文档型数据(NoSQL)的多通道查询路由(multi-channel retrieval router,McRR)方法,为了适配数据库进行大模型查询以及增强大模型对查询表的理解,分别提出指令查询转换方法与数据库表摘要方法DNSUM,提升大模型对数据库的语义理解能力,通过结合问题理解、重排序器和响应生成等关键模块,构建了一个端到端的智能问答模型,可实现多数据源的相关知识检索及答案生成。实验结果显示,该模型可以有效理解用户问题并生成准确的答案,具有良好的检索和响应能力。不仅为气象领域提供了一种智能问答的解决方案,也为气象智能问答技术提供了新的应用实施参考。
    参考文献 | 相关文章 | 多维度评价