全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 最近1年下载排行
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 复杂数据背景下的多标记学习研究进展
    杜国栋, 王敖, 路鹏伟, 叶倩芝, 张佳
    计算机工程与应用    2026, 62 (11): 41-61.   DOI: 10.3778/j.issn.1002-8331.2507-0192
    摘要226)      PDF(pc) (1120KB)(158)    收藏
    多标记学习是机器学习领域中的一种重要学习范式,其在许多实际应用中展现出先进的性能。以大规模、信息不完备、多维度和动态演化等为主要特征的复杂数据给多标记学习带来了重大挑战。因此,有必要依据复杂数据背景下不同学习任务的特点对多标记学习方法进行更为精细的设计。为此,详细分析了多标记数据复杂性的来源并系统综述了复杂数据背景下的多标记学习研究进展;介绍了多标记学习的问题定义、学习形式和发展趋势。围绕着“标记”“特征”和“样本”三个层面对多标记数据的复杂性进行探讨。对复杂数据背景下的多标记学习算法进行了详细的归纳、阐述和分析;总结了面临的挑战和未来可能的研究方向。
    参考文献 | 相关文章 | 多维度评价
    2. 鲁棒性多智能体路径规划:近十年文献综述
    吴梦蝶, 闫文耀, 苗水清
    计算机工程与应用    2026, 62 (11): 1-16.   DOI: 10.3778/j.issn.1002-8331.2509-0404
    摘要175)      PDF(pc) (1070KB)(155)    收藏
    得益于多机器人协作的广泛应用,多智能体路径规划(MAPF)作为多智能体协同导航的核心技术,成为目前的研究热点。MAPF的目标是在一张二维地图中,将多个智能体从各自起始位置导航到目标位置,且智能体之间无冲突。然而在智能体实际执行各自路径时由于环境的不确定性,会受到内外部的干扰,如动态障碍物、通信延时、控制误差、智能体电量限制、运动学约束影响等。这些干扰将会造成执行路径过程中智能体延时及执行状态不同步,从而产生新的冲突,严重时将导致死锁,这无疑影响了MAPF理论在实际场景中的应用。为克服这一问题,研究人员提出了鲁棒性多智能体路径规划(robust MAPF,RMAPF)算法,以保证系统在面临执行阶段的时间不确定性时,仍能保证无冲突、无死锁完成路径任务。对过去近十年中RMAPF算法进行系统的梳理,首次依据处理延时的方式,将现有算法划分为鲁棒规划与鲁棒执行两类,并从原理、优缺点、规模及适用场景等多个维度进行深入对比分析,旨在填补RMAPF领域系统综述的空白,分析将MAPF理论应用于实际过程中存在的核心瓶颈,并为推动将MAPF算法部署于实际应用的研究带来启示。
    参考文献 | 相关文章 | 多维度评价
    3. 视觉-语言-动作模型研究综述:迈向通用机器人
    陈文祺, 陈佳锋, 支鹏翔, 施露露, 闻路红
    计算机工程与应用    2026, 62 (11): 17-40.   DOI: 10.3778/j.issn.1002-8331.2511-0018
    摘要210)      PDF(pc) (1516KB)(131)    收藏
    视觉-语言-动作(VLA)模型作为具身智能领域的重要研究方向,通过深度融合感知、理解与动作,旨在克服传统机器人系统在开放环境中的语义割裂与泛化瓶颈。根据VLA领域的相关进展,梳理了VLA模型的发展脉络与研究现状。从系统架构角度将现有模型归纳为单体式、级联式和分层式三类,并深入分析各类架构的设计思路与代表性进展;系统总结了支撑VLA研究的相关数据集与评估基准。最后,基于近年来的代表性成果,分析了当前VLA模型所面临的核心挑战,并展望未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    4. 深度域自适应目标检测综述
    任方园, 李俊
    计算机工程与应用    2026, 62 (11): 62-89.   DOI: 10.3778/j.issn.1002-8331.2506-0020
    摘要105)      PDF(pc) (9468KB)(81)    收藏
    传统基于深度学习的有监督目标检测方法依赖大量标注数据,并假设训练与应用场景数据分布一致,因此在跨域迁移时往往性能显著下降,而域自适应技术通过缓解源域与目标域分布差异,可以有效减少对大规模标注的依赖。自2018年首个无监督域自适应目标检测算法提出以来,研究者们相继探索了无监督、少样本、弱监督、无源域、测试时、开集及通用等域自适应目标检测方法,以应对数据稀缺、环境动态变化及类别未知等实际挑战。现有综述多集中于无监督域自适应或某一类算法,缺乏少样本、弱监督等多种类型的系统总结,从实际应用需求出发,梳理不同方法的适应机制与模型设计,分析不同类型算法在隐私保护、持续学习与快速部署等复杂场景下的优势,以为研究者理解域自适应目标检测的发展脉络与方法选择提供系统性参考与启示。
    相关文章 | 多维度评价
    5. 基于BERT-sPTT的文本分类模型
    陈可嘉, 王朕卿, 周修考
    计算机工程与应用    2026, 62 (11): 125-139.   DOI: 10.3778/j.issn.1002-8331.2502-0186
    摘要125)      PDF(pc) (1295KB)(101)    收藏
    传统文本分类模型存在分类精度有限、文本信息损失值高的不足。基于此,借鉴PVT模型的设计理念,通过缩放因子对查询向量实施同步缩放,实现对其核心注意力模块的改进,并结合BERT模型,提出BERT-sPTT文本分类模型。在THUNews数据集、复旦中文数据集、AG新闻数据集进行验证,实验结果显示三个数据集上该模型ACC值与F1值优于其他对比模型。该模型主要优势在于结合BERT捕捉文本深层语义信息方面的能力和PVT金字塔结构在特征提取和下采样方面的高效性。
    参考文献 | 相关文章 | 多维度评价
    6. 2026年第11期目次
    计算机工程与应用    2026, 62 (11): 0-0.  
    摘要82)      PDF(pc) (704KB)(99)    收藏
    相关文章 | 多维度评价
    7. 从虹膜图像中揭示人类性别与种族研究综述
    刘训禄, 王财勇, 田金秋, 赵光哲
    计算机工程与应用    2026, 62 (9): 61-82.   DOI: 10.3778/j.issn.1002-8331.2505-0331
    摘要146)      PDF(pc) (7944KB)(123)    收藏
    系统综述了基于虹膜图像的人口统计学分析研究进展,重点探讨了性别与种族两大属性分类问题。阐述了虹膜属性分类的基本原理与任务难点,介绍了虹膜属性分类的应用场景及与虹膜识别的两大集成模式(串行集成与并行集成)。列举了虹膜属性分类常用的7种量化评价指标。针对虹膜性别分类,按照基于传统手工特征的方法与基于深度学习的方法两大类展示其发展进程;针对虹膜种族分类,按照基于统计值的方法与基于纹理基元的方法展示其发展进程。总结了ND-GFI、CVBL_IRIS、UNAB-Gender、CASIA-BioSecure等主流虹膜属性分类数据集的特点与适用场景。分析了当前虹膜属性分类面临的挑战,包括无约束环境下的属性分类、多模态/特征融合、跨域(光谱、传感器)泛化性、数据分布与标注和模型轻量化。总结全文,为该领域技术研发与应用提供系统性参考。
    参考文献 | 相关文章 | 多维度评价
    8. 知识图谱与推荐算法任务优化及领域应用发展综述
    韩一鸣, 魏国辉
    计算机工程与应用    2026, 62 (10): 26-53.   DOI: 10.3778/j.issn.1002-8331.2505-0279
    摘要111)      PDF(pc) (1436KB)(174)    收藏
    推荐算法作为当前信息过滤的核心技术,需要通过知识图谱的语义关联以及结构化知识来解决信息碎片化和可解释性不足的问题。为了进一步促进知识图谱与推荐算法的技术融合,研究推荐模型性能提升的关键和多领域多技术的发展,并将知识图谱与推荐算法结合过程分为知识图谱模块优化、推荐任务模块优化、多任务模块优化三部分。从发展历程、优化改进、核心技术等角度详细梳理各模块相关理论和研究成果;同时结合当前领域发展趋势,总结了大模型、医学领域和电商领域应用的最新发展及存在的挑战;最后对知识图谱与推荐算法存在的问题进行总结与展望,为后续研究提供新的拓展思路。
    参考文献 | 相关文章 | 多维度评价
    9. 基于CLDSP和交叉注意力机制的多模态抑郁症检测
    郑泽, 李鸿燕
    计算机工程与应用    2026, 62 (11): 151-161.   DOI: 10.3778/j.issn.1002-8331.2503-0038
    摘要108)      PDF(pc) (1935KB)(64)    收藏
    针对现有多模态抑郁症检测模型存在的上下文语义表征以及跨模态交互能力不足等问题,提出一种融合时空特征优化与动态线索增强的多模态抑郁症检测模型。模型采用三层式架构:在语音模态处理层,构建基于一维CNN与Bi-LSTM的时空音频特征提取网络,通过复合型门控注意力机制实现语音时空特征的自适应筛选;在视觉模态处理层,设计双流特征增强网络,空间分析支路采用Inception ResNet模块捕获面部静态显著性区域,时序建模支路提出基于纹理特征描述符CLSDP的面部动态解析方法,实现对抑郁线索的精准量化表征;在多模态融合决策层,提出基于交叉注意力机制和Transformer的双路径级联跨模态注意力融合网络捕获模态间互补特征。在AVEC2013/AVEC2014标准数据集上的实验表明,所提出的模型将均方根误差与平均绝对误差分别优化至4.309/4.263和4.919/4.259,显著提升了多模态抑郁情绪分类的效果。
    参考文献 | 相关文章 | 多维度评价
    10. 基于DQN调整的AlphaZero残局优化策略在苏拉卡尔塔棋中的应用
    陈鸿翔, 邓天奇, 王嘉杰, 刘子源, 刘明烁, 赵国冬
    计算机工程与应用    2026, 62 (11): 162-172.   DOI: 10.3778/j.issn.1002-8331.2503-0241
    摘要83)      PDF(pc) (2150KB)(50)    收藏
    随着深度学习与强化学习的进步,AlphaZero在围棋、国际象棋及将棋博弈等领域展现出了卓越的性能。然而,庞大的算力需求成为限制AlphaZero在其他棋类游戏应用的主要瓶颈。考虑到不同棋类对AlphaZero模型中超参数的适应性差异,提出一种DQN-NCD超参数优化方法。该方法使用深度Q学习动态调控AlphaZero在蒙特卡罗树搜索(MCTS)执行时的模拟节点数量,以优化单次MCTS的模拟质量,加快残局阶段的自博弈数据生成。此外,将MCTS叶子深度及其标准差整合到决策模型输入以及奖励参考中,动态调整平衡参数[Cpuct]及噪声参数[α],优化胜利决策。实验结果表明,DQN-NCD AlphaZero的深度神经网络收敛效果优于原网络,MCTS的单次搜索深度加深了22.47%。DQN-NCD AlphaZero与原始AlphaZero在苏拉卡尔塔棋500局残局状态下,平均先手行棋净胜率为69.88%,平均后手行棋净胜率为57.29%,较原模型胜率有所提高。探讨了AlphaZero在残局游戏中的高效取胜策略的新思路。
    参考文献 | 相关文章 | 多维度评价
    11. 基于大语言模型的反馈纠正下机器人组装任务规划与实现
    禹鑫燚, 王崇超, 孙肖遥, 欧林林, 魏岩, 周利波
    计算机工程与应用    2026, 62 (10): 123-133.   DOI: 10.3778/j.issn.1002-8331.2503-0326
    摘要88)      PDF(pc) (7557KB)(110)    收藏
    针对拥有视觉能力的大语言模型(large language model,LLM)直接应用于多步骤自动化组装任务时,常存在的操作步骤规划错误和识别不正确等问题,提出一种引入反馈纠正的多模态提示集成的多步骤任务规划方法。提出一种基于对象特征的思维推理方法,使得LLM通过一步推理能够准确识别复杂对象,并通过多轮交互提示框架,进一步提高LLM对输入任务(组装说明书)的识别稳定性;设计了一种基于组装任务技能提示并融合CS-FOON的规划验证与反馈的机器人规划方法,实现准确、稳定的多步骤机器人自动组装任务规划。通过在Unity模拟环境中搭建多个组装任务场景,并利用机械臂进行组装操作来验证方法的有效性。实验结果表明,与其他基于大语言模型的规划方法相比,该框架使大语言模型在多个任务中的工具识别上达到98.7%的成功率,平均提升22.0个百分点;在任务规划上达到84.0%的成功率,平均提升45.0个百分点。
    参考文献 | 相关文章 | 多维度评价
    12. 聚类驱动交叉遗传算法的机器人路径规划
    常美玉, 王天昊, 邢轩瑀, 董华军
    计算机工程与应用    2026, 62 (11): 104-114.   DOI: 10.3778/j.issn.1002-8331.2512-0063
    摘要89)      PDF(pc) (2167KB)(67)    收藏
    传统遗传算法在机器人路径规划中面临诸多挑战,尤其在复杂静态环境中存在收敛速度慢、参数敏感性强、计算效率低及路径平滑性不足等问题,现有改进算法多聚焦单一性能指标优化,难以实现综合性能均衡提升。为此,提出一种聚类驱动交叉优化算法。引入A*算法生成启发式初始种群,提高全局搜索能力及效率;依据基因库思想,设计动态自适应进化参数调节机制实时调整种群状态,采用聚类驱动策略将种群分层,族内使用算术交叉,跨族使用模拟二进制交叉,同时实施局部扰动变异算子,在最优区域增强搜索多样性;采用三次B样条曲线对最终路径进行几何重构,显著提升路径平滑度。仿真实验表明,所提出的算法在大规模栅格地图中的综合性能:收敛速度、路径长度、计算效率、路径平滑性均体现出了有效性和优越性,为移动机器人在复杂静态环境中的全局路径规划提供了可靠的技术支撑。
    参考文献 | 相关文章 | 多维度评价
    13. 面向复杂多物体场景的实时抓取检测网络
    郭鹏程, 陈为
    计算机工程与应用    2026, 62 (11): 115-124.   DOI: 10.3778/j.issn.1002-8331.2512-0032
    摘要81)      PDF(pc) (4532KB)(65)    收藏
    针对复杂多物体场景下机器人抓取检测在精度和实时性之间的权衡困境,提出一种端到端双分支网络MT-FusionGrasp。该网络以FasterNet为共享主干,构建抓取检测与实例分割双任务并行结构。抓取分支引入大核选择性注意力机制(LSK)实现自适应感受野调整;分割分支嵌入边缘信息增强单元(EIEM),利用Sobel梯度先验强化几何边界特征。将分割特征图作为感兴趣区域调制抓取特征,提出跨任务特征融合模块(feat refine module,FRM),增强目标区域的空间一致性。实验结果表明,此网络模型在Cornell数据集上达到97.87%抓取准确率与73.5 FPS实时速度,在Jacquard数据集上取得93.59%准确率与71.6 FPS实时速度。与其他抓取检测方法相比,该网络能够在满足实时性要求的同时显著提升检测精度。
    参考文献 | 相关文章 | 多维度评价
    14. NRID-YOLO:基于改进YOLOv8的噪声污染下电力绝缘子识别方法
    徐浩, 应展烽, 葛昊
    计算机工程与应用    2026, 62 (11): 215-226.   DOI: 10.3778/j.issn.1002-8331.2507-0020
    摘要124)      PDF(pc) (3279KB)(95)    收藏
    针对噪声污染下绝缘子图像特征表达能力不足导致识别精度低、漏检误检率高和泛化能力弱等问题,提出了一种抗噪识别方法NRID-YOLO(noise robust insulator detector-YOLO)。使用提出的高斯模糊和拉普拉斯锐化自适应复合数据增强方案,降低噪声干扰并增强特征表达能力;结合WTConv(wavelet-Transform convolution)卷积单元集成C2f-WTConv模块,通过小波变换分解图像并针对性处理低频分量,减轻模型复杂度同时分离并强化绝缘子关键特征提取;提出一种ASPP(atrous spatial pyramid pooling)与CBAM(convolutional block attention module)后置融合模块,实现多尺度卷积融合提取特征,并自适应校准通道与空间注意力机制权重,避免模糊导致提取无效特征;引入基于非单调聚焦机制的WIoU损失函数,实时优化损失增益分配,同时结合基于遗传算法的超参数优化策略,提升小目标检测精度和模型鲁棒性。以公开绝缘子数据集为核心并在此基础上进行实验,结果表明,NRID-YOLO的平均精度、准确率和召回率指标达到69.5%、97.6%和85.4%,与基础模型及CDDCR-YOLOv8、YOLOv8xP等改进方法对比而言,均有不同程度提升,为噪声环境绝缘子目标识别提供了高精度解决方案。
    参考文献 | 相关文章 | 多维度评价
    15. 改进YOLOv13的红外遥感小目标检测算法
    李平, 陈继锋
    计算机工程与应用    2026, 62 (7): 131-142.   DOI: 10.3778/j.issn.1002-8331.2509-0101
    摘要264)      PDF(pc) (5813KB)(4121)    收藏
    为了有效应对红外遥感场景中小目标尺度较小、信噪比低且易被复杂背景淹没等挑战,对YOLOv13模型进行改进,实现实时性和轻量化的检测需求。通过构建多阶特征聚合模块(multi-level feature aggregation module, MFAM),自底向上汇聚不同语义深度与空间分辨率的层级信息,并自适应重标定其贡献,以缓解小目标在深层语义中被稀释的问题。设计了双路径融合金字塔网络(dual-path fusion pyramid network,DFPN),以互补的自顶向下语义增强路径与自底向上细节回流路径实现跨尺度信息循环交互,从而强化弱小热目标的可分性。提出的上下文感知融合模块(context-aware fusion block,CAFBlock)采用全局自注意力和局部深度卷积的双分支结构以协同建模长距离依赖与精细局部特征,同时结合膨胀卷积多感受野和深度卷积局部细节的双路径处理方式与门控融合机制,全面增强模型的多尺度上下文建模能力。在SIRST和HIT-UAV数据集上进行对比评估,改进模型实现了90.06%和64.37%的AP,分别提高了7.65个百分点和8.55个百分点,充分验证了模型的有效性和可行性。
    参考文献 | 相关文章 | 多维度评价
    16. Harmony-YOLO11:基于高频增强与特征引导的轻量级小目标检测算法
    孙中毅, 王栋, 曹国刚, 宗鸣
    计算机工程与应用    2026, 62 (10): 111-122.   DOI: 10.3778/j.issn.1002-8331.2509-0361
    摘要232)      PDF(pc) (2129KB)(283)    收藏
    无人机航拍图像的小目标检测面临尺度不平衡、可视化信息少、计算资源受限等挑战,同时现有的目标检测模型通常难以实现检测精度与模型复杂度之间的良好平衡。针对上述问题,提出一种基于YOLO11n的改进无人机航拍小目标检测算法Harmony-YOLO11。提出高频增强与跨尺度自适应模块(high-frequency enhancement and cross-scale adaptive module,HCM),通过强化小目标边缘、聚焦小目标区域以提升模型对小目标的适应能力;提出一种高效的特征引导金字塔网络(feature guide feature pyramid network,FG-FPN),其核心为创新设计的特征融合引导块(feature fusion guide block,FFGB),通过简化网络路径,实现轻量且高效的特征融合;C3K2_CCA基于CoordConv与CoordATT设计,增强了模型对小目标的空间感知能力;通过轻量级下采样模块MGC(maxpooling-ghost convolution)进一步降低模型复杂性。在VisDrone2019数据集上的实验表明,与YOLO11n相比,Harmony-YOLO11的mAP50和mAP50-95分别提高了5.10和3.12个百分点,同时参数量和模型大小分别减少了31%和25%。对TinyPerson数据集的进一步评估证实了该算法的泛化性和鲁棒性。
    参考文献 | 相关文章 | 多维度评价
    17. 机器视觉在农作物种子检测中的研究进展
    王昊, 祝玉华, 李智慧, 甄彤
    计算机工程与应用    2023, 59 (22): 69-83.   DOI: 10.3778/j.issn.1002-8331.2303-0166
    摘要429)      PDF(pc) (858KB)(705)    收藏
    农作物种子是农业生产的基础。种子检测作为一种重要的手段,在种子生产、贸易和利用的各个环节都扮演着不可或缺的角色。然而传统的农作物种子识别方法效率低,需要人力以及专业检测设备的支持。相比之下,机器视觉技术能够通过模拟人的视觉功能来实现对目标的无损检测,效率高、准确度高,有助于实现农作物种子的品种识别、分级、分类的自动化、智能化。首先简单叙述了机器视觉技术中图像采集、预处理的方法,并以玉米种子为例给出了目前主流的处理流程,然后具体叙述了机器视觉技术中传统机器学习和深度学习两种检测方式在农作物种子检测中的应用,最后针对玉米不完善粒的研究,在分为以上两种检测方式进行具体叙述的同时,指出了目前存在的问题以及玉米不完善粒检测未来的研究方向。
    参考文献 | 相关文章 | 多维度评价
    18. 深度学习在网络入侵检测中的研究综述
    赵鹏, 王海凤, 刘英华, 张舒琦, 赵昕晟, 池志宏
    计算机工程与应用    2026, 62 (10): 74-88.   DOI: 10.3778/j.issn.1002-8331.2510-0117
    摘要110)      PDF(pc) (772KB)(119)    收藏
    入侵检测系统等安全保护机制在保障网络空间安全、抵御恶意攻击方面发挥着关键作用。近年来,深度学习技术凭借强大的特征自动提取与复杂模式学习能力,在网络入侵检测领域得到了广泛应用并展现出显著优势。通过对该领域内最新研究文献的系统梳理与调研,详细介绍了基于深度学习的网络入侵检测技术的研究进展与应用现状。具体而言,阐述了入侵检测系统的研究背景与基本分类体系;系统性地归纳和评述了适用于网络入侵检测的主流与前沿深度学习模型,如循环神经网络及其变体、自编码器、卷积神经网络、生成对抗网络,以及Transformer、图卷积神经网络等新兴模型;分析了深度学习驱动的入侵检测系统在车载网络、无人机网络、智能电网、物联网和软件定义网络等多个特定应用场景中的部署、适配情况及挑战;在现有研究基础上,对该领域当前面临的数据质量与不平衡问题、高维数据处理、实时性要求等关键挑战进行了探讨,并对未来发展趋势进行了展望。
    参考文献 | 相关文章 | 多维度评价
    19. 深度学习在音乐生成中的研究与应用综述
    赵明园, 周若华, 袁庆升, 周祉彤
    计算机工程与应用    2026, 62 (10): 1-25.   DOI: 10.3778/j.issn.1002-8331.2505-0135
    摘要191)      PDF(pc) (2110KB)(259)    收藏
    音乐生成是人工智能与计算机科学的重要交叉研究方向,近年来随着深度学习技术的突破,音乐生成取得了显著进展。对深度学习在音乐生成领域的研究与应用进行了系统性综述。将音乐的表示形式归纳为符号表示、音频表示和多模态表示三类;概述了LSTM、VAE、GAN、Transformer和扩散模型等主流深度生成模型的架构特点与性能对比;根据生成需求将音乐生成任务细分为符号音乐生成、音频音乐生成和人声音乐生成三类,并分别梳理了各类任务中的代表性方法与关键技术进展;在此基础上,归纳总结了适用于不同生成任务的常用数据集及主客观评价指标体系,并通过实验数据对比分析了代表性模型的性能表现;探讨了当前音乐生成面临的主要挑战,包括音乐信息建模困难、数据稀缺、评估体系不统一以及伦理与商业化问题,并对未来在音乐教学、心理治疗等领域的应用前景进行了展望。
    参考文献 | 相关文章 | 多维度评价
    20. 跨模态特征一致性对齐下的多模态情感分析
    崔文成, 孙佳惠, 邵虹
    计算机工程与应用    2026, 62 (11): 140-150.   DOI: 10.3778/j.issn.1002-8331.2504-0159
    摘要103)      PDF(pc) (1670KB)(56)    收藏
    当前基于多模态数据的情感分析方法在特征建模和模态协同交互方面取得了显著进展,但仍存在特征提取不够充分、模态间语义对齐不足等问题,容易导致冗余信息增加与跨模态交互受限。为此,提出一种基于跨模态特征一致性对齐的多模态情感分析方法。根据各模态数据的特性,设计三分支特征提取子网络,分别对文本、视觉和听觉模态进行深层次表示建模。为减缓模态不一致对融合效果的影响,构建跨模态特征一致性对齐模块,并引入中间层监督机制以提升对齐质量。提出跨模态Transformer融合模块,实现多模态间深层次的语义交互与情感融合建模。在CMU-MOSI与CMU-MOSEI数据集上开展了七分类实验,准确率分别提升了3.7与6.4个百分点,验证了所提模型在多模态情感识别任务中的有效性与鲁棒性。
    参考文献 | 相关文章 | 多维度评价
    21. 嵌入式软件接口测试数据生成综述
    陈冉, 史涯晴, 黄松
    计算机工程与应用    2026, 62 (11): 90-103.   DOI: 10.3778/j.issn.1002-8331.2511-0253
    摘要98)      PDF(pc) (918KB)(51)    收藏
    随着嵌入式系统在关键领域的深度应用,嵌入式软件接口测试因硬件与软件深度耦合、严苛实时性约束及设备资源受限等特性,面临区别于通用软件测试的独特挑战。通过系统性文献综述,明确嵌入式软件接口测试的定义与范畴,梳理嵌入式软件接口的类型及核心协议特性,分析其测试流程与通用软件接口测试的差异;进而聚焦嵌入式软件接口测试技术演进,总结自动化测试框架、测试环境创新及特定场景测试策略的研究现状;重点剖析测试数据生成这一核心环节,对比基于模型、基于程序分析、基于搜索启发式等方法的优缺点与适用场景。
    参考文献 | 相关文章 | 多维度评价
    22. 未知环境下基于雷视融合的同步定位构图与路径规划算法
    窦洛文, 高扬, 何朝洪, 吕安, 丁访鹏
    计算机工程与应用    2026, 62 (8): 156-167.   DOI: 10.3778/j.issn.1002-8331.2508-0040
    摘要90)      PDF(pc) (3791KB)(64)    收藏
    同步定位构图(simultaneous localization and mapping,SLAM)与路径规划是移动机器人的关键技术,已有研究通常将二者分别考虑,未知环境中机器人通常需要先扫描建图再路径规划,影响导航效率。提出基于雷视融合的同步定位构图与路径规划算法LVISLAM_LTA*(lidar visual inertial SLAM_local target A-star),将建图、定位、路径规划进行同步提升未知环境中的导航效率,其中包括了一种雷视融合算法IP_FusionNet(intelligent perception with fusion-driven adaptive network)以获得大范围立体视觉信息。引入可行驶区域检测模块,为后续路径规划算法提供可行驶区域并且提升其计算效率,通过点云拼接、栅格化处理形成可行区域栅格图。提出基于局部子目标的路径规划算法,通过快速在线规划实现同步进行。基于KITTI数据集和自建数据集上结果均表明,该算法有效结合同步定位构图与路径规划算法,对比经典的SLAM算法具有定位精度更高,定位误差平均缩短24%,构建出的稠密语义地图能够全面清晰地描述移动机器人实验场景的三维结构的特点,并且具有高效的路径规划能力,相较于传统算法平均耗时缩短72.9%。
    参考文献 | 相关文章 | 多维度评价
    23. 基于SVM-RFE算法的凋亡蛋白亚细胞定位预测
    刘太岗,王春华
    计算机工程与应用    2017, 53 (10): 155-159.   DOI: 10.3778/j.issn.1002-8331.1512-0276
    摘要574)      PDF(pc) (572KB)(932)    收藏
    获取凋亡蛋白亚细胞定位的信息对揭示细胞程序性死亡的机制和注解蛋白质功能都具有非常重要的意义。鉴于实验方法确定亚细胞定位不仅费时费力而且代价过高,开发快速有效的计算方法预测亚细胞定位已成为生物信息学领域的重要研究内容之一。首先基于位置特异性得分矩阵提取氨基酸组分、二肽组分和自协方差变量等特征构建蛋白质序列的特征表示模型,然后采用递归特征消除法进行特征选择,最后选用支持向量机分类器在两个常用数据集上进行夹克刀检验。实验结果表明,该方法优于大多数已报道的预测方法,从而证明了其有效性。
    相关文章 | 多维度评价
    24. 考虑跨空间特征重构的行人过街动作检测方法
    陈思宇, 何永福, 谢世维, 张浩池
    计算机工程与应用    2026, 62 (11): 272-283.   DOI: 10.3778/j.issn.1002-8331.2503-0216
    摘要62)      PDF(pc) (2107KB)(25)    收藏
    行人是弱势交通参与者,其危险过街动作是引发事故的重要原因之一,行人过街动作检测有助于减少人车冲突。针对路侧视角下行人多尺度、遮挡导致的动作特征提取困难、特征融合低效、特征信息丢失问题,提出一种考虑跨空间特征重构的行人过街动作检测方法(pedestrian’s crossing behavior detection network based on cross-spatial feature reconstruction,PCBDNet)。骨干网络采用跨空间并行子网特征结构,增强网络对多尺度行人特征的学习能力。颈部网络使用空间和通道重构卷积模块融合特征,减少冗余计算并提高行人动作特征的学习能力;构建特征增强器以分离特征并进行跨空间重构,减少遮挡带来的信息丢失。头部网络采用排斥损失优化坐标损失函数,进一步提高遮挡目标检测精度。实验表明PCBDNet的mAP@0.5达到89.6%,mAP@[0.5:0.95]达到72.4%,模型大小适中,FPS保持较高;特征可视化实验表明,PCBDNet对行人过街动作关注度较高,为提升降低交通事故风险提供了新的解决方案。
    参考文献 | 相关文章 | 多维度评价
    25. 基于小波多频特征融合增强的小样本植物图像分类
    赵晓, 贠潇洒, 刘睿玲, 章为川
    计算机工程与应用    2026, 62 (11): 284-294.   DOI: 10.3778/j.issn.1002-8331.2503-0250
    摘要76)      PDF(pc) (1325KB)(45)    收藏
    现有的小样本植物图像分类算法仅侧重于空间域特征的提取,对于整体特征提取不够全面。同时数据集类不平衡问题在训练中往往会导致模型性能显著下降,在小样本学习设置下极易发生过拟合现象。针对以上问题,提出一种新颖的小波多频特征融合增强的交叉重构网络,用于小样本植物图像分类。通过注意力机制优化骨干网络提取到的基础特征,并引入小波变换提取多频率域特征,以捕捉细节信息;提出双域特征选择融合模块深度融合空间域特征与频率域特征,通过特征选择机制进行校准,有效整合两种特征域,实现优势互补;使用联合损失优化函数和特征空间局部随机遮挡正则化来缓解类不平衡问题,增强泛化能力。在Flowers和Plant Disease两个植物细粒度数据集上将所提方法与现有方法进行实验对比,在Conv-4骨干网络下5-way 5-shot任务的准确率可分别达到93.23%和88.92%。为了进一步验证算法的泛化能力和鲁棒性,在CUB-200-2011和Stanford Cars两个跨域基准数据集上进行广泛实验评估。综合实验结果表明,该方法的分类性能优于目前先进的小样本图像分类方法。
    参考文献 | 相关文章 | 多维度评价
    26. 双知识蒸馏结合多尺度特征学习的图像分类Transformer模型
    崔学英, 樊如龙, 靳黎忠, 上官宏, 张雄
    计算机工程与应用    2026, 62 (11): 227-238.   DOI: 10.3778/j.issn.1002-8331.2503-0119
    摘要95)      PDF(pc) (1410KB)(43)    收藏
    异构知识蒸馏技术能够有效提高Transformer模型的分类性能,然而缺乏对图像的多尺度信息的考虑,使得Transformer模型特征提取能力有限,数据的利用效率低。为此,提出一种双知识蒸馏与多尺度特征学习结合的Transformer模型。为实现更好的蒸馏效果,设计了一种双知识蒸馏策略,教师模型通过双蒸馏token把知识传递给两个不同尺度的学生Transformer模型,使学生模型获得更全面的教师信息。构建了一种有效的交互注意力模块,以交换不同尺度学生模型之间信息,增强学生模型的多尺度感知能力,使得Transformer模型即使在小规模数据上也能达到较好的分类效果。与卷积神经网络模型和Transformer模型相比,提出的方法在CIFAR-100数据集上均取得了最优的分类结果。在CIFAR-10和Imagenet-1k上也表现出较好的泛化能力。
    参考文献 | 相关文章 | 多维度评价
    27. 结合异构图注意力机制联合编码的情感原因对抽取
    刘雨欣, 谢珺, 陈桂军, 郝戍峰, 杨文秀
    计算机工程与应用    2026, 62 (10): 148-159.   DOI: 10.3778/j.issn.1002-8331.2502-0212
    摘要61)      PDF(pc) (1685KB)(61)    收藏
    针对以往情感原因对抽取任务中无法有效编码情感特征和原因特征之间的相关性,且同构图卷积网络难以有效处理复杂因果关系等问题,提出一种结合异构图注意力机制联合编码的情感原因对抽取模型(joint encoding with heterogeneous graph attention mechanism for emotion cause pair extraction,HGAT-ECPE)。该方法利用BERT捕获子句内词语之间的上下文依赖特征;利用Bi-LSTM和交互注意力机制构建情感原因编码器(emotion cause encoder,EC Encoder),联合学习情感特征和原因特征;构建异构图并建立异构图注意力机制(heterogeneous graph attention mechanism,HGAT),建模多类型节点之间的关系,从而更好地捕捉复杂因果关系。模型在中文情感原因对标准数据集上进行实验,实验结果显示,相比基准模型,所提出的模型在情感原因对抽取任务的评估指标F1值平均提升约2.65%,在原因子句抽取任务的评估指标F1值上平均提升5.18%,在情感子句抽取的评估指标P值上平均提升3.38%。
    参考文献 | 相关文章 | 多维度评价
    28. 频域-空间域特征融合的SAR图像建筑物提取网络
    李英健, 李健昊, 师皓, 陈亮
    计算机工程与应用    2026, 62 (11): 207-214.   DOI: 10.3778/j.issn.1002-8331.2504-0316
    摘要75)      PDF(pc) (1736KB)(30)    收藏
    合成孔径雷达(SAR)不受天气和光照条件的限制,能够在云雾、雨雪等恶劣条件下正常工作,这种全天候、全天时的特性使其在建筑物提取领域具有重要应用价值。但由于其特殊的成像机制,存在散斑噪声影响SAR图像建筑物提取效果。同时,建筑物目标尺度差异大、易受复杂背景干扰的问题在SAR图像中仍然存在。在这项研究中,提出了一个频率-空间域特征融合的SAR图像建筑物提取网络,利用频域特征进行去噪,增强与空间域特征的联合表征。该网络通过频率特征提取模块提取不同尺度的低、高频频率特征,增强对不同尺度目标特征的提取能力;根据低、高频所对应的不同空间域特性将其与空间域特征融合,以增强所提取建筑物主体完整性,减弱噪声及背景影响。在SpaceNet6数据集上进行了比较实验,所提出模型比常见建筑提取模型显示出更好的性能,SAR图像建筑物提取IoU达到75.22%。
    参考文献 | 相关文章 | 多维度评价
    29. 改进YOLOv5的小目标检测算法
    俞军, 贾银山
    计算机工程与应用    2023, 59 (12): 201-207.   DOI: 10.3778/j.issn.1002-8331.2302-0157
    摘要560)      PDF(pc) (566KB)(389)    收藏
    虽然现在的深度学习技术在大中目标检测领域取得了惊人的进步,但是由于小目标的尺寸有限以及卷积网络的局限性,导致小目标检测仍然是一个具有挑战性的问题。通过改进YOLOv5算法,提出了一种针对小目标的YOLO-S模型。在原来三层输出层的基础上,利用级联网络,添加一个专门针对于小目标检测的输出层。为了补充上下文信息以及抑制多尺度特征融合冲突,设计了一种新的上下文信息提取模块CFM(Context Feature Module)以及基于通道和空间特征细化的模块FSM(feature specify module)。上采样方式由原来的最邻近插值替换为新设计的Transpose模块,可以将信息最大化恢复。数据集采用专门针对于小目标的VisDrone2019来验证算法的有效性。实验结果表明,YOLO-S比YOLOv5的mAP@0.5提高了6.9个百分点。
    参考文献 | 相关文章 | 多维度评价
    30. 图卷积与自适应标准化并行引导的水下图像增强
    陈清江, 亢淑洁
    计算机工程与应用    2026, 62 (11): 250-258.   DOI: 10.3778/j.issn.1002-8331.2503-0171
    摘要66)      PDF(pc) (9569KB)(26)    收藏
    水下图像增强算法在考古学、海洋探测和水下机器人等领域有着广泛的应用,针对水下图像因水体吸收和散射而导致的清晰度下降、颜色失真等问题,构建一种融合图卷积分支与自适应标准化分支的水下图像增强网络。该网络将水下图像的斑块作为图结构,利用视觉图神经网络精准捕捉图像像素间复杂关系的优势,增强水下图像的结构信息;自适应标准化分支通过两个挤压、激励块,解决水下图像中扭曲及颜色失真等问题;此外,为弥补网络在提取图像细节信息方面的不足,添加局部多尺度信息融合分支。实验结果表明,所提出的算法在PSNR(peak signal-to-noise ratio)评价指标上高于目前先进方法3.6%,在主观评价和客观评价方面都取得了显著的提升。
    参考文献 | 相关文章 | 多维度评价
    31. MCT-YOLO:航拍视角下小目标检测算法
    周忠锟, 张扬, 张宇, 孟可, 元赵阳
    计算机工程与应用    2026, 62 (8): 130-141.   DOI: 10.3778/j.issn.1002-8331.2509-0032
    摘要172)      PDF(pc) (2760KB)(147)    收藏
    针对智能交通场景,辅助无人机检测图像目标呈现小尺度、低分辨率、高密度分布等特点造成检测精度低的问题,提出了一种改进YOLOv11n的航拍视角下小目标检测算法:MCT-YOLO。优化检测层结构,针对性地添加极小目标检测头,剔除大目标检测头,捕捉更多局部信息,降低特征干扰,以适应小目标检测任务;提出多频交互下采样MFID(multi-frequency interactive downsampling),减少下采样过程中的特征丢失,保留更多图像信息;引入MobiVari结构,构建C3k2_MV模块,进行深度特征提取,增强细节特征表达;设计一种多尺度信息融合方式TCF(triple complementary fusion),通过融合不同语义的上下文信息,实现语义与细节信息互补,提升小目标检测能力。所提算法在VisDrone2019-DET数据集上的mAP50、mAP50-95达到了40.9%、25.0%,较基准网络YOLOv11n分别提高了7.7、5.8个百分点;同时算法的参数量也有所降低,减少了7.6%,适用于无人机航拍视角下的小目标检测场景。
    参考文献 | 相关文章 | 多维度评价
    32. 基于BWO-VMD-ISSA-LSTM的交通运输业碳排放预测研究
    王庆荣, 王俊杰, 朱昌锋, 张金鹏, 何润田, 刘心康
    计算机工程与应用    2026, 62 (10): 376-388.   DOI: 10.3778/j.issn.1002-8331.2503-0309
    摘要83)      PDF(pc) (2747KB)(47)    收藏
    针对交通运输业碳排放量的非线性影响预测精度的问题,提出了一种结合白鲸优化算法(beluga whale optimization,BWO)、变分模态分解(variational mode decomposition,VMD)、改进麻雀搜索算法(improved sparrow search algorithm,ISSA)及LSTM的碳排放预测模型。引入最大互信息系数(maximum information coefficient,MIC)提取影响碳排放量的主要因素,剔除冗余特征。利用BWO对VMD的分解模态数和惩罚因子寻优,增强两参数间的协调性,进而将碳排放量分解为不同频率的模态分量和剩余分量,削弱原始碳排放量的非线性;通过在LSTM的输入端嵌入特征注意力机制(feature attention mechanism,FA),突出关键输入特征。引入基于改进Tent混沌映射、动态步长权重因子、混合变异算子和精英反向学习的混合策略改进SSA算法,避免算法陷入局部最优。对各模态分量分别构建基于ISSA-LSTM的预测模型,并对预测结果进行集成。采用中国交通运输业1990—2019年的碳排放数据对模型进行验证,结果表明,所提模型较最优对比模型的RMSE、MAE和MAPE分别降低了26.28%、31.64%和33.32%,能够有效地预测交通运输业碳排放量。
    参考文献 | 相关文章 | 多维度评价
    33. 大模型辅助的强化学习奖励设计方法研究综述
    曹育箐, 陈希亮, 董浩洋, 周鑫, 孙鸣蔚
    计算机工程与应用    2026, 62 (9): 83-107.   DOI: 10.3778/j.issn.1002-8331.2509-0180
    摘要125)      PDF(pc) (1374KB)(99)    收藏
    奖励设计是强化学习中的核心挑战,传统方法依赖专家手工设计,存在主观性强、难以表达复杂目标、易导致奖励黑客与稀疏奖励等问题。大模型凭借其强大的语义理解、任务分解与代码生成能力,实现了从“人类意图”到“可执行奖励函数”的端到端自动化映射,显著降低了奖励设计门槛,突破了传统方法依赖专家知识、目标表达歧义的瓶颈。系统综述了大模型辅助强化学习奖励设计的研究进展。阐述了强化学习基础框架与奖励设计挑战,剖析大模型辅助的内在机理与价值;梳理传统奖励设计方法局限,构建“奖励初始化器-奖励迭代器”分类框架,并详细阐述了各类方法的代表性工作、机制与适用场景;从“模型-方法-系统”三个层级总结了当前研究在模型可靠性、交互效率与工程安全方面面临的关键挑战,并提出了相应的技术路径。
    参考文献 | 相关文章 | 多维度评价
    34. 基于大型语言模型的检索增强生成综述
    刘雪颖, 云静, 李博, 史晓国, 张钰莹
    计算机工程与应用    2025, 61 (13): 1-25.   DOI: 10.3778/j.issn.1002-8331.2410-0088
    摘要1045)      PDF(pc) (1412KB)(701)    收藏
    最近,智能体代理能在复杂任务中提供高效的解决方案,在工业界备受关注。作为智能体代理的常见范式之一,检索增强生成(retrieval-augmented generation,RAG)旨在结合信息检索和内容生成技术增强生成响应质量,已逐步成为研究的重点。在对国内外检索增强生成方法研究的基础上,阐述了RAG的基本概念及工作流程,归纳了技术现状,分析了现有RAG技术的优缺点,梳理了现有评估指标、数据集和基准。最后探讨了RAG技术在未来应用场景下所面临的挑战,并展望了其未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    35. 基于多模态融合的无人机识别研究综述
    李旻姝, 周莫涵, 支瑞聪
    计算机工程与应用    2025, 61 (21): 1-14.   DOI: 10.3778/j.issn.1002-8331.2501-0014
    摘要911)      PDF(pc) (17525KB)(803)    收藏
    随着无人机技术的迅速发展,在相关技术应用越来越多的同时也带来了许多安全隐患和监管难题。反无人机检测技术作为应对这些挑战的重要手段,受到了广泛的关注。传统的无人机检测方法依赖于单一的模态数据,例如视觉、音频、雷达及射频信号等,但这些单一模态数据在复杂场景下所获取的信息有限。近年来,深度学习方法在小目标检测领域取得良好进展,同时多模态融合技术的相关研究也使目标检测的精度和鲁棒性得到进一步的提升。综述了无人机检测领域的研究进展,重点梳理了多模态融合技术的研究现状;此外,整理了相关无人机检测的评价指标和公开数据集,分析了现有技术的局限性,并指出了未来提升检测精度与鲁棒性的研究方向。
    参考文献 | 相关文章 | 多维度评价
    36. 多维层次语义蒸馏引导下的深度学习模型压缩方法
    陈碧霞, 林清华, 李佐勇, 唐郑熠, 曾坤, 洪茂雄
    计算机工程与应用    2026, 62 (11): 173-184.   DOI: 10.3778/j.issn.1002-8331.2503-0286
    摘要69)      PDF(pc) (2003KB)(27)    收藏
    随着深度学习模型的参数量和计算复杂度不断增加,知识蒸馏作为一种高效的模型压缩技术得到了广泛应用。然而,现有的知识蒸馏方法中教师模型与学生模型在特征空间和学习能力上的不匹配问题限制了知识的准确传递。针对此问题,提出了一种多维层次语义蒸馏方法(MDHSD)。该方法从教师模型的深层特征空间中提取高阶语义表征,以增强学生模型对丰富知识的捕获能力。通过构建类间级、类内级和类预测级的多层次语义监督机制,进一步优化知识传递过程。引入中间教师助理模型,旨在缓解教师模型与学生模型在容量和表达能力上的差异。在CIFAR-100和Tiny-ImageNet数据集上的实验结果表明,与FT知识蒸馏方法相比,MDHSD方法在RepVGG模型压缩70.45%参数量的情况下,分类精度提升了5.75个百分点。
    参考文献 | 相关文章 | 多维度评价
    37. 面向交通流量预测的时空前缀微调大语言模型框架
    崔鸿飞, 周强, 顾晶晶, 刘钰婷, 史国梁, 童旭东
    计算机工程与应用    2026, 62 (11): 196-206.   DOI: 10.3778/j.issn.1002-8331.2504-0066
    摘要85)      PDF(pc) (1018KB)(36)    收藏
    交通流量预测是智能交通系统建设的关键,也是建设智慧城市的重要一环。随着预训练大语言模型(large language model,LLM)的发展,采用预训练LLM微调方法已成为交通流量预测中复杂时空依赖建模的全新范式。然而,现有的注意力冻结微调方法在将以自然语言数据预训练的LLM用于交通流量数据上存在局限,难以有效建模交通节点间的多维空间交互关系。如何在保留预训练知识的情况下进行合理的时空数据表征,将LLM对自然语言的处理能力对齐到多维时空数据上,是将LLM应用于交通流量预测的核心问题。为此,提出了面向交通流量预测的时空前缀微调大语言模型框架(spatiotemporal prefix tuning large language model,STPLM),利用空间前缀微调模块与模式嵌入方法,增强LLM建模多维动态时空信息的能力。其中,空间前缀微调模块将直接特征前缀与间接特征前缀融合,在保留预训练LLM中知识抽取能力的前提下将预训练LLM中的自然语言信息与时空信息对齐,并为LLM注入了动态空间信息作为先验知识,增强了LLM预测的精准度。模式嵌入方法通过索引式的嵌入进一步增强了LLM处理多维空间数据的能力。在真实的数据集上进行了广泛的实验,结果表明STPLM在预测精度上优于现有基线算法,并通过充分的消融实验以及对关键参数的讨论,证明了STPLM关键模块的有效性。
    参考文献 | 相关文章 | 多维度评价
    38. 融合边缘增强和耦合注意力机制的远距离小目标检测模型
    尹诗雨, 杨奇鸿, 高光磊, 张慧杰, 杨东宽, 穆继亮, 丑修建
    计算机工程与应用    2026, 62 (9): 293-306.   DOI: 10.3778/j.issn.1002-8331.2507-0241
    摘要108)      PDF(pc) (4780KB)(93)    收藏
    作为计算机视觉领域的一个重要研究方向,目标检测技术已在众多应用场景中得到广泛应用。然而,在远距离场景中面临低分辨率导致边缘特征模糊、表征难等挑战。因此,提出一种融合边缘增强和耦合注意力机制的远距离小目标检测模型(ECM)。构建自适应边缘信息增强模块(AEIE),通过自适应增强策略分离并突出边缘信息,并与语义特征互补融合,有效解决了目标边缘信息丢失问题。为增强模型对目标关键区域的特征响应,设计了耦合注意力机制(CAM),采用链式引导特征传递机制定向引导特征优化,实现判别性特征表征能力的渐进式提升。为强化小目标特征表征能力,提出了多尺度特征增强与融合方法(MFEF),最大程度上保留富含浅层-中层、中层-深层及浅层-深层的原始特征,将空间细节与语义信息充分融合,提升了模型对小目标识别效果。实验结果表明,ECM相较于基准RT-DETR,在VisDrone2019数据集上mAP50、AP和APS分别提高了3、2.3和2.4个百分点,在TinyPerson数据集上F1-Score提高了2.3个百分点,并且在与其他先进模型的对比中也展现出显著的优势。
    参考文献 | 相关文章 | 多维度评价
    39. 增强边缘特征的肺结节分割模型
    程照雪, 李阳, 周妍, 鲁慧民
    计算机工程与应用    2023, 59 (24): 185-195.   DOI: 10.3778/j.issn.1002-8331.2207-0027
    摘要152)      PDF(pc) (858KB)(79)    收藏
    针对在肺结节分割过程中结节边缘像素点模糊导致模型分割精度低的问题,提出一种用于增强边缘特征的对称双分支结构分割模型GEU-Net(Gabor edge U-Net)。其主干分支使用U-Net来捕获结节整体视觉特征以及全局上下文信息,边缘分支则设计Gabor卷积模块提取结节边缘纹理特征,并通过跳跃连接对主干分支与边缘分支编码器提取到的特征进行融合。此外,提出一种融合交叉熵和Focal Loss的混合损失函数,用于解决两个分支在训练过程中存在的正负类样本不均衡问题。在公开数据集LIDC-IDRI以及LNDb上进行了结节分割实验,实验结果表明,GEU-Net分割模型在两个数据集上的Dice系数分别为92.79%和86.78%、平均交并比分别为87.53%和79.09%、召回率则分别为94.35%和87.43%,与基线算法相比分割性能得到了一定程度的改善。
    参考文献 | 相关文章 | 多维度评价
    40. 大语言模型微调技术的研究综述
    张钦彤, 王昱超, 王鹤羲, 王俊鑫, 陈海
    计算机工程与应用    2024, 60 (17): 17-33.   DOI: 10.3778/j.issn.1002-8331.2312-0035
    摘要637)      PDF(pc) (6335KB)(482)    收藏
    大型语言模型的崛起是深度学习领域的全新里程碑,而微调技术在优化模型性能方面的起到了关键作用。对大型语言模型微调技术进行了全面的综述,回顾了语言模型的统计语言模型、神经网络语言模型、预训练语言模型和大语言模型四个阶段的发展历程和微调技术的基本概念,从经典参数微调、高效参数微调、提示微调和强化学习微调方法四大部分,探讨总结了各微调技术的原理与发展,并进行了一定的对比分析。最后,总结了当前微调技术的研究状况与发展重点,强调了该领域的潜在研究价值,并展望了未来的发展方向。
    参考文献 | 相关文章 | 多维度评价