计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (14): 151-157.DOI: 10.3778/j.issn.1002-8331.2205-0385
姚光乐,祝钧桃,周文龙,张贵宇,张伟,张谦
YAO Guangle, ZHU Juntao, ZHOU Wenlong, ZHANG Guiyu, ZHANG Wei, ZHANG Qian
摘要: 关注了一个非常具有挑战性的问题:深度神经网络的小样本类增量学习。其中深度神经网络模型可以从少量的样本中逐步学习新知识,同时不会忘记已学习的旧知识。为了平衡模型对旧知识的记忆和对新知识的学习,提出了一个基于特征分布学习的小样本类增量学习方法。在基类上学习模型以获得一个性能良好的特征提取器,并使用每类的特征分布信息来表示知识。将已学习的知识与新类的特征一起映射到一个新的低维子空间中,以统一地回顾旧知识与学习新知识。在子空间内,还为每个新类生成了分类权值初始化,以提高模型对新类的适应性。大量实验表明,该方法可以有效地减轻模型对已学习知识的遗忘,同时提高模型对新知识的适应性。