计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (15): 149-154.DOI: 10.3778/j.issn.1002-8331.1611-0129
夏玉果1,戴红霞1,顾明亮2
XIA Yuguo1, DAI Hongxia1, GU Mingliang2
摘要: 为了解决方言辨识系统中训练样本冗余的问题,提出了一种融合多样性测度的汉语方言主动辨识方法。利用SVM分类器选取不确定性的样本。根据样本间分布情况的测度算法,选取出兼具多样性的训练样本,经过多次迭代将这些最具区别性的样本组成训练集。将此训练集重新输入到SVM进行分类辨识。实验结果表明,该方法能有效克服选取样本的冗余,与传统的主动学习方法相比,在同等识别率的情况下,人工标注样本的数量减少了50%。