计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (13): 158-164.DOI: 10.3778/j.issn.1002-8331.1803-0438
刘 鸿,陈晓红,张恩豪
LIU Hong, CHEN Xiaohong, ZHANG Enhao
摘要: 度量学习通过更真实的刻画样本之间的距离,来提高分类和聚类的精度。GMML(Geometric Mean Metric Learning)在学习度量矩阵[A]时,使得在该度量下同类点之间的距离尽可能小,不同类点之间的距离尽可能大。GMML用来学习的训练样本均为目标类数据,而对于现实存在的为数众多的同领域非目标类数据,即Universum数据并未加以利用,不免造成信息的浪费,针对此,提出一种新的度量学习算法——融入Universum学习的GMML(U-GMML)。U-GMML期望得到一个新的度量矩阵[A],使得同类点之间的距离尽可能小,不同类点之间的距离尽可能大,且Universum数据与目标类数据的距离尽可能大,从而使得所学习的度量矩阵[A]更有利于分类。真实数据集上的实验结果验证了该算法的有效性。