计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (9): 233-239.DOI: 10.3778/j.issn.1002-8331.2007-0035
徐承志,万方
XU Chengzhi, WAN Fang
摘要:
流形学习是一类特殊的非线性求解问题,即从高维采样数据中恢复低维流形结构,以达到维数约简的目的,是模式识别与数据可视化中的重要方法。流形学习存在许多基于局部线性假设的数值解法,即显示地定义局部线性映射模型再进行全局优化,这些方法对于流形的形状、采样的方式都比较敏感。另一种非线性求解工具,神经网络,因为不依赖于具体数学模型,理论上具有较好的鲁棒性,但是流形学习的特殊非线性,使得传统神经网络很难达到满意的效果。针对上述问题,改进了一种同质双通道神经网络——孪生网络,并应用于流形学习。针对孪生网络的两条通道,设计了三重结构,即升维层、过滤层和降维层,同时基于两级邻域的概念,提出了包含正、负样本对的损失函数,再经过“样本对”的训练,实现了邻近数据的空间关系在降维后依然得以保持。通过将孪生网络用于仿真数据(Swiss roll)的降维,并与传统方法进行比较,发现孪生网络可以更真实地还原高维流形的内在结构。同时,将孪生网络用于真实数据(handwritten digits)的二维可视化,并与传统方法进行比较,发现孪生网络聚类效果同样明显,并且类别分布更为均匀,边界更易辨识。