计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (28): 168-173.
王雅莉,古丽拉·阿东别克
WANG Yali, Gulila·Altenbek
摘要: 以哈萨克语通用词汇自动提取为目标,在传统的词语领域使用度的基础上运用改进的词语领域通用度公式进行哈语词汇通用度的计算,使改进的公式对哈语通用词汇的排序位置有更大的影响。基于通用词汇的三大特征:领域通用性、地域通用性、时间通用性,采用统计的方法考察哈语词汇的通用程度,在哈语词频统计的基础上实现了哈语词汇的通用度统计。实验结果表明改进的词语领域通用度计算公式在提取哈语通用词汇时对词语排序位置的影响力度比传统的词语领域使用度计算公式更大。