摘要: 向量空间模型(VSM)是一种常用的文本特征表示方法,它是基于特征独立性假设建立起来的,将文本看成是由一个个独立的词所构成,这些词之间互不关联,这种方法丢失了文本中词间的一些重要的关联特征信息。基于双词关联的文本特征选择模型是在VSM的基础上,选择文本中相邻的单词之间的关联信息也作为文本特征,从而能更加充分地表达文本的特征信息。实验表明,这是一种更加有效的文本特征选择方法。
高茂庭 王正欧. 一种基于双词关联的文本特征选择模型[J]. 计算机工程与应用, 2007, 43(10): 183-185.
MaoTing Gao ZhengOu Wang. A New Model for Text Feature Selection based on Twin Words Relationship[J]. Computer Engineering and Applications, 2007, 43(10): 183-185.