计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (21): 212-216.DOI: 10.3778/j.issn.1002-8331.2008.21.058
刘 娜1,2,唐焕玲1,3,鲁明羽1
LIU Na1,2,TANG Huan-ling1,3,LU Ming-yu1
摘要: 文本分割是信息检索的一个重要问题。文本分割是指在一个书面文档或语音序列中自动识别具有独立意义的单元(片段)之间的边界,其分割对象可以是书面的、语音的或者动态的文本。文本线性分割的主要目的是找出主题边界,它对于很多自然语言处理如自动文摘、问答系统等来说具有重要的价值。在大量文献的基础上,总结归纳文本线性分割中的主要方法,并提出未来的研究方向。