计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (30): 150-152.DOI: 10.3778/j.issn.1002-8331.2008.30.046
• 数据库、信号与信息处理 • 上一篇 下一篇
肖 洪,薛德军
收稿日期:
修回日期:
出版日期:
发布日期:
通讯作者:
XIAO Hong,XUE De-jun
Received:
Revised:
Online:
Published:
Contact:
摘要: 探讨了从海量文献中挖掘知识元的背景,并详述了从海量年鉴文本中抽取宏观数值知识元的基本流程和各主要环节的算法,并重点对数值知识元主体抽取的效果进行了分析,实验结果表明在特定领域内知识元挖掘要达到实用水平是可行的。
关键词: 真实文本, 文本挖掘, 数值知识元, 自动编辑
Abstract: This paper discusses the necessity of the knowledge element mining,then describes in detail the base process and algorithms of main steps of extraction numeric knowledge elements from China yearbook full-text database,and then specially analyzes the extraction quality.
Key words: realistic corpora, text mining, numeric knowledge element, automated editing
肖 洪,薛德军. 基于大规模真实文本的数值知识元挖掘研究[J]. 计算机工程与应用, 2008, 44(30): 150-152.
XIAO Hong,XUE De-jun. Numeric knowledge element mining based on large-scale realistic corpora[J]. Computer Engineering and Applications, 2008, 44(30): 150-152.
0 / 推荐
导出引用管理器 EndNote|Ris|BibTeX
链接本文: http://cea.ceaj.org/CN/10.3778/j.issn.1002-8331.2008.30.046
http://cea.ceaj.org/CN/Y2008/V44/I30/150
大规模文本数据库中的短文分类方法