计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (4): 146-148.DOI: 10.3778/j.issn.1002-8331.2011.04.040
• 数据库、信号与信息处理 • 上一篇 下一篇
才让加
收稿日期:
修回日期:
出版日期:
发布日期:
通讯作者:
CAI Rangjia
Received:
Revised:
Online:
Published:
Contact:
摘要: 藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动处理提供一个切实可行的方法。
关键词: 自然语言, 藏文, 词类标记, 语法信息
Abstract: Tibetan corpus multistage process is based on description of the basic attributes of the Tibetan lexicon,according to the actual need of the Tibetan corpus multistage process,through the syntax and semantics of Tibetan information description and Tibetan words after the analysis,it can provide a feasible method for the computer to process automatically the Tibetan collocations structure,grammatical information,semantic information and POS-tagging.
Key words: natural language, Tibetan, POS-tagging, grammatical information
中图分类号:
TP391
才让加. 藏语语料库词类描述方法研究[J]. 计算机工程与应用, 2011, 47(4): 146-148.
CAI Rangjia. Tibetan studies of corpus description method[J]. Computer Engineering and Applications, 2011, 47(4): 146-148.
0 / 推荐
导出引用管理器 EndNote|Ris|BibTeX
链接本文: http://cea.ceaj.org/CN/10.3778/j.issn.1002-8331.2011.04.040
http://cea.ceaj.org/CN/Y2011/V47/I4/146