计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (4): 146-148.DOI: 10.3778/j.issn.1002-8331.2011.04.040

• 数据库、信号与信息处理 • 上一篇    下一篇

藏语语料库词类描述方法研究

才让加   

  1. 青海师范大学 藏文信息研究中心,西宁 810008
  • 收稿日期:2009-05-20 修回日期:2009-07-06 出版日期:2011-02-01 发布日期:2011-02-01
  • 通讯作者: 才让加

Tibetan studies of corpus description method

CAI Rangjia   

  1. Research Center of Tibetan Information,Qinghai Normal University,Xining 810008,China
  • Received:2009-05-20 Revised:2009-07-06 Online:2011-02-01 Published:2011-02-01
  • Contact: CAI Rangjia

摘要: 藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动处理提供一个切实可行的方法。

关键词: 自然语言, 藏文, 词类标记, 语法信息

Abstract: Tibetan corpus multistage process is based on description of the basic attributes of the Tibetan lexicon,according to the actual need of the Tibetan corpus multistage process,through the syntax and semantics of Tibetan information description and Tibetan words after the analysis,it can provide a feasible method for the computer to process automatically the Tibetan collocations structure,grammatical information,semantic information and POS-tagging.

Key words: natural language, Tibetan, POS-tagging, grammatical information

中图分类号: