计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (20): 187-189.

• 数据库与信息处理 • 上一篇    下一篇

藏文字符集基本集的修订方案

黄鹤鸣1,契嘎•德熙嘉措(赵晨星)2   

  1. 1.青海师范大学 物理系,西宁 810008
    2.青海藏文信息技术研究所,西宁 810008
  • 收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2007-07-11 发布日期:2007-07-11
  • 通讯作者: 黄鹤鸣

Some proposes on modification of Tibetan encoded character set—basic set

HUANG He-ming1,ZHAO Chen-xing2   

  1. 1.Physics Department,Qinghai Normal University,Xining 810008,China
    2.Qinghai Institute of Tibetan Information and Technology,Xining 810008,China
  • Received:1900-01-01 Revised:1900-01-01 Online:2007-07-11 Published:2007-07-11
  • Contact: HUANG He-ming

摘要: 制作藏文字符集扩展集A和扩展集B的Unico数据库工作中,发现藏文编码字符集基本集有不完善的地方,现提出了几点修改建议:修改字元■(U+0F62)的名称和字元 (U+0F6A)的图形;修改字元■(U+0FB2)与字元 (U+OFBC)的属性值;修改字元■(U+0F6A)的属性值;修改组合用下加字元U+0F90~U+0FBC的组合定位字段的属性值;增加一个辅音■和对应的不占位形式;增加一个空辅音;增加36个复合元音;增加一个图形符号■。通过这些修改,藏文编码字符集基本集的Unicode数据库将更趋完善,实现基本集的“利用基本集中的基本字符通过垂直组合形成藏文(叠字)字符,从而实现所有藏文字符的计算机处理”的目的。

关键词: 藏文, 字符集, 基本集, Unicode数据库, 修订方案

Abstract: This paper proposes some suggestions on modification of Tibetan encoded character set—basic set:Modify the property value of the character element ■ (U+0FB2) and ■ (U+OFBC);Modify the value of Canonical_Combining_Class field of character elements U+0F90~U+0FBC;Add a zero consonant;Add 36 compound vowels and add a graphical symbol ■.With these modifications and additions,basic set of Tibetan encoded character will perform better in Tibetan’s computer input,output,storage etc.It will accelerate the process of Tibetan informationization.

Key words: Tibetan, character set, basic set, Unicode database, modification