计算机工程与应用 ›› 2018, Vol. 54 ›› Issue (2): 234-238.DOI: 10.3778/j.issn.1002-8331.1608-0042
操 镭1,尹蔚彬2,孙沁瑶1,王 志3,于重重1,李道玮1
CAO Lei1, YIN Weibin2, SUN Qinyao1, WANG Zhi3, YU Chongchong1, LI Daowei1
摘要: 濒危语言口语语料库建立的目的是系统地保存近乎消失的濒危语言,留存濒危语言的生命力与地方文化,并且能够对其进行学习与研究。濒危语言口语语料库保存的内容主要包括原始声音文件、国际音标标注、汉语对译标注以及汉语翻译标注。以濒危语言吕苏语为范例,深入、全面、系统地研究与建立濒危语言口语语料库,并对标注语料实现了自动分词与关键词提取的功能,为后续建立通用濒危语言语料库提供了一个范例。