计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (36): 139-143.DOI: 10.3778/j.issn.1002-8331.2010.36.038
杨鸿武1,王晓丽1,陈 龙2,裴 东1,郭威彤1,蔡莲红3
YANG Hong-wu1,WANG Xiao-li1,CHEN Long2,PEI Dong1,GUO Wei-tong1,CAI Lian-hong3
摘要: 在文语转换系统中,从文本中预测出准确的韵律结构对于提高合成语音的自然度具有重要的作用。利用10 000句标注了词性标记的文本语料,在语言学专家的指导下,人工标注了语料的韵律词和韵律短语。选择了标注结果一致性最高的500句语句,标注了语法层级结构,并利用语法树高度描述语法词之间连接的紧密程度。通过分析韵律短语边界与语法结构的关系,发现韵律短语边界受语法树高度、语法词词性和语法词词长的影响,因此选择了这三个特征,利用TBL算法和400句训练语句训练了预测模型。测试集上的预测结果表明,提出的方法在小规模训练语料下,韵律短语预测的精确率达到了75.2%,召回率达到了77.1%,F-Score达到了76.1%。
中图分类号: