计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (33): 48-50.
赖 珉1,陈一宁2,初 敏2,胡访宇1
LAI Min1,CHEN Yi-ning2,CHU Min2,HU Fang-yu1
摘要:
大规模语料库的手工韵律标注消耗大量的时间和人力。这篇论文的目的在于研究如何充分利用少量的手工标注数据训练得到尽可能精确的语音重音自动标注器。论文列举并对比了四种训练方法的效果。在训练中结合声学分类器和语言学分类器,同时使用了综合分类器做后期优化。在实验中,使用机器数据训练声学分类器,并将有限的手工数据用于后期综合分类器能得到最佳的标注正确率。最终的正确率达到了94.0%,与手工标注的正确率上限97.2%比较接近。