计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (35): 190-194.
刘 扬1,郑逢斌1,樊卞玲2
LIU Yang1,ZHENG Feng-bin1,FAN Bian-ling2
摘要: 提出了一种融合文本和视音频多模态特征的电视新闻自动分割方案。该方案充分考虑各种媒体特征的特点,先用矢量模型和GMM对文本进行预分割,用语谱图和HMM对语音预分割、用改进的直方图和SVM分类器对视频进行预分割。然后在时间同步的基础上,使用复合策略用ANN对预分割的数据进行融合,从而获得具有一定语义内容的视频段。实验结果表明此方法的有效性,并且分割后的视频片段具备较完整的语义信息特征,避免了分割的过度细碎的弊端。