计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (9): 159-161.

• 数据库、信号与信息处理 • 上一篇    下一篇

随机森林及其改进模型在浅层句法分析中的应用

魏 松   

  1. 北京信息职业技术学院,北京 100018
  • 收稿日期:2007-05-17 修回日期:2007-10-24 出版日期:2008-03-21 发布日期:2008-03-21
  • 通讯作者: 魏 松

Random forest based shallow parser

WEI Song   

  1. Beijing Information Technology College,Beijing 100018,China
  • Received:2007-05-17 Revised:2007-10-24 Online:2008-03-21 Published:2008-03-21
  • Contact: WEI Song

摘要: 文章首先阐述浅层句法分析可以转化为一个分类问题,然后论述了如何用随机森林的方法来完成这个分类任务。接下来对随机森林算法进行了改进,即基本模型+Bootstrap方式。实验结果显示,针对CoNLL2000提出的浅层句法分析任务,基本模型+Bootstrap方式的Fβ值可以达到92.25%,较基本模型有明显提高。

关键词: 浅层句法分析, 随机森林, 决策树, Bootstrap

Abstract: This paper first points out that shallow parsing problems can be converted into categorizaion problems,then we show how to cope with shallow parsing with random forests.Next,one variant of random forests is given,namely Base+Bootstrap.The experiment result shows that Fβ can reach the value of 92.25% under the model of Base+Bootstrap.

Key words: shallow parsing, random forests, decision trees, Bootstrap