依存分析和HMM相结合的信息抽取方法

计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (9): 138-140.

• 数据库、信号与信息处理 • 上一篇下一篇

依存分析和HMM相结合的信息抽取方法

袁璐，蒙祖强，许珂

广西大学计算机与电子信息学院，南宁 530004

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2012-03-21 发布日期:2012-04-11

Method of text information extraction based on dependency parsing and HMM

YUAN Lu, MENG Zuqiang, XU Ke

College of Computer and Electronic Information, Guangxi University, Nanning 530004, China

Received:1900-01-01 Revised:1900-01-01 Online:2012-03-21 Published:2012-04-11

摘要/Abstract

摘要： 信息抽取是文本信息处理的一个重要环节，当前的信息抽取研究工作大多针对半结构化的文本。针对自由文本，提出一种依存分析和HMM相结合的文本信息抽取算法，该算法在运用依存分析对句子进行浅层句法分析的基础上制定相应规则，形成输入序列，结合HMM易于建立、适应性好、抽取精度较高的优势，实现自由文本的信息抽取。实验结果表明，新的算法在召回率、准确率和正确率指标上均有良好的性能，说明了算法的有效性，为文本信息的抽取提供了新思路。

关键词: 信息抽取, 自由文本, 隐马尔可夫模型, 依存分析

Abstract: Information extraction is an important part of text information processing. The current information extraction researches mostly focus on semi-structured text. It proposes a novel text information extraction algorithm based on the combination of dependency parsing and HMM. The algorithm formulates appropriate rules based on applying dependency parsing to shallow syntactic analysis of sentences, forming the input sequence of HMM to achieve free text information extraction combining the advantage of easily building, good adaptability and high extraction accuracy of HMM. Experimental results show that the new algorithm has very good performance on recall rate, accuracy and correct rate.

Key words: information extraction, free text, Hidden Markov Model（HMM）, dependency parsing

袁璐，蒙祖强，许珂. 依存分析和HMM相结合的信息抽取方法[J]. 计算机工程与应用, 2012, 48(9): 138-140.

YUAN Lu, MENG Zuqiang, XU Ke. Method of text information extraction based on dependency parsing and HMM[J]. Computer Engineering and Applications, 2012, 48(9): 138-140.

[1]	隗昊，周爱，张益嘉，陈飞，屈雯，鲁明羽. 深度学习生物医学实体关系抽取研究综述[J]. 计算机工程与应用, 2021, 57(21): 14-23.
[2]	杨延娇，赵国涛，王丕栋. 基于语义与情感的句子相似度计算方法[J]. 计算机工程与应用, 2021, 57(16): 151-158.
[3]	吴楚田，陈永乐，陈俊杰. 多协议交叉的HMM协议异常检测算法[J]. 计算机工程与应用, 2020, 56(8): 81-86.
[4]	吴呈，王朝坤，王沐贤. 基于文本化简的实体属性抽取方法[J]. 计算机工程与应用, 2020, 56(21): 115-122.
[5]	贾志淳，卢元，李想，邢星. 一种多参数的Web服务选择方法[J]. 计算机工程与应用, 2019, 55(21): 74-78.
[6]	杨世强，罗晓宇，李小莉，杨江涛，李德信. 基于DBN-HMM的人体动作识别[J]. 计算机工程与应用, 2019, 55(15): 169-176.
[7]	郇战，李晨，万彩艳，陈学杰. 基于步行加速度信息分割的人员识别[J]. 计算机工程与应用, 2019, 55(1): 203-209.
[8]	吴小全1，2，李晖1，2，陈梅1，2，戴震宇1，2. DRVisSys：基于属性相关性分析的可视化推荐系统[J]. 计算机工程与应用, 2018, 54(7): 251-256.
[9]	赵晓永，王磊. 电商网页中商品规格信息自动抽取方法研究[J]. 计算机工程与应用, 2017, 53(24): 168-171.
[10]	谷楠楠，冯筠，孙霞，赵妍，张蕾. 中文简历自动解析及推荐算法[J]. 计算机工程与应用, 2017, 53(18): 141-148.
[11]	马正华1，李雷2，乔玉涛2，戎海龙3，曹海婷2. 基于多传感器融合的动态手势识别研究分析[J]. 计算机工程与应用, 2017, 53(17): 153-159.
[12]	肖晓红1，张懿2，刘冬生1，欧阳春娟1. 基于隐马尔可夫模型的音乐分类[J]. 计算机工程与应用, 2017, 53(16): 138-143.
[13]	冯钦林，杨志豪，林鸿飞. 疾病-病症和病症-治疗物质的关系抽取研究[J]. 计算机工程与应用, 2017, 53(10): 251-257.
[14]	戈永侃，于凤芹. 后置滤波器参数自适应的语音合成改进算法[J]. 计算机工程与应用, 2017, 53(1): 168-171.
[15]	孙红敏，姜楠楠，李想. 基于文档集的生物信息挖掘模型研究[J]. 计算机工程与应用, 2016, 52(24): 102-106.

依存分析和HMM相结合的信息抽取方法

Method of text information extraction based on dependency parsing and HMM

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics