基于框架语义标注的自由文本信息抽取研究

doi:10.3778/j.issn.1002-8331.2008.25.043

计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (25): 143-145.DOI: 10.3778/j.issn.1002-8331.2008.25.043

• 数据库、信号与信息处理 • 上一篇下一篇

基于框架语义标注的自由文本信息抽取研究

牛之贤,白鹏洲,段富

太原理工大学计算机与软件学院，太原 030024

收稿日期:2007-10-30 修回日期:2008-01-28 出版日期:2008-09-01 发布日期:2008-09-01
通讯作者: 牛之贤

Free text information extraction based on frame semantic tagging

NIU Zhi-xian,BAI Peng-zhou,DUAN Fu

College of Computer and Software，Taiyuan University of Technology，Taiyuan 030024，China

Received:2007-10-30 Revised:2008-01-28 Online:2008-09-01 Published:2008-09-01
Contact: NIU Zhi-xian

摘要/Abstract

摘要： 信息抽取是从自由文本语料库构建数据库，实现信息自动收集的有效途径之一。提出了一种以框架语义标注为基础构建信息抽取规则的信息抽取方法。基于框架语义标注的信息抽取是用统一的方法来指导信息抽取过程。这种方法具有较细的处理粒度，对语义规则性强的领域有一定的普遍适用性。设计了基于框架语义的BAIE（图书内容简介信息抽取）系统，并对图书的内容简介试行信息抽取。抽取结果表明，基于框架语义的信息抽取方式有一定的可行性和适用性。

关键词: 信息抽取, 框架语义, 抽取规则

Abstract: Information extraction is a main approach for constructing database from free text corpus and for automatic collecting information.Frame semantic tagging is suggested to be the base for rule-building in information extraction.Information extraction based on frame semantic tagging uses a uniform approach to guide the process of information extraction.Processing at a finer granularity level，the method has a universal appeal for information extraction in domains showing strong semantic rules.A system called BAIE（Book Abstract Information Extraction system），which is based on frame semantic，is designed and used to extract information from book abstract.The result shows that the approach is feasible and has practical promise.

Key words: information extraction, frame semantic, extraction rules

牛之贤,白鹏洲,段富. 基于框架语义标注的自由文本信息抽取研究[J]. 计算机工程与应用, 2008, 44(25): 143-145.

NIU Zhi-xian,BAI Peng-zhou,DUAN Fu. Free text information extraction based on frame semantic tagging[J]. Computer Engineering and Applications, 2008, 44(25): 143-145.

[1]	隗昊，周爱，张益嘉，陈飞，屈雯，鲁明羽. 深度学习生物医学实体关系抽取研究综述[J]. 计算机工程与应用, 2021, 57(21): 14-23.
[2]	吴呈，王朝坤，王沐贤. 基于文本化简的实体属性抽取方法[J]. 计算机工程与应用, 2020, 56(21): 115-122.
[3]	赵晓永，王磊. 电商网页中商品规格信息自动抽取方法研究[J]. 计算机工程与应用, 2017, 53(24): 168-171.
[4]	谷楠楠，冯筠，孙霞，赵妍，张蕾. 中文简历自动解析及推荐算法[J]. 计算机工程与应用, 2017, 53(18): 141-148.
[5]	冯钦林，杨志豪，林鸿飞. 疾病-病症和病症-治疗物质的关系抽取研究[J]. 计算机工程与应用, 2017, 53(10): 251-257.
[6]	孙红敏，姜楠楠，李想. 基于文档集的生物信息挖掘模型研究[J]. 计算机工程与应用, 2016, 52(24): 102-106.
[7]	伊政，徐武平，徐爱萍. 一种基于结构分析的网页主题区域发现方法[J]. 计算机工程与应用, 2015, 51(6): 227-230.
[8]	黄彦姣，吴秦，梁久祯. 基于增强约束条件随机场的Web对象信息抽取[J]. 计算机工程与应用, 2015, 51(23): 143-148.
[9]	张菲菲1，李宗海2，周晓辉1，李晓戈1,2. 基于层次聚类的跨文本中文人名消歧研究[J]. 计算机工程与应用, 2014, 50(6): 106-111.
[10]	昌磊1，陆阳1，吴雷1，2. PDF文档的跨终端发布技术[J]. 计算机工程与应用, 2014, 50(22): 158-162.
[11]	李嘉，徐前，王梓，陈钊. 基于语义的林产品贸易Web信息抽取算法[J]. 计算机工程与应用, 2014, 50(19): 199-204.
[12]	袁璐，蒙祖强，许珂. 依存分析和HMM相结合的信息抽取方法[J]. 计算机工程与应用, 2012, 48(9): 138-140.
[13]	潘鹏1，2，诸云强2，朱琦3，赵晓宏4. 隐马尔可夫模型在环保档案信息抽取中的应用[J]. 计算机工程与应用, 2012, 48(26): 243-248.
[14]	史存会1，罗文华2，林鸿飞1. 文本挖掘技术在互联网赌博案情分析中的应用[J]. 计算机工程与应用, 2011, 47(28): 113-116.
[15]	蔡华利^1，2，刘鲁¹，刘志明¹，杨跃翔². 突发事件Web新闻中时间信息分析及抽取[J]. 计算机工程与应用, 2010, 46(34): 107-110.

基于框架语义标注的自由文本信息抽取研究

Free text information extraction based on frame semantic tagging

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics