以“的”字结构为核心的最长名词短语识别研究

doi:10.3778/j.issn.1002-8331.2010.18.044

计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (18): 138-141.DOI: 10.3778/j.issn.1002-8331.2010.18.044

• 数据库、信号与信息处理 • 上一篇下一篇

以“的”字结构为核心的最长名词短语识别研究

钱小飞

中国传媒大学文学院，北京 100024

收稿日期:2008-12-23 修回日期:2009-03-13 出版日期:2010-06-21 发布日期:2010-06-21
通讯作者: 钱小飞

Recognition of MNP with “De-Phrase” core

QIAN Xiao-fei

School of Chinese Language and Literature，Communication University of China，Beijing 100024，China

Received:2008-12-23 Revised:2009-03-13 Online:2010-06-21 Published:2010-06-21
Contact: QIAN Xiao-fei

摘要/Abstract

摘要： 以“的”字结构为核心的最长名词短语是汉语最长名词短语的一个特殊子类。以该短语的自动识别为基础重新分化了汉语MNP的识别任务。在考察其结构和分布特征的基础上，提出“先识别右边界，识别成果参与左边界识别”的策略，并使用边界分布概率模型分治了左右边界。实验基于85万字的新闻语料上进行训练，并在42万字的同质语料上进行了开放测试，取得了80.63%的正确率和75.68%的召回率。

关键词: 最长名词短语, “的”字结构, 识别, 浅层句法分析

Abstract: The MNP with “De-Phrase” core is a special subclass of MNP.The identification of the phrase in this paper gives a new subsumption to the task of Chinese MNP recognition.The paper first analyzes the distribution and the structure feature of the phrase，then it advances a strategy of “Identify the right boundary first，then identify the left one”.Furthermore，it adopts the method “Boundary Distribution Probability” to recognize the phrase.A corpus（about 0.85 million Chinese Characters） of news is used for the automatic identification training and another（about 0.42 million Chinese Characters） is used for test，and the experiment achieves 80.63% in precision and 75.68% in recall.

Key words: Maximal Noun Phrase（MNP）, De-Phrase, identification, shallow parsing

中图分类号:

TP391

钱小飞. 以“的”字结构为核心的最长名词短语识别研究[J]. 计算机工程与应用, 2010, 46(18): 138-141.

QIAN Xiao-fei. Recognition of MNP with “De-Phrase” core[J]. Computer Engineering and Applications, 2010, 46(18): 138-141.

[1]	赵志焱，杨华，胡志伟，宇海萍. 基于TACNN的玉露香梨叶虫害识别[J]. 计算机工程与应用, 2021, 57(9): 176-181.
[2]	周伦钢，孙怡峰，王坤，吴疆，黄维贵，李炳龙. 目标多种多值属性的端端快速识别网络[J]. 计算机工程与应用, 2021, 57(9): 182-190.
[3]	张成，戴俊峰，熊闻心. 融合LeNet-5改进的扫描文档手写日期识别[J]. 计算机工程与应用, 2021, 57(9): 207-211.
[4]	张朕通，单玉刚，袁杰. 联合多尺度和注意力机制的遥感影像检测[J]. 计算机工程与应用, 2021, 57(9): 212-216.
[5]	蒋斌，钟瑞，张秋闻，张焕龙. 采用深度学习方法的非正面表情识别综述[J]. 计算机工程与应用, 2021, 57(8): 48-61.
[6]	杜垚. 结合局部优化匹配的Android恶意家族检测算法[J]. 计算机工程与应用, 2021, 57(8): 84-90.
[7]	乔慧，周水生. 非线性角度2DPCA及其在人脸识别中的应用[J]. 计算机工程与应用, 2021, 57(8): 112-118.
[8]	高一锴，彭力，徐龙壮. 改进AFSA算法优化TWSVM的火焰识别方法[J]. 计算机工程与应用, 2021, 57(8): 204-213.
[9]	韦佶宏，郑荣锋，刘嘉勇. 基于混合神经网络的恶意TLS流量识别研究[J]. 计算机工程与应用, 2021, 57(7): 107-114.
[10]	杨倩，顾磊. 基于去噪字词联合模型的中文命名实体识别[J]. 计算机工程与应用, 2021, 57(7): 151-157.
[11]	胡文涛，陈秀宏. 基于邻域图的低秩投影学习[J]. 计算机工程与应用, 2021, 57(7): 209-214.
[12]	侯旋，薛飞，陈涛. 无人机目标检测量子多模式识别优化算法[J]. 计算机工程与应用, 2021, 57(7): 228-236.
[13]	万梦翔，姚寒冰. 面向恶意网页训练数据生成的GAN模型[J]. 计算机工程与应用, 2021, 57(6): 124-130.
[14]	赵凡，张琳，闻治泉，杨林林，蔺广逢. 一种直接高效的自然场景汉字逼近定位方法[J]. 计算机工程与应用, 2021, 57(6): 159-167.
[15]	刘畅，邱卫根，张立臣. 基于可变形掩膜对齐卷积模型的行人再识别[J]. 计算机工程与应用, 2021, 57(5): 146-152.

以“的”字结构为核心的最长名词短语识别研究

Recognition of MNP with “De-Phrase” core

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics