现代汉语“V+N”序列关系的平行处理

doi:10.3778/j.issn.1002-8331.2010.30.003

计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (30): 8-10.DOI: 10.3778/j.issn.1002-8331.2010.30.003

现代汉语“V+N”序列关系的平行处理

冯敏萱

南京师范大学文学院，南京　210097

收稿日期:2010-05-10 修回日期:2010-09-06 出版日期:2010-10-21 发布日期:2010-10-21
通讯作者: 冯敏萱

Parallel processing of contemporary Chinese “V+N” sequence relations

FENG Min-xuan

School of Chinese Language and Literature，Nanjing Normal University，Nanjing 210097，China

Received:2010-05-10 Revised:2010-09-06 Online:2010-10-21 Published:2010-10-21
Contact: FENG Min-xuan

摘要/Abstract

摘要： 目前，在英汉平行语料中，对汉语文本的深加工多局限于只利用单语分析的成果，没有充分利用双语资源。以现代汉语v+n序列的结构关系为研究对象，设计出在英汉平行语料中识别v+n结构关系的平行处理算法：首先利用各种单语资源，提取出构成不同结构关系的动词和名词相互间的制约规则，再分别依据v+n中汉语名词、动词的语义在英语译文中的具体形式及上下文模板来判断v+n的结构关系类型。实验证明，在自动分词和词性标注的PCCE1000文本中，v+n单语处理的F值为72.14%，而进一步利用汉英词典和英语译文信息，F值到达了88.81%，提高了16.67个百分点。

关键词: 平行语料, 词语搭配, 短语分析, 自动识别, 中文信息处理

Abstract: At present，the Chinese text processing in English-Chinese parallel corpus，more confined to only use monolingual analysis results，without sufficient use bilingual resources.Structural relation of contemporary Chinese v+n sequence is regarded as the research object，and the parallel processing algorithm is designed for recognizing v+n structural relation in English-Chinese parallel corpus.At first，this paper utilizes various form single language resources to extract the restriction rules of verb and noun that having different structural relations.And then judges v+n structural relation type separately according to translation of Chinese noun and verb，and context template in parallel English text.The experiment proves，in PCCE1000 which having been word-segmented and POS-tagged，F value that using single language resources to process v+n is 72.14%，and further utilizing the Chinese-English dictionary and English translation information，F value has reached 88.81%，having improved by 16.67 percentage points.

Key words: parallel corpus, collocation, phrase analysis, automatic recognition, Chinese information processing

中图分类号:

TP391.1

冯敏萱. 现代汉语“V+N”序列关系的平行处理[J]. 计算机工程与应用, 2010, 46(30): 8-10.

FENG Min-xuan. Parallel processing of contemporary Chinese “V+N” sequence relations[J]. Computer Engineering and Applications, 2010, 46(30): 8-10.

[1]	赵艳，左保齐. 机器视觉在织物疵点检测上的应用研究综述[J]. 计算机工程与应用, 2020, 56(2): 11-17.
[2]	路志英1，刁长莹1，卢焕珍2，贾惠珍2. 基于MICAPS风场信息的低空急流自动识别及绘制[J]. 计算机工程与应用, 2017, 53(8): 230-234.
[3]	胡金柱1，舒江波2，胡泉3，李源1，杨进才1，谢芳4. 复句关系词自动识别中规则的表示方法研究[J]. 计算机工程与应用, 2016, 52(1): 127-132.
[4]	古丽扎达·海沙1，古丽拉·阿东别克2，3. 哈萨克语动词短语自动识别研究与实现[J]. 计算机工程与应用, 2015, 51(2): 218-223.
[5]	黄英来1，田少卿1，孙晓芳2，张博文3. 基于灰度投影法的乐器板材纹理分析方法[J]. 计算机工程与应用, 2014, 50(6): 161-164.
[6]	朱晓旭，钱培德. 脏话文本语料库建设[J]. 计算机工程与应用, 2014, 50(11): 126-129.
[7]	梁社会1，陈小荷2，刘浏2. 先秦汉语排比句自动识别研究——以《孟子》《论语》中的排比句自动识别为例[J]. 计算机工程与应用, 2013, 49(19): 222-226.
[8]	王海1，冯向前1，2，钱钢1，2. 网页在线评论情感倾向的直觉模糊分类[J]. 计算机工程与应用, 2013, 49(1): 148-151.
[9]	王成栋，凌丹，苗强. 分形无标度区的一种自动识别方法[J]. 计算机工程与应用, 2012, 48(6): 9-12.
[10]	程南昌1，2，侯敏3. 平行语料检索技术研究[J]. 计算机工程与应用, 2012, 48(31): 134-139.
[11]	刘君1，王振中1，李宝聚2，郇中丹1，黄海洋1. 基于图像处理的作物病害自动识别系统的研究[J]. 计算机工程与应用, 2012, 48(13): 154-158.
[12]	樊兴华，王鹏，周鹏. 一种基于扩展的两步文本倾向性分析方法[J]. 计算机工程与应用, 2012, 48(1): 162-165.
[13]	王栋^1，2，陈映鹰^1，3，秦平⁴. 盲信号分离和序贯滤波的SAR影像水体提取[J]. 计算机工程与应用, 2011, 47(2): 165-168.
[14]	胡晓东¹，骆剑承¹，吴炜¹，程熙¹，沈占锋¹，贾银芳². 手写粉笔数字自动识别方法研究[J]. 计算机工程与应用, 2011, 47(2): 182-184.
[15]	王晨熙¹,王晓博^1,2,朱靖¹,王国宏². ESM与AIS的统计关联[J]. 计算机工程与应用, 2009, 45(7): 150-152.

现代汉语“V+N”序列关系的平行处理

Parallel processing of contemporary Chinese “V+N” sequence relations

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics