基于String Kernel和KPCA的负实例语法特征提取算法

doi:10.3778/j.issn.1002-8331.2009.20.041

计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (20): 136-139.DOI: 10.3778/j.issn.1002-8331.2009.20.041

基于String Kernel和KPCA的负实例语法特征提取算法

吕威^1，2，林文昶¹，姚正安¹，李磊¹

1.中山大学软件研究所，广州 510275
2.北京师范大学珠海分校信息技术学院，广东珠海 519085

收稿日期:2008-10-10 修回日期:2008-11-18 出版日期:2009-07-11 发布日期:2009-07-11

False instance grammatical feature extraction algorithm based on String Kernel and KPCA

LV Wei^1，2，LIN Wen-chang¹，YAO Zheng-an¹，LI Lei¹

1.Software Research Institute，Zhongshan University，Guangzhou 510275，China
2.School of Information Technology，Beijing Normal University Zhuhai Campus，Zhuhai，Guangdong 519085，China

Received:2008-10-10 Revised:2008-11-18 Online:2009-07-11 Published:2009-07-11

摘要/Abstract

摘要： 提出通过String Kernel方法把负实例语法数据库中的负实例转化成核矩阵，再用Kernel Principal Component Analysis（KPCA）对转换的核矩阵进行特征提取，进而可将原始负实例数据库按照这些特征分成多个容量较小的特征表。通过构造负实例特征索引表设计了一个分类器，待检查的句子通过此分类器被分配到某个负实例特征表里进行匹配搜索，而此特征表的特征属性数和记录数要远远小于原始负实例数据库中的相应数目，从而大大提高了检查的速度，同时不影响语法检查的精度。通过比较测试，可看出提出的方法在保证语法检查精确度的同时有更快的速度。

关键词: String Kernel, 核主成分分析, 负实例, 特征提取

Abstract: This paper presents a method that translates false instance in grammatical database to kernel matrix through String Kernel，and uses KPCA to extract feature of the translated kernel matrix.We can separate the original false instance database into many small characteristic tables according to these extracted features，and design a classified machine by constructing false instance characteristic table.A new sentence is distributed to some characteristic table for matching of false instance through this classification machine.For characteristic table is much little than original false instance database，the running speed is enhanced very much without decreasing the accuracy of grammatical check.By compared with grammar inspection function of word，the new system demonstrates more quick speed while keeping the accuracy of grammatical check

Key words: String Kernel, Kernel Principal Component Analysis（KPCA), false instance, feature extraction

吕威^1，2，林文昶¹，姚正安¹，李磊¹. 基于String Kernel和KPCA的负实例语法特征提取算法[J]. 计算机工程与应用, 2009, 45(20): 136-139.

LV Wei^1，2，LIN Wen-chang¹，YAO Zheng-an¹，LI Lei¹. False instance grammatical feature extraction algorithm based on String Kernel and KPCA[J]. Computer Engineering and Applications, 2009, 45(20): 136-139.

[1]	包志强，邢瑜，吕少卿，黄琼丹. 改进YOLO V2的6D目标姿态估计算法[J]. 计算机工程与应用, 2021, 57(9): 148-153.
[2]	许德刚，王露，李凡. 深度学习的典型目标检测算法研究综述[J]. 计算机工程与应用, 2021, 57(8): 10-25.
[3]	胡文涛，陈秀宏. 基于邻域图的低秩投影学习[J]. 计算机工程与应用, 2021, 57(7): 209-214.
[4]	张晓丽，张魁星，江梅，魏本征，丛金玉. 淋巴瘤图像分类技术研究综述[J]. 计算机工程与应用, 2021, 57(6): 1-9.
[5]	熊健，覃仁超，何梦乙，刘建兰，唐风扬. 改进随机森林在Android恶意软件检测中的应用[J]. 计算机工程与应用, 2021, 57(3): 130-136.
[6]	李龙龙，何东健，王美丽. 基于改进型LBP算法的植物叶片图像识别研究[J]. 计算机工程与应用, 2021, 57(19): 228-234.
[7]	李杰，李苗，袁细国. 面向新一代测序数据的病原微生物检测算法[J]. 计算机工程与应用, 2021, 57(19): 282-289.
[8]	郭恒光，刘文彪，余仁波. 用于形状特征提取的spike函数[J]. 计算机工程与应用, 2021, 57(18): 220-226.
[9]	李振强，王树才，赵世达，白宇. 改进DeepLabv3+和XGBoost的羊骨架切割方法[J]. 计算机工程与应用, 2021, 57(18): 263-269.
[10]	沈少禹，蔡满春，芦天亮，赵琪. 基于LFKPCA-DWELM的入侵检测方案[J]. 计算机工程与应用, 2021, 57(17): 130-137.
[11]	刘星辰，贾俊铖，张莉，胡沁涵. 图像超分辨率特征浓缩网络[J]. 计算机工程与应用, 2021, 57(16): 213-219.
[12]	光睿智，安博文，潘胜达. 基于无锚框网络的航拍航道船舶检测算法[J]. 计算机工程与应用, 2021, 57(15): 251-258.
[13]	周小静，陈俊洪，杨振国，刘文印. 基于手势特征融合的操作动作识别[J]. 计算机工程与应用, 2021, 57(14): 169-175.
[14]	岳琪，徐忠亮，郭继峰. 面向混合乐器音乐分析的稀疏特征提取方法[J]. 计算机工程与应用, 2021, 57(14): 181-186.
[15]	谌贵辉，陈伍，李忠兵，易欣，刘会康，韩春阳. 残差卷积注意网络的图像超分辨率重建[J]. 计算机工程与应用, 2021, 57(12): 193-200.

基于String Kernel和KPCA的负实例语法特征提取算法

False instance grammatical feature extraction algorithm based on String Kernel and KPCA

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics