基于分布距离的特征聚类方法

计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (29): 137-139.

• 数据库、信号与信息处理 • 上一篇下一篇

基于分布距离的特征聚类方法

张学谦，王自强，郜凤敏

河南工业大学信息科学与工程学院，郑州 450001

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2011-10-11 发布日期:2011-10-11

Feature clustering method based on distribution distance

ZHANG Xueqian，WANG Ziqiang，GAO Fengmin

College of Information Science and Engineering，Henan University of Technology，Zhengzhou 450001，China

Received:1900-01-01 Revised:1900-01-01 Online:2011-10-11 Published:2011-10-11

摘要/Abstract

摘要： 为降低特征空间维数，提出了一种基于分布距离的文本特征聚类方法，通过将特征空间中分布距离相近的特征聚合，来实现降维。在TanCorpusV1.0语料库上实验表明，当将特征空间维数降低至原空间的近10%时，用SVM作为分类器，获得了比特征提取方法高的分类精度。

关键词: 分布特征, 分布距离, 特征抽取, 特征聚类

Abstract: To reduce feature space dimensionality，this paper presents a new method to cluster the similar features based on distribution distance，which can achieve dimensionality reduction through clustering the nearest distance features.Test on the corpus of TanCorpusV1.0 shows，when reducing the dimensionality of feature space as far as original’s 10%，using SVM as classifier，this method can achieve a higher accuracy than feature selection method.

Key words: distribution feature, distribution distance, feature extraction, feature clustering

张学谦，王自强，郜凤敏. 基于分布距离的特征聚类方法[J]. 计算机工程与应用, 2011, 47(29): 137-139.

ZHANG Xueqian，WANG Ziqiang，GAO Fengmin. Feature clustering method based on distribution distance[J]. Computer Engineering and Applications, 2011, 47(29): 137-139.

[1]	邓清文，林志贤，郭太良. 一种基于主成分的多表图像哈希检索方法[J]. 计算机工程与应用, 2018, 54(3): 192-199.
[2]	万倬1，2，朱嘉钢1，2，陆晓2. 图像特征抽取的MDNIB2DPCA方法[J]. 计算机工程与应用, 2016, 52(9): 177-183.
[3]	张国庆1，2，王正群2，王颖静2，徐伟2. 图像多模态扰动的人脸识别方法[J]. 计算机工程与应用, 2013, 49(7): 204-207.
[4]	薛寺中，陈秀宏. 基于一种改进的类内散布矩阵的核鉴别分析法[J]. 计算机工程与应用, 2013, 49(2): 181-183.
[5]	张小燕，胡昊，苏勇. 高维空间中针对离群点检测的特征抽取[J]. 计算机工程与应用, 2012, 48(22): 189-194.
[6]	刘祥涛1，2，刘书良3. NQPC：一种新型的基于查询日志的网页分类方法[J]. 计算机工程与应用, 2012, 48(11): 82-87.
[7]	张燕^1，2，郑玮¹，胡勇¹. 隐空间中参数化直接鉴别分析及其应用[J]. 计算机工程与应用, 2011, 47(6): 212-215.
[8]	张燕^1，2，唐振民¹，李燕萍³. 面向推荐系统的音乐特征抽取[J]. 计算机工程与应用, 2011, 47(5): 130-133.
[9]	张岩1，2，武玉强2. 一种改进的模块PCA人脸识别新方法[J]. 计算机工程与应用, 2011, 47(26): 216-218.
[10]	张小祥，周治平. 小波低频子带提取特征的图像复制篡改检测[J]. 计算机工程与应用, 2011, 47(10): 161-163.
[11]	杨茂龙^1，2，王远方³，孙权森²，夏德深². 偏最小二乘改进算法与特征抽取[J]. 计算机工程与应用, 2011, 47(1): 179-181.
[12]	卢新国，彭湘华，李丹，周鹏杰，陈东. 在癌症识别中一种新颖的基因特征抽取算法[J]. 计算机工程与应用, 2010, 46(30): 237-240.
[13]	蒋盛益¹，王连喜². 基于特征相关性的特征选择[J]. 计算机工程与应用, 2010, 46(20): 153-156.
[14]	黄璞，陈才扣. 增强的无监督人脸鉴别技术[J]. 计算机工程与应用, 2010, 46(18): 167-169.
[15]	马千驰¹，余国先²，钟鸿鹏¹. 一种增强的局部保持投影方法[J]. 计算机工程与应用, 2010, 46(10): 119-121.

基于分布距离的特征聚类方法

Feature clustering method based on distribution distance

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics