计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (13): 53-55.DOI: 10.3778/j.issn.1002-8331.2010.13.016
张 霞1,2,尹怡欣1,于海燕1,2,赵海龙1
收稿日期:
2009-03-06
修回日期:
2009-04-21
出版日期:
2010-05-01
发布日期:
2010-05-01
通讯作者:
张 霞
ZHANG Xia1,2,YIN Yi-xin1,YU Hai-yan1,2,ZHAO Hai-long1
Received:
2009-03-06
Revised:
2009-04-21
Online:
2010-05-01
Published:
2010-05-01
Contact:
ZHANG Xia
摘要: 典型的文本聚类算法是一种硬划分,但是实际上由于中文文本的多样性和大量性更适合进行软划分,模糊集理论的提出为这种软划分提供了有力的分析工具。传统的模糊聚类方法大都是通过对隶属度的矩阵逐步迭代得到模糊等价矩阵或模糊划分的方法实现聚类,这个过程需要大量的存储空间。基于模糊粒度计算的文本聚类算法是在文档集合的模糊粒度空间上给定一个归一化的距离函数d(di,dj),对距离小于粒度dλ的文本进行动态聚类。通过实验证明此方法在解决文本聚类问题时具有降低计算复杂度和空间复杂度,适于大量文本的聚类处理。
中图分类号:
张 霞1,2,尹怡欣1,于海燕1,2,赵海龙1. 基于模糊粒度计算的文本聚类研究[J]. 计算机工程与应用, 2010, 46(13): 53-55.
ZHANG Xia1,2,YIN Yi-xin1,YU Hai-yan1,2,ZHAO Hai-long1. Research of text clustering based on fuzzy granular computing[J]. Computer Engineering and Applications, 2010, 46(13): 53-55.
[1] | 陈 旺1,李 波1,史彦军2,滕弘飞2. 求解RCPSP问题的带分布估计的差异演化算法[J]. 计算机工程与应用, 2011, 47(4): 1-4. |
[2] | 沙全友1,施进发1,秦现生2. 航空产品研发过程实时动态分解与优化配置[J]. 计算机工程与应用, 2011, 47(4): 9-12. |
[3] | 戴 芹,刘建波,刘士彬. 群智能方法在遥感信息提取中的应用分析[J]. 计算机工程与应用, 2011, 47(4): 13-16. |
[4] | 刘光帅,李柏林,何朝明. 分段光滑曲面重构的面片图稀疏优化方法[J]. 计算机工程与应用, 2011, 47(4): 22-25. |
[5] | 龙银芳,尚俊娜. MC-CDMA系统载波频偏估计[J]. 计算机工程与应用, 2011, 47(4): 102-104. |
[6] | 于江德1,王希杰1,樊孝忠2. 汉语分词中上文和下文重要性比较[J]. 计算机工程与应用, 2011, 47(4): 117-120. |
[7] | 裴英博1,刘晓霞2. 文本分类中改进型CHI特征选择方法的研究[J]. 计算机工程与应用, 2011, 47(4): 128-130. |
[8] | 张 瑜,罗 可. 基于OC-SVM的大型数据集分类方法[J]. 计算机工程与应用, 2011, 47(4): 131-133. |
[9] | 刘荣辉1,2,郑建国1. Deep Web下基于中文分词的聚类算法[J]. 计算机工程与应用, 2011, 47(4): 138-140. |
[10] | 才让加. 藏语语料库词类描述方法研究[J]. 计算机工程与应用, 2011, 47(4): 146-148. |
[11] | 刘秀玲,刘 京,王洪瑞,郭 磊. 改进型蜂窝状空间分解的实时碰撞检测[J]. 计算机工程与应用, 2011, 47(4): 149-153. |
[12] | 张 聪,桂志国. 噪声控制的图像非线性锐化方法[J]. 计算机工程与应用, 2011, 47(4): 154-156. |
[13] | 付小君1,郭鹏江1,郭 竞2,冯 筠2. 统计特征和Markov模型在三维模型分类中的应用[J]. 计算机工程与应用, 2011, 47(4): 157-159. |
[14] | 陈慧杰,赖惠成,贾志强. 图像混合和小波变换的双重彩色图像隐藏[J]. 计算机工程与应用, 2011, 47(4): 171-173. |
[15] | 杨晓琴,季晓勇. 基于H.264的快速运动估计算法[J]. 计算机工程与应用, 2011, 47(4): 174-175. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||