计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (3): 192-194.
程舒通1,2,徐从富1,但红卫1
CHENG Shu-tong1,2,XU Cong-fu1,DAN Hong-wei1
摘要: 基于频繁序列模式的压缩技术旨在提高数据挖掘结果的可用性和可理解性,从庞大的序列模式中发现有用的知识。分析了现有频繁模式压缩算法的不足,提出了在模式聚类函数的基础上生成一个压缩的偏序(Partial Order)的算法,实验结果显示该算法可以对频繁序列模式进行高效,高质量的压缩,可以得到数量更少、信息量更大的模式,从而提高发现的频繁访问序列的兴趣性。