计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (13): 150-152.
王秀坤,王铁存,周国能,冯 维
WANG Xiu-kun,WANG Tie-cun,ZHOU Guo-neng,FENG Wei
摘要: 数据流的无限性、连续性和速度快等特点,使得挖掘出所有准确的数据流频繁项通常是不可能的.算法的空间复杂度和时间复杂度通常是评价频繁项挖掘算法优劣的两个主要度量.通过引入局部性原理改进数据流近似频繁项的挖掘算法,该算法的空间复杂性为O(1/ε),数据流每个数据项的最坏处理时间是O(1/ε),其最好处理时间是O(1),输出结果的频率值误差为∑_(i=2)^j(1-μi)×ki。