计算机工程与应用 ›› 2015, Vol. 51 ›› Issue (9): 135-141.
郑海雁1,2,王远方2,熊 政1,李昆明1,崇志宏2,尹 飞1
ZHENG Haiyan1,2, WANG Yuanfang2, XIONG Zheng1, LI Kunming1, CHONG Zhihong2, YIN Fei1
摘要: 近似频繁模式衍生于频繁模式,综合了频繁项集与频繁子图的特点。针对该模式的研究集中在无标签图上,其应用场景主要为社交网络、语义网络、智能电网等。近似频繁模式挖掘过程同时涉及频繁项集挖掘和频繁子图挖掘,因此已有的处理频繁模式挖掘算法无法较好地解决近似频繁模式挖掘问题。基于近似频繁模式结构,将其拓展到带标签图中,引入标签集约束,并设计标签集约束近似频繁模式挖掘算法LCPP(Label-Constraint Proximity Pattern),该算法并行部署在MapReduce计算模型中,弥补了开源pFP算法处理大规模数据时效率不高的缺点。实验结果验证了该算法的有效性和可扩展性,表明了LCPP算法是pFP算法的极佳补充。