计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (4): 106-112.DOI: 10.3778/j.issn.1002-8331.1507-0239
王永贵1,张 燕1,杨东东2
WANG Yonggui1, ZHANG Yan1, YANG Dongdong2
摘要: 对于无线城市数据中社团发现问题,针对已有的团搜索(CS)算法运行过程生成大量重复团、生成结果冗余、算法时间复杂度较高等问题,从优化边存储、预先进行边处理、搜索建团入手,用特殊的二叉树结构存储、权重[K]选择排序、深度优先遍历构建T-CS算法。针对海量数据溢出问题,结合MapReduce模型,提出了MP-T-CS算法。实验证明,MP-T-CS算法不仅可以解决运行过程大量重复团问题,时间代价大大降低,对海量数据的处理能力大大提升,生成团的代表性大大提高。