计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (22): 115-119.
班 磊,方启明,武永卫,杨广文
BAN Lei,FANG Qi-ming,WU Yong-wei,YANG Guang-wen
摘要: 采用类似于LSI的方法,对于blog网页的链接进行了一次关于潜在语义的探索,借以发现网络社区。从实验的结果来看,基本验证了最初的想法,网页链接在一定程度上包含潜在语义的信息。注意到语义网与现今的HTML网页在链接问题上思想基本一致(只是多了语义的标记),因此该方法同样适用于语义网内的社区发现与信息检索,这也是进行研究初衷。另一个贡献是通过幂迭代对GMC聚类作了算法上的优化,使得在海量数据上的处理速度大大加快。