摘要: 传统的序列模式挖掘算法应用在生物序列上有其局限性,根据生物序列的特点,提出了基于相邻频繁模式段的模式挖掘算法-JPS。首先产生相邻频繁模式段,然后对这些频繁模式段进行组合,产生新的频繁模式。通过实验分析,该方法在相似性很强的序列数据库中比传统的PrefixSpan算法效率高。通过对真实的蛋白质序列家族库的处理,证明该算法能有效处理生物序列数据。
王 淼,尚学群,薛 贺. 基于相邻模式段组合的生物序列模式挖掘算法[J]. 计算机工程与应用, 2008, 44(2): 190-193.
WANG Miao,SHANG Xue-qun,XUE He. Joined pattern segment-based sequential patternmining algorithm for biological datasets[J]. Computer Engineering and Applications, 2008, 44(2): 190-193.