计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (1): 165-171.DOI: 10.3778/j.issn.1002-8331.1809-0107
胡雪娇,陈行健,赵南,薛卫
HU Xuejiao, CHEN Xingjian, ZHAO Nan, XUE Wei
摘要: 提出了一种基于PSO_BFA优化的词袋模型。传统词袋模型有两个重要参数:窗口大小[d]和字典大小[k]。结合粒子群算法和细菌觅食算法产生新的PSO_BFA混合优化算法,在PSO进行局部搜索时,加入BFA的复制和迁移行为,得到PSO_BFA的最优解即为窗口大小和字典大小的最佳组合。将优化词袋模型与蛋白质序列的氨基酸组成算法和伪氨基酸组成算法结合,获得蛋白质序列的词袋特征。实验结果证明,基于PSO_BFA优化的词袋模型能有效提高蛋白质亚细胞定位预测的精度。