摘要: 面向大规模特征集的字符串匹配技术在病毒检测、内容过滤等问题上的应用愈加广泛,而短模式串一直是阻碍性能提升的重要瓶颈。针对短模式串进行分析讨论,基于跳跃算法优化,采用了动态块大小和动态Hash处理以及Hash函数设计场景化的策略,同时探讨了多核处理器与多线程设计之间的关系。实验数据证明改进的算法策略具有支撑百万级特征集字符串匹配的能力。
李志文,张 伟. 一种面向大规模短特征集的字符串匹配技术[J]. 计算机工程与应用, 2014, 50(1): 105-110.
LI Zhiwen, ZHANG Wei. String matching technology for large-scale short pattern set[J]. Computer Engineering and Applications, 2014, 50(1): 105-110.