摘要: 近年来随着垃圾短信过滤技术的进步,垃圾短信的特征也在发生变化,其中利用同音词伪装的垃圾短信,就能轻松逃避很多过滤系统的拦截。针对这个问题,利用同音词伪装其拼音不变的特点,提出了以拼音串作为提取垃圾短信特征的关键字,从短信中提取出普通向量和伪装向量,并分别作为输入量,进行相互独立的贝叶斯过滤的方法,最后综合两次过滤的结果,判断是否为垃圾短信。实验结果表明,该方法能有效地识利用同音字伪装的垃圾短信。
胡德敏,胡金龙. 一种针对同音词伪装的反垃圾短信系统设计[J]. 计算机工程与应用, 2013, 49(2): 92-96.
HU Demin, Hu Jinlong. System design against spam message disguised with homonym[J]. Computer Engineering and Applications, 2013, 49(2): 92-96.