计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (14): 1-7.DOI: 10.3778/j.issn.1002-8331.1905-0068
易成岐1,黄倩倩1,王从余2,张何灿3,靳晓锟4,王建冬1
YI Chengqi1, HUANG Qianqian1, WANG Congyu2, ZHANG Hecan3, JIN Xiaokun4, WANG Jiandong1
摘要: “职业举报人”团伙化、规模化、专业化、低龄化作案趋势日趋明显,政府部门对其识别大多采用人工鉴别的方法,造成了大量人力资源的浪费。采用Bootstrapping数据重采样技术,结合文本、时间和举报人属性等特征,在解决类不平衡数据的过拟合问题基础上,实现了“职业举报人”的准确识别。实验结果表明,相比过采样和欠采样技术而言,利用Bootstrapping重采样技术识别准确率更高,采用CFS方法结合BestFirst策略对数据特征进行优化,在保证精度的前提下能够实现更高的计算效率。以全国12358价格监管平台的真实数据为驱动,验证了方法的有效性,对比分析了“职业举报人”和正常消费者的投诉举报行为习惯差异。