改进随机森林在Android恶意软件检测中的应用

doi:10.3778/j.issn.1002-8331.2001-0291

计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (3): 130-136.DOI: 10.3778/j.issn.1002-8331.2001-0291

改进随机森林在Android恶意软件检测中的应用

熊健，覃仁超，何梦乙，刘建兰，唐风扬

西南科技大学计算机科学与技术学院，四川绵阳 621000

出版日期:2021-02-01 发布日期:2021-01-29

Application of Improved Random Forest Algorithm in Android Malware Detection

XIONG Jian, QIN Renchao, HE Mengyi, LIU Jianlan, TANG Fengyang

School of Computer Science and Technology, Southwest University of Science and Technology, Mianyang, Sichuan 621000, China

Online:2021-02-01 Published:2021-01-29

摘要/Abstract

摘要：

为解决Android恶意软件检测问题，提出一种利用多特征基于改进随机森林算法的Android恶意软件静态检测模型。模型采用了基于行为的静态检测技术，选取Android应用的权限、四大组件、API调用以及程序的关键信息如动态代码、反射代码、本机代码、密码代码和应用程序数据库等属性特征，对特征属性进行优化选择，并生成对应的特征向量集合。最后对随机森林算法进行改进，并将其应用到本模型的Android应用检测中。实验选取了6?000个正常样本和6?000个恶意样本进行分类检测，结果表明该方法具有较好的检测效果。

关键词: Android, 分类, 随机森林, 加权投票, 静态特征提取

Abstract:

In order to solve the problem of Android malware detection, a static detection model of Android malware based on improved random forest algorithm using multiple features is proposed. Android application’s multiple attribute features are selected by static detection technology, which include permission, intents, API and key information such as dynamic code, reflection code, native code, password code, and database. Information Gain（IG） algorithm is used to optimize the selection of feature attribute，then generate the corresponding feature vector set. The random forest algorithm is improved and applied to the Android application detection of this model. The experiment selects 6,000 normal samples and 6,000 malicious samples for classification detection, and the results show that the method has a better detection effect.

Key words: Android, classification, random forest, weighted voting, static feature extraction

熊健，覃仁超，何梦乙，刘建兰，唐风扬. 改进随机森林在Android恶意软件检测中的应用[J]. 计算机工程与应用, 2021, 57(3): 130-136.

XIONG Jian, QIN Renchao, HE Mengyi, LIU Jianlan, TANG Fengyang. Application of Improved Random Forest Algorithm in Android Malware Detection[J]. Computer Engineering and Applications, 2021, 57(3): 130-136.

[1]	王永贵，李倩玉. 基于KNN-GBDT的混合协同过滤推荐算法[J]. 计算机工程与应用, 2021, 57(9): 103-108.
[2]	杨春霞，李欣栩，吴佳君，刘天宇. 基于注意力交互机制的层次网络情感分类[J]. 计算机工程与应用, 2021, 57(9): 134-139.
[3]	张韩钰，吴志昊，徐勇，陈斌. 增强卷积神经网络的人脸篡改检测方法[J]. 计算机工程与应用, 2021, 57(8): 220-224.
[4]	李俊丽. Spark平台下类别数据互信息计算的并行化[J]. 计算机工程与应用, 2021, 57(7): 95-100.
[5]	韩卫宇，程龙生. 结合马田系统-SVM的滚动轴承故障模式分类研究[J]. 计算机工程与应用, 2021, 57(6): 239-246.
[6]	霍光煜，张勇，孙艳丰，尹宝才. 基于语义的档案数据智能分类方法研究[J]. 计算机工程与应用, 2021, 57(6): 247-253.
[7]	韩东方，吐尔地·托合提，艾斯卡尔·艾木都拉. 问答系统中问句分类方法研究综述[J]. 计算机工程与应用, 2021, 57(6): 10-21.
[8]	黄金杰，蔺江全，何勇军，何瑾洁，王雅君. 局部语义与上下文关系的中文短文本分类算法[J]. 计算机工程与应用, 2021, 57(6): 94-100.
[9]	杨晔民，张慧军，张小龙. 随机森林的可解释性可视分析方法研究[J]. 计算机工程与应用, 2021, 57(6): 168-175.
[10]	李硕，梁毅. 面向Spark的批处理应用执行时间预测模型[J]. 计算机工程与应用, 2021, 57(5): 79-87.
[11]	王凤琴，柯亨进. 卷积神经网络及其分析在抑郁症判别中的应用[J]. 计算机工程与应用, 2021, 57(5): 245-250.
[12]	陶体伟，刘明霞，王明亮，王琳琳，杨德运，张强. 基于有效距离的低秩表示[J]. 计算机工程与应用, 2021, 57(4): 141-147.
[13]	郑诚，董春阳，黄夏炎. 基于BTM图卷积网络的短文本分类方法[J]. 计算机工程与应用, 2021, 57(4): 155-160.
[14]	佘海龙，解山娟，邹静洁. 标准分数降维的3D-CNN高光谱遥感图像分类[J]. 计算机工程与应用, 2021, 57(4): 169-175.
[15]	于多，黄永东. 基于SPCA和域变换递归滤波的高光谱图像分类[J]. 计算机工程与应用, 2021, 57(4): 199-208.

改进随机森林在Android恶意软件检测中的应用

Application of Improved Random Forest Algorithm in Android Malware Detection

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics