计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (2): 213-220.DOI: 10.3778/j.issn.1002-8331.1709-0378
任才溶1,谢 刚1,2
REN Cairong1, XIE Gang1,2
摘要: 空气污染不仅危害人类的身心健康,而且还会制约城市的经济发展,其中PM2.5带来的影响尤为突出。为了方便准确地预测出空气中的PM2.5浓度等级,提出了一种基于随机森林的PM2.5浓度等级预测方法,特征因子采用太原市2013年—2017年的气象数据、预测站点的PM2.5浓度变化的时间规律以及与周围站点的时空关联性。该方法首先利用K-Means算法对原始气象数据聚类,降低不同分类器之间的相关性,然后利用欠采样方法对数据进行平衡采样,减少类不平衡对分类器性能的影响,最后利用泛化能力好的随机森林构建预测模型。经过真实数据验证,该方法对PM2.5浓度等级预测具有较好的精确度、召回率与[F]值。