计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (17): 260-265.DOI: 10.3778/j.issn.1002-8331.1603-0110
许元斌1,李国辉2,3,郭 昆2,3,郭松荣2,3,林 炜2,3
XU Yuanbin1, LI Guohui2,3, GUO Kun2,3, GUO Songrong2,3, LIN Wei2,3
摘要: 电力企业通常根据电力负荷数据,采用传统的K-Means算法对客户进行划分,而这种方法最大的缺陷就是必须由用户手动指定聚类簇数。提出了一种将Canopy算法和K-Means算法结合应用于负荷聚类的方法,无需手动指定聚类簇数。收集到的用户历史用电数据,使用并行计算框架MapReduce对原始数据进行预处理。应用Canopy和K-Means算法建立自动负荷聚类模型。在真实用电数据上进行实证分析,通过使用Silhouette指标对结果进行评估,证明提出的方法更加稳定和具有广泛的适用性。