在采集建筑平台数据时,由于通信中断、设备故障、用户运维不当等,会导致数据中存在缺失、突变等问题。因此,在建筑能耗数据挖掘及能耗分析前,需要对从监测平台采集到的数据进行预处理,提高获取数据精度。
建筑能耗数据预处理包括:识别缺失和异常的用电能耗数据;填补缺失及异常的用电能耗数据。
建筑能耗数据中,异常值通常分为数据传输导致的异常及运行规律异常。如果预处理后的能耗数据用于某建筑的数据挖掘,则只需识别数据传输导致的突变数据以及数据长期保持不变的异常数据;如果预处理后的数据用于建立某建筑的能耗基准,则还需对其运行规律导致的异常数据进行识别并剔除。
目前比较公认的异常分类方式是分为三种:
(1)单点异常:
这类异常也可以成为全局异常,即某个点与全局大多数点都不一样,那么这个点构成了单点异常。
(2)上下文异常
这类异常多为时间序列数据中的异常,即某个时间点的表现与前后时间段内存在较大的差异;在某一上下文是正常的,另一个上下文是异常的。比如,在周末假期时间,由于运维不当导致建筑每小时的照明消耗值不正常;但如果在正常工作日时,该能耗值则不是异常。
(3)集体异常
这类异常是由多个对象组合构成的,即单独看某个个体可能并不存在异常,但这些个体同时出现,则构成了一种异常。比如,由于断电维修等导致能耗值长期处于零值。
扫码添加微信,一对一咨询产品、免费报价