首页 热点 业界 科技快讯 数码 电子消费 通信 前沿动态 企业前沿 电商

基于熵值法的电能表检测技术的研究

2023-04-07 12:18:05 来源 : 文秘帮

摘要:随着电能表的数字化,许多检测技术的相关问题成为研究热点。针对电能表数据篡改的检测需求,对一种基于熵值方法的多维度的电能表异常检测方法进行研究。以补充常规检测系统仅分析单一时间序列的不足。证明了熵值方法对于多种数据源的检测均具有鲁棒性,并在此基础上对维度、窗口长度及测试时间尺度等参数进行研究,最终完成了对重要参数的优化。

1.引言

可再生能源的使用成功地推动了电网数十年来得重大变革,即从集中控制的电力供应到智能的分散式电源[1]。然而,随着电网组件之间的连接越来越紧密,它们也更容易受到攻击,欺诈以及软件故障的影响[2]。近年来电能网的物理安全(例如物理篡改检测)以及电能表安全的检测方案逐渐成为研究热点[3-5]。研究者主要通过VR[6]、数据组合[7]及融合聚类[8]等方式对异常数据点进行检测,以达到反窃电的目的。此外基于用电信息的采集以完成大数据分析[9,10],也是检测电能数据异常的有效手段。本文介绍了一种电能表异常的检测方案,该方案可以通过有效检查智能电能表功率测量值的准确程度以监测电能盗窃行为。与传统的异常检测中观察单个数据源的方法不同,本文中的电能监测方法是在一段时间内参考多组相似数据源的预期能源需求特征,并以熵值作为评价标准,完成了对影响检测率的两个重要参数,即计算熵值的窗口长度和测量数据的时间尺度的优化。


(相关资料图)

2.数据维度与检测方法

2.1检测流程

多个数据源或一个数据源的多个数据集是异常检测模型的重要扩展,相较于单一的数据源其主要的优势在于可以通过比较相似数据进而指出隐藏的异常。我们将多维度数据源与预测算法(Holt-Winters)结合,以消除每日模式带来的数据影响,得到应用于检测的电能表数据集,进而进行熵值计算与参数优化。

2.2数据集维度

由于用电数据具有多变且难以预测的特点,因此很难设计出静态的绝对值或最大差异阈值来揭露数据的篡改。可以通过对众多数据进行分类(例如通过对历史数据的分析,得到分类条件)来缓解数据的随机多变性,我们称这些分类为数据集维度。根据对实际数据的分析,我们将其分类定为时间(n)、家庭(m)及日期(k),即三个维度:(a)时间(n):一天内不同时刻的用电情况。(b)家庭(m):同一用电类别下不同客户的用电情况。(c)日期(k):一年内不同季节及不同特征日期(例如节假日、周末)。同一个数据集在不同的维度下可以表现出不同的特征,而单个维度是不足以进行检测的,我们将它整体构建为n*m*k的矩阵。通过将矩阵的每个维度视为异常检测的一个单独的分支,我们可以简化维度与检测概率的关系。通过假设每个维度在统计上都是独立的来计算检测总概率,我们对多组数据及其篡改数据进行组合,并通过不同维数多次检测,最终选择三组数据下的检测结果进行分析,如图1所示为不同维度下检测到篡改数据的概率,即检测准确率。可以看出随维数增加准确率均会上升,其中维度为1和维度为2的情况下差异较大,而在维度为2的情况加增加维度,准确率上升幅度较小。考虑到增加维数计算量将呈指数上升,选择维度2为多维处理的最佳维度。

2.3熵值分析

熵值分析法是一种聚合多个值而又不会丢失异常值信息的便捷方法。本文研究中将每个维度的数据分布汇总为单个值。根据熵基于不确定性的定义可知,当随机变量的结果具有同等可能性时,熵将最大化[11]。在本研究中,将0·log2(0)定义为0,根据上式,熵值变化范围为[0,log2(n)],为了进行更好的比较,需要对所得值进行归一化处理。本研究中将熵作为度量,进而以数学方式来跟踪特征随时间分布的异常值。通过分别计算不同时段电能表正常数据及篡改后数据的熵值并做出归一化处理,以此为标准进一步优化测试参数。

3.数据构建与参数优化

3.1多维数据集构建

近年来已经公开了一些监测得到的家庭电能表数据和环境参数的数据集。本研究使用Beckel等人提供的用电量和占用率(ECO)数据集[12],该数据及是用于非侵入式负载监控和占用率检测研究的综合数据集,提供单个用电设备每秒的占用率读数,主要包括了4个月内(2018年6月15日-2018年10月15日)的六个住房内真实的功率(W)测量结果,测量数据精确到小数点后第4位表示。根据实验中对不同影响的需求,本文主要使用两种方法对原始数据进行篡改。方法1是以0瓦对任意区域内的原始数据进行替换,替换最小长度为时间窗口,这种篡改方式是用来模拟智能电能表被切断一定时间的情况。而方法2则是将原始数据整体除以5,表示持续操作智能电能表以降低需求的情况。类型1的篡改数据容易与部分合法的负载曲线(例如睡眠时间用电暂停)混淆,因此需要在后续的熵值计算和分析中通过参数进行调整,以突出异常篡改与正常断电之间的差异。

3.2主要参数优化

3.2.1窗长度优化

通过大量实验研究及数据分析,可以确定窗长度和测量数据尺度为影响熵值差异的两个重要参数,本文通过对参数下引发的熵值差异情况进行对比分析,确定可行范围内可以最大程度地提高熵值差异的最优参数值。图2熵值随窗口长度变化情况:(a)维数为时间(b)维数为家庭。图2所示为在双维度(“时间”和“家庭”)下的六个正常的电能表数据(黑色)和篡改数据(虚线)的平均熵值随窗口长度的变化情况。本文中经篡改过的数据将始终显示异常,会导致熵较小,从图中可以看出,在窗口过小的情况下,正常数据得到的熵值低于篡改数据,这将导致判断错误,基于此参数将建立完全错误的模型。当窗口长度大于20,正常数据和篡改数据的熵差将随窗口长度增大而增大,当窗口长度达到48,两者熵差不再增加,过大的窗口长度将导致无法准确判断数据篡改的位置,因此将48定义为本检测方法的最佳窗口长度参数。

3.2.2测量时间尺度

本文优化的第二个参数是“测量时间尺度”,这对熵度量的准确性具有重要影响,常规印象中认为测量时间尺度越小,测试结果越准确。然而过小的测量时间尺寸下,正常数据中的正常用电波动也将被识别为非均匀的异常状态,导致测试结果出现错误。过小的测量时间尺寸会导致假性异常值的出现,而测量时间尺寸过大将无法精确找出不规则电能负荷曲线的伪造点,即窃电特定日期。因此最优的测量时间尺度应该为避免假性异常值条件下的最小尺度,为了确定该尺度,我们给出了不同时间尺度下的熵值分布情况((a)和(b))同时结合大量的计算。可以发现,熵值分布曲线下的面积越大,正常用电情况下出现的假性异常值越少,因此我们对不同测试时间尺度下计算得到的熵值曲线的线下面积进行统计,得到了图4所示曲线。通过曲线可以看出当时间尺度大于6时线下面积不再出现明显的增大,6天可以作为异常检测中的最佳时间尺度。

4.结论

本文主要研究了多维度电能数据的异常检测方法。通过熵值法对双维度的数据集进行进一步分析,证明了熵值方法对于多种数据源的检测均具有鲁棒性,并在此基础上通过分析熵值差异及对比筛选异常值效果来优化重要参数,确定了窗口长度的最优值为48,测量时间最优尺寸为6天。

参考文献

[1]李伟,丁涛,赵睿,侯慧娟.10kV电流互感器内嵌遥控装置的窃电分析[J/OL].电测与仪表:1-5[2020-05-15].

[2]赵震宇,邓高峰,朱亮,李赫,钟巨华,唐璐.用于反窃电的实时相量测量算法及装置硬件设计[J/OL].电测与仪表:1-7[2020-05-15].

[3]赵东芳,赵伟,荣潇,荣博,黄松岭.高压电能计量设备及其检验技术[J].电测与仪表,2019,56(23):1-10.

[4]熊德智,陈向群,陈奕蕾,关永前.智能用电监控装置的研制[J].电测与仪表,2019,56(05):143-147+152.

作者:沈昭 张硕 单位:广东电网有限责任公司广州供电局

中国电气工程学报 2021.2期

标签:

相关文章

最近更新
云天子 2023-04-03 08:46:13