摘要: 应用MaxCompute实现变压器局部放电相位分析 1 引言 随着智能电网建设的不断推进,智能化电力一次设备和常规电力设备的在线监测都得到了较大发展并成为趋势,监测数据日益庞大,电力设备在线监测系统在数据存储和处理方面面临巨大的技术挑战。
应用MaxCompute实现变压器局部放电相位分析
1 引言
随着智能电网建设的不断推进,智能化电力一次设备和常规电力设备的在线监测都得到了较大发展并成为趋势,监测数据日益庞大,电力设备在线监测系统在数据存储和处理方面面临巨大的技术挑战。
局部放电是高压设备的重要监测内容。局部放电相位分析方法是目前成熟且应用广泛的宏观特征提取方法。随着传感器技术的进步,局部放电的检测方法呈现多样化,局部放电信号的频率高且频带较宽,这就要求信号采样率高,可以达到KHz甚至MHz(每秒采样百万次),加之需要监测的设备众多,因此监测数据量呈现海量化,传统的基于单机的存储和相位分析已经难以满足当前海量数据的计算需求,迫切需要大数据处理技术的支持。
笔者在前期的研究中,使用了实验室自建的Hadoop平台,遇到的问题主要包括:1)受资金限制,集群规模较小,存储和计算资源有限。2)集群维护困难;3)服务仅在单位内网可用;4)前期需要购买硬件资金投入高,设备的利用率又很低。5)并行程序框架限制:Hadoop的MapReduce在每一轮操作之后,数据必须存储到分布式文件系统上或者HBase,接下去的Map任务执行了冗余的IO操作,导致性能下降。
公有云计算平台以按需租用的方式,将用户从硬件采购、组网、平台搭建、系统软硬件维护中解脱出来,将存储资源、计算资源以Web Service的方式封装,并对外售卖,使用户可以专心于构建系统的业务逻辑。笔者尝试利用阿里云MaxCompute存储变压器局部放点数据,并加速相位分析过程。实验结果表明,该方法相比于Hadoop MapReduce在计算效率上明显提升,并在数据可靠性、服务可用性以及成本方面具有明显优势。
2 局部放电数据的MaxCompute表存储
局部放电相位分析将多个工频周期内监测所得的局部放电参数(放电次数N、视在放电量Q或放电幅值,及放电所在相位Φ)折算到一个工频周期内,计算其统计规律性,获取放电谱图,统计放电特征,用于模式识别。
MaxCompute以表(Table)为基本单元存储数据,与Hadoop的文件系统(HDFS)以文件为单位存储数据有明显差别,表的模式不能直接套用HDFS文件的格式,需要重新设计存储模式。局部放电信号采样数据(二进制dat文件)在上传至MaxCompute前,需要转换成文本文件格式(.csv文件),再使用Tunnel工具将本地数据上传至MaxCompute表。
如果使用HDFS文件存储,可以每行存储一个工频周期的采样数据(本文中,含80万个采样点),之后执行MapReduce分析任务时,可以将一行数据作为Map函数的输入。但是MaxCompute表的列数和表格单元的数据类型存在限制,列的数量不能超过1024列,表格单元的数据类型目前仅支持6种数据类型(Bigint,Double,String,Boolean,Datetime,Decimal),因此无法在一行内存储80万个采样值。这就需要重新设计表结构。本文中,设计了表MPD,用于存储原始采样数据,如图1所示。MPD采用2级分区,其中第1级分区名名称是DeviceID,表示设备ID。第2级分区是采集时间。
图1 MPD表结构
Maxcompute支持分区,这里以分区键作为检索条件,可以大幅减少数据搜索范围,并能快速定位到所需数据,有效提升访问性能,并节省费用。
局部放电数据分析过程中,需要产生中间结果数据,因此又设计了基本参数NQF表和放电谱图PT表,表模式如下:
表1 NQF表
SampleID |
Time |
Phase |
Max |
样本ID |
时间 |
相位 |
峰值(统计得到) |
其中,SampleID表示用于完成一次特征计算的谱图数据的编号。
表2 PT表
SampleID |
Wid |
TotalQ |
AverageQ |
Nums |
Max |
样本ID |
窗编号 |
放电总量 |
平均放电量 |
放电次数 |
峰值 |
相位分析最终产生的结果是放电波形数据的统计特征,包含:正负半周期谱图偏斜度Sk、陡峭度Ku、局部峰点数Pe、互相关系数Cc等,如表3所示。
表3 统计特征表
SampleID |
SkN |
SkQ |
KuN |
KuQ |
PeN |
PeQ |
Cc |
QF |
MCC |
这些特征的含义在此不做过多解释,请查阅相关文献。
3 使用MR2完成放电数据的相位分析
MR2是MaxCompute的扩展MapReduce模型,可以在Reduce后面直接执行下一次的Reduce操作,而不需要中间插入一个Map操作,这可以有效减少磁盘IO。可以支持Map后连接任意多个Reduce操作,比如Map-Reduce-Reduce…。
相位分析过程需要多个MapReduce任务串联完成,如图2所示。
图2 相位分析MapReduce任务关系
格式转换是为了将采样数据上传至ODPS表而做的数据预处理,主要任务是将二进制采样数据转换成Tunnel能够使用的文本格式。
子任务1用于提取基本统计参数n-q-φ,需要扫描MPD表指定分区,找到放电过程,并记录放电相位和幅值。Mapper函数对逐条输入的采样数据,根据预先设定的纵向阈值进行数据筛选,并将大于阈值的采样点输出至Combiner。Combiner是本地(与Mapper在相同的节点)执行的汇总,对Mapper的输出结果集合,寻找峰值点,并输出至Reducer进行汇总。Combiner有效的分担了Reducer的数据汇总工作,并且减少了Reducer所在节点传输的数据量,可以有效提升并行计算过程的速度。Reducer函数负责汇总由Combiner输出来的极值点,并使用预先设定的横向阈值进行极值点的筛选。如果两个极值点距离“很近”(相位差小于横向阈值),则认为是同一次放电。输出的结果存储于NQF表。
子任务2接收NQF表的数据作为输入,计算放电谱图和统计特征。为了加快计算速度,设计了Map-Reduce1-Reduce2模式的计算过程,使谱图数据作为中间结果缓存在Maxcompute分布式内存中,节约了磁盘读取的开销。Reduce1和Reduce2的连接使用了Maxcompute提供的Pipeline完成。子任务2最终的输出是统计特征表,可以用于后续的模式识别任务,模式识别可以写程序完成,或者使用阿里云机器学习平台去完成。
4 实验分析
在实验室完成了电晕放电、悬浮放电、气泡放电和油中放电实验。局部放电信号采集仪器采用TWPD-2F局部放电综合分析仪,最大采样频率为40MHz,采集信号的有效频带为40k~300kHz。
为验证所设计的分析算法性能和稳定性,选取了不同大小的数据集,如表4所示。数据集1x表示1倍数据,包含50个文件(50条局放数据),本文中选用50条局放数据进行1次统计特征的提取。
表4 实验用数据集
数据集ID |
记录数(dat文件数)(条) |
dat(GB) |
csv(GB) |
MaxCompute Table(GB) |
Table记录数(万条) |
压缩比 |
1x |
50 |
0.305 |
0.898 |
0.203 |
4000 |
4.421 |
2x |
100 |
0.61 |
1.75 |
0.425 |
8000 |
4.118 |
4x |
200 |
1.22 |
3.5 |
0.852 |
16000 |
4.108 |
8x |
400 |
2.44 |
7 |
1.523 |
32000 |
4.596 |
16x |
800 |
4.88 |
14 |
3.447 |
64000 |
4.061 |
32x |
1600 |
9.76 |
28 |
6.394 |
128000 |
4.379 |
64x |
3200 |
19.52 |
56 |
12.688 |
256000 |
4.414 |
128x |
6400 |
39.04 |
112 |
25.972 |
512000 |
4.312 |
256x |
12800 |
78.08 |
224 |
51.952 |
1024000 |
4.427 |
分别在单机环境下、实验室自建的Hadoop平台(6个计算节点)下和Maxcompute平台下完成放电数据的相位分析,(分别命名为S-PRPD、Hadoop-PRPD、ODPS-PRPD),测量算法执行的时间、使用的硬件资源(CPU、内存)进行性能对比,如图3、图4、图5所示。
图3 相位分析执行任务执行时间
在图3中,S-PRPD算法在单机环境下运行,执行时间随数据量增加急剧增长。只完成了4X数据集的分析任务(更大数据量耗时太长)。Hadoop-PRPD算法在自建Hadoop平台下执行。受存储容量和计算性能影响,实验只完成了16x数据集的分析任务,算法执行时间缓慢增长。ODPS-PRPD算法运行在Maxcompute平台下,完成了256X数据集的分析(还可以更大),运行时间平稳,在数据规模成倍增长情况下,整体运行时间增长很少或不增长,甚至,在分析8X数据集时出现负增长。主要归因于ODPS硬件的弹性伸缩,如图4和图5所示。
图4 CPU核心数的消耗
图5 内存消耗
从图3和图4中可以看出,随着数据规模的增长,ODPS-PRPD使用的硬件资源总体呈现线性增长的趋势。数据规模越大,为其分配的硬件资源越多,但也不是严格的线性关系。Maxcompute为并行任务分配的硬件资源有一个复杂的算法实现,目前阿里云尚未公开,使用者暂不能控制资源的分配。虽然底层细节对用户透明,但是这种弹性伸缩的性质还是能够强有力的为大数据分析助力。当数据规模达到51GB(256x)时,使用的CPU核心数达到了1093,内存达到了1639GB。这种硬件条件是目前很多数自建数据处理平台难以达到的。
最后来说一下成本费用。Maxcompute采用租用的方式,无需自行购买硬件设备和软件,相对自建Hadoop或者其他大数据分析平台,前期投入成本极低。Maxcompute以项目(Project)为单位,对存储、计算和数据下载三个方面分别计费。数据上传目前暂不收取费用。存储价格目前是0.0008元/GB/小时,计算费用是0.3元/GB。计算费用中,目前仅开放了SQL的计费,执行MapReduce暂时是免费。因此,本文实验实际产生的费用只有存储费用,做几天的实验,只花了几元钱。
相关推荐
对于“小波分析对变压器局部放电信号进行去噪处理”这个项目,文件名“小波分析对变压器局部放电信号进行去噪处理”可能包含MATLAB脚本、数据文件以及相关的解释文档。通过运行这些文件,我们可以深入理解如何利用...
近年来,随着经济建设的不断发展和人民生活水平的提高,对供电可靠性的要求也愈来愈高,而作为电力系统中主要设备之一的电力变压器的局部放电检测也受到了电力行业越来越多的重视。如果变压器出现局部放电现象,很有...
利用SVM优化算法实现变压器局部放电信号prpd模式识别及其特征提取
为提高矿用干式变压器局部放电模式识别准确率,提出了一种矿用干式变压器局部放电模式识别方法。首先,采用正交匹配追踪算法对原始局部放电信号进行去噪,最大程度保留原始局部放电信号的有用信息;然后,通过自回归模型...
在《行业分类-电子政务-变压器局部放电试验的电压相位校准装置.pdf》文档中,可能详细介绍了电压相位校准装置的原理、结构、操作方法以及在电子政务背景下如何应用于电力行业的实际案例。通过深入学习这份资料,读者...
通过分析局部放电的数据,可以对设备状态进行评估,预防可能的故障发生。 【描述】"matlab绘制局部放电三维谱图源代码" 暗示了这个项目的核心在于使用MATLAB的编程能力,创建一个可视化工具来展示局部放电的数据。...
"基于自适应粒子群算法的变压器局部放电定位研究" 本文研究的主要内容是基于自适应粒子群算法的变压器局部放电定位。随着电力系统安全运行的要求...5. 基于自适应粒子群算法的变压器局部放电定位方法的优点和应用前景
该系统的设计思路是基于ARM处理器的信号采集和处理能力,结合超声波预处理电路,实现对变压器局部放电超声波信号的实时采集和处理。系统的主要组成部分包括: 1. 超声波预处理电路:用于将超声波信号预处理和放大,...
本研究以“变频电源在电力变压器局部放电试验中的应用研究”为主题,探讨了变频电源在检测和分析变压器局部放电问题上的重要作用。 局部放电试验是评估变压器绝缘状态的重要手段,传统的工频电源由于其固定频率特性...
局部放电试验是电力设备,特别是高压电气设备如500kV变压器的重要检测手段,其目的是评估设备内部绝缘状态,预防潜在的故障。本文由王国柱和马保东两位专家撰写,发表在《河北电力技术》期刊上,具体刊载于2011年第...
局部放电是电力系统中的一种常见现象,尤其在高压电缆、变压器等电气设备中,它可能预示着设备内部的绝缘缺陷。Matlab是一款强大的数值计算和数据分析软件,其Simulink模块则提供了图形化的仿真环境,适用于进行复杂...
最后,通过信号强度的差异和传播时间,可以确定放电源的位置,从而实现局部放电的定位。 文档可能涵盖了以下关键知识点: 1. **局部放电基础知识**:解释局部放电的类型、形成原因、影响因素以及其对变压器绝缘...
《电子功用-变压器局部放电特高频定位分析器及其定位分析方法》是针对电力系统中变压器维护与故障诊断的重要技术资料。这份文档深入探讨了变压器局部放电的检测与分析,特别是利用特高频(Ultra High Frequency, UHF...
数据分析算法通常采用时域分析、频域分析和模式识别等方法,以揭示局部放电的特征参数,如放电脉冲的数量、幅度、相位分布等。而故障诊断策略则根据这些参数来判断设备的健康状态,预测可能的故障模式,从而提前采取...
例如,Ck为变压器的静电容量,CB1、CB2为连接变压器的电缆电容,而fc和Δf分别代表脉冲电流信号的中心频率和频带宽度,这些都是分析变压器绝缘性能和局部放电特性的重要参数。 总结而言,脉冲电流法在矿用防爆...
电子政务是政府机构利用信息技术,...综上所述,这个压缩包中的内容不仅涉及到电力系统的核心技术——变压器局部放电的带电测试,还可能探讨了电子政务在这一领域的应用,为电力行业的运维人员提供了宝贵的参考资料。
综上所述,《电子政务-变压器局部放电在线监测方法及其设备》这一资料详细介绍了变压器局部放电的定义、影响因素、监测技术以及相关设备,同时探讨了电子政务在电力行业的实际应用,对于理解和提升电力系统的安全...
基于粒子群优化算法的变压器局部放电定位新方法 ...本文提出了一种基于粒子群优化算法的变压器局部放电定位新方法,该方法可以有效地解决放电源定位计算中的计算复杂性问题,并且可以实现局部放电点的定位。
结合“行业分类-电子政务-变压器局部放电巡检用传感器.pdf”这个文件名,我们可以推测这份资料可能详细介绍了如何将电子政务的理念和技术应用到变压器局部放电巡检的管理中。可能涵盖的内容包括: 1. 电子政务平台...