【电力大数据】电网企业预测日售电收入现金流应该这么来!

折纸        2019-08-18   来源:桓文瑶爱宠物

正文约6000字,预估用时10分钟。


1

为了保障电网企业的良好运营,合理平衡各项收支计划,实现公司资金的智能化动态排程,已经成为电网企业财务管理的一项重要工作内容。其中,准确预测公司售电收入情况,提高资金流转率,助力企业合理安排资金预算,避免大量资金存在账上,对企业有着深远意义。



Tips:本文以某地区历史售电收入现金流的加密数据为基础,以实现未来2个月的月度、日度售电收入现金流预测为目标,开展了多轮次的建模调优、形成了多模型集成应用、以及保障预测功能精准稳定运行的算法群。


(本文图表数据基于某几个网省的分析成果,已做脱敏处理;各网省情况不同,技术路线可以复用,但效果不可一概而论,需要结合实际情况具体分析。)


一、  售电收入现金流预测要实现什么


从财务口径来看,账户的资金包含售电收入、业务费、充值卡销售收入、利息、趸售、其他费用等等,来源复杂,渠道多样。在脱离源业务的情况下,财务人员很难对现金流量进行准确预测,往往需要先将现金流量根据业务类别拆分到各对应业务部门进行预估,再到财务系统进行统一汇总。


为了遵循财务系统“抓大放小”、“自上而下”、统一排程的策略,同时立足营销业务需求,我们从财务管理的整体目标中,将售电收入现金流预测目标剥离出来,采用大数据分析技术,实现省、市两级地区的月度、日售电收入现金流预测,具体而言,分为以下2个目标:


a、月初实现未来2个月的月度售电收入预测,预测误差控制在3%以下;同时随着时间演进不断修正预测结果使之更加准确,当月25日以后月度售电收入预测误差控制在1%以下;


b、月初实现未来2个月的日售电收入预测,在当月25日以后实现日累计售电收入预测误差值控制在1%以下。


二、  想做好其实并不容易


想要做好售电收入现金流(以下简称:售电收入)预测,就要充分考虑各种因素的影响,现实中影响售电收入的因素很多,如:


  • 天气(下雨、酷热等极端天气会影响人的出行,进而影响群众的缴费行为)

  • 节气(节气决定了农作物的种植与排灌,对农村居民的缴费行为产生影响)

  • 节假日(节假日由于休息,人工缴费量会较少)

  • 特殊事件(国家政策调整,电价调整)

  • 欠费行为(发行电费不一定全部缴费)

  • 各渠道到账周期有差异


通过观察历史日售电收入分布图,可以发现受多种因素的影响,日售电收入呈现波动性强,规律不稳定的特征。

                           

图1:日售电收入时序图


除了波动性强以外,日售电收入还存在数据流转延迟的问题,造成预测难度的增加,主要表现在以下三个方面:


a、由于各系统在流转中会有时间差,进而导致在预测时获取的售电收入数据会有延迟,普遍延迟在1-7天左右;

b、由于系统维护以及年底关账等影响,导致会有一段时间出现数据缺失;

c、售电收入在月结前金额会发生变化,并且该月的售电收入要到次月2号才能取到数据。


三、  传统做法存在的问题


在传统的做法中是如何预测售电收入呢?


总体而言,传统做法大多采用简单的统计分析和基于经验判断这类粗线条式的预测模式,并且,传统做法多依赖于专家经验,按单位进行预测,然后向上逐层汇总,得到整个企业的售电收入预测值。


传统的做法简单方便,但在实际使用当中,存在以下问题:


a、预测不准确:这是传统做法必然会面临的问题,由此会导致客户的资金安排出现冗余或断层;

b、依赖于有经验的员工:当出现人员调动时,没法在短期内恢复原有根据经验预测的精度,稳定性差;

c、浪费人力:在传统做法当中,多少会占有一定的工作量,并且人工处理时总会出现犯错的情况,而机器可以避免犯错;

d、耗时长:由于需要各级预测后向上汇总,经历的时间较长。


四、  大数据如何准确预测售电收入


大数据预测,主要是基于业务经验,通过分析大量数据,挖掘影响售电收入的各个因素,并从一定的数理角度上反映预测的稳定性、效果等。


基于一定的研究之后,我们最终确立了以月售电收入预测为基础,辅以日占比预测,进而得到日售电收入预测结果


依靠大数据预测技术,客户可以每日更新当月的预测售电收入金额,实时修正后续日售电收入预测,能容纳突发情况带来的变化,以此更好的分配当月的资金使用。并且随着时间的推移,能不断掌握后续的环境变化,跟随流量趋势的变化快速调整对应的预测值,达到持续预测准确的效果。


由于预测目标覆盖的时间窗口较长(包含当月及次月),在对当月的月、日售电收入进行预测时可以不断增加新的已发生的数据以实现预测结果的更新和修正;而针对次月预测目标,则很难加入新数据进行修正,只能依赖一次性预测结果。因此,在本文中,主要阐述当月的月、日售电收入预测及滚动修正的实现方案。


1

技术初探——直接上模型的效果很差


提到大数据分析,很多人会想从单一用户入手,先预测单户的收入及到账情况,最后合计到一起,然而,首先,电力用户数量庞大,单一用户用电、缴费规律波动较大,很难准确预测;其次,直接做日售电收入预测也很难实现。由于预测周期较长,在构建模型时难以纳入最新的数据因素,且日到账规律有很强的不规则性,直接采用模型预测的效果并不好;再者,使用时间序列,回归、神经网络等单一算法,由于数据规律和算法本身的局限性,很难保证每一次预测都很准确,不能单纯地依赖于某一种算法解决问题。

2

模型构建——提升预测效果的“两步走”策略


先预测月售电收入,进而预测日售电收入,可以有效提升预测效果。


既然无法直接通过算法对售电收入进行预测,那么该怎么解决这个问题呢?

为此,研究人员重新返回数据底层,通过对售电收入在不同维度上的数据表现进行观测,结合现场反馈的业务实际,得到以下两点结论:


a、月售电收入有一定的规律,这与用户的用电规律息息相关。以下是历月售电收入拆分时序后的结果。


图2:月度售电收入时序分解图


b、日售电收入在单月内分布有一定的规律,这取决于用户的缴费习惯以及核算单位的收费政策。


图3:日售电收入水平热力图


基于上述两个重要结论,建模人员分别展开了月售电收入预测与日占比预测两块工作。这两块工作之间存在着相辅相成的关系,最终的预测结果是站在月售电收入预测结果的肩膀上,对日售电收入进行分配。


在实行过程中,我们考虑了随着当月每日预测的进行,灌入模型的数据也会越来越多,除了在月初进行一次月售电收入预测以外,在当月的每一天也可以对当月的预测值进行修正,实现了月度售电收入预测精度的提升,同时也提高了每日售电收入预测的精准率。


至此,完整的预测模型架构也清晰可见了:


首先,使用ARIMA、回归等算法预测当月售电收入;其次,根据历史各日期售电收入规律,预测各日期对应的日度量系数(当日售电收入金额与月度售电收入金额的比值);再者,将月度总额按照度量系数分配到各对应日期。其中,随着时间的演进,可以根据已发行电费回归修正当月总额,采用滑动算法剔除已发生日期的售电收入金额,动态调整各日预测值。


图4:日售电收入大数据建模技术路线


在当前技术路线的指导下,模型已经在两个省级供电单位进行了应用实践,目前的平均月度预测偏差稳定在3%以内,除特殊节点以外的日平均预测偏差在20%以内,日累计预测偏差在4%以内。


3

应用提升——多模型集成应用保障预测功能精准稳定的运行


通过增加模型提升月售电收入预测效果,通过增加特征指标提升日售电收入度量系数预测效果。


上一轮的优化已经带来了质的飞跃,其预测精度在一定程度上已经可用,为何还要有本轮的优化呢?


由于上述的预测效果是在测试集上生成的,而实际应用当中,除了已经考虑的因素以外,还会有突发性的影响事件(如:调价等)。因此,在预测时除了需要抓取过去的特征,还要能在一定的时间内调整突发性事件带来的影响,增加模型的稳定性与适应性。


所以,在上述版本之后,月售电收入预测除了原有的模型之外,增加了许多新的模型,通过集成模型的方式提高月售电收入预测精准率,并且通过增加特征指标,以实现及时调整日占比预测效果。


图5:售电收入预测技术路线优化

      

下文将针对具体目标对每一种模型进行说明。


1ARIMA模型

观测数据规律发现,月度售电收入序列呈现出较为明显的周期性,可以考虑使用时间序列分析的方法进行预测。


图6:某网省月度售电收入


应用时间序列分解算法,将用户月售电收入进行序列分解为趋势分量序列、季节周期分量序列和随机分量序列,其中对趋势分量采用ARIMA模型进行预测,对季节周期分量按“近大远小”原则,采用基于历史同期同类分量的加权法进行预测,对随机分量采用历史同期同类的平均值进行预测。最后将这三个序列分别进行预测得到的三个序列值合计得出月售电收入预测值记为:P_ARIMA。


同时,考虑春节高负荷用电天数缩减的影响,对春节影响月份的天数进行了适当的调整,构建月度日均售电收入时间序列,同样调用季节性ARIMA模型,得到日均售电收入预测值后,根据月调整后天数还原得到月度售电收入预测值。


以上两种方式均采用同一算法,但是对建模数据进行了不同的处理,因此,将基于原始月度售电收入时间序列得到的预测值记为:p_normal,基于日均售电收入时间序列得到的预测值记为:p_spec,两种方案的预测误差如下图:


图7:ARIMA预测误差


由上图可知,p_spec在春节影响月份有较好的预测效果,p_normal在其他月份有较好的预测效果,因此在应用时将以上两种模型的预测效果进行融合。


2)线性回归

以上模型应用的场景,需要基于历史月份的完整数据进行建模分析和预测,在数据没有变化的情况下,只需要在合适的时间节点执行一次即可。然而,随着时间的演进,当月的各项业务会逐步开展,数据开始慢慢积累,因此可以考虑不断加入当月的实际数据进行分析,实现预测结果的更新。


随着每日售电量的发行,已发行电量和月售电量之间存在关联性。以低压居民为例,某地区20128月份到20177月份期间,历月截止15日的累计发行电量与月售量入之间存在极强的线性关联,具体如下图所示:


图8:日累计发行电费与月售电收入分析


为进一步提升月售电收入的预测准确性,利用已发行电费进一步回归预测当月售电收入,构建逐日回归预测模型。

相关阅读