Back

中短期电价预测模型简介

从1981年的智利电力体制改革之后,英美等国先后进行了电力工业重组,这些努力导致了电力工业的市场化,促成了电力市场的形成,实现了资源的合理分配和社会效益的最大化。准确的电力价格对发电商、用户、监管者具有重要的意义。本文将常用的电价预测(EPF, Electricity Price Forecasting)模型进行了分类,并加以简介。

本文主要参考了’Rafał Weron, Electricity price forecasting: A review of the state-of-the-art with a look into the future, International Journal of Forecasting, Volume 30, Issue 4, 2014, Pages 1030-1081, ISSN 0169-2070‘ 写成博文以整理思路。

电力市场模式简介

首先简单介绍一下电力市场的运作模式。电力市场主要由三方构成:供应商、用户、管理者。供应商负责发电,用户买电用电,管理者维护市场秩序。由于电力是一种很特别的商品,它无法大规模储存,只能即发即用,很容易造成某一时刻的供给和需求不平衡,这种不平衡反应到价格上面,所以电价极不稳定。早期的电力市场是高度管制的,管理机构制定发电量、电价等等,十分稳定,但效率很差,浪费资源,也不利于电力市场的发展。市场化(自由化)后的电力市场引入竞争,很多供应商参与竞价,提高效率促进发展。目前市场化的电力市场基本分为两种模式,日前(Day-ahead)市场和日内(Intraday)市场。日前市场中供应商在前一天向清算机构报告自己的供应量和价格,在某一个时间点(比如18:00)清算机构整合所有供应商的信息,确定下一天的电价,一般是以小时为单位。日内市场与股票市场类似,通常是供应商提前一段时间竞价,比如12:00的时候竞价12:15-12:30的电价,一般以15分钟为单位。日内市场相较日前市场而言更加的不稳定。

电价预测的分类

可以分为长期、中期、短期预测。但它们之间尚没有明确的界限。长期一般研究几个月、一个季度到几年的范围,一般用于决定投资、长期协议和其他战略行动。中期一般研究几个星期到一个月的范围,主要用于资源分配、报表分析、风险管理、金融计算等。短期一般研究几分钟到几个星期的范围,用于降低生产成本、提高发电厂利润等。中短期预测使用的方法基本类似,与长期预测的不同。本文只介绍中短期的模型,长期预测日后再写。

中短期电价预测的六个类型

中短期电价预测模型众多,大体可以分为六个类型:Multi-agent, Fundamental, Reduced-form, Statistical, Computational intelligence 以及它们的组合。

  • Multi-agent模型运用经济学、博弈论等学科知识,模拟电力市场的各方行为,匹配供给和需求预测价格。
  • Fundamental模型通过模拟重要物理和经济因素对电价的影响来描述价格动态变化。
  • Reduced-form模型描述电价随时间推移的统计特性,最终目标是金融衍生工具的评估和风险管理。
  • Statistical模型直接运用统计学和计量经济学的方法根据前期数据进行预测。
  • Computational intelligence模型运用机器学习结合了学习、进化、模糊化的特性,可以灵活的适应复杂的动态模型。
  • 组合模型在上述模型中进行组合,目标是结合各模型的优势,弱化劣势,取长补短。

下面详细介绍前五类模型,包括该类型的优势劣势以及例子,重点是Computational intelligence模型。

Multi-agent模型

预测电价在过去是一项直接但困难的任务。它通常涉及中期和长期时间范围,并涉及将需求预测与供给相匹配,供给是通过依运营成本排列计划生产量得到的。这些基于成本的模型(Production-cost model,PCM)能够以一小时一小时的速度预测价格。然而,他们忽略了战略招标策略,包括市场的力量。它们适用于受监管的市场,价格不确定性很小、结构稳定、没有博弈的情况,但不适合竞争激烈的电力市场。均衡(Equilibrium)(博弈论)方法可被视为PCM的一般化方法,并结合战略投标策略进行修正。这些模型对于预测没有价格历史,但已知供应成本和市场集中度的市场的价格水平特别有用。另一方面,越来越流行的基于agent的仿真技术可以解决静态均衡模型忽略的电力市场特征。

Nash-Cournot framework,均衡方法的一种。在Nash-Cournot框架中,电力被视为同质商品,市场均衡通过供应商的容量设定来确定。但是这些模型预测的价格往往高于现实中的价格。

Supply function equilibrium,将价格建模为公司投标与供给(和需求)曲线的均衡。 计算供给函数均衡(SFE)需要求解一组微分方程,而不是Nash-Cournot框架中出现的典型代数方程组。 因此,这些模型在其数字易处理性方面具有相当大的限制。

Strategic production-cost models,是传统生产成本模型(PCM)的衍生。 战略PCM(SPCM)将代理商(agent)的出价策略也考虑在内。 每个agent都试图最大化自己的利润,同时考虑其成本结构和竞争对手的预期行为,通过战略参数建模,该参数代表每个供应商生产水平的剩余需求函数的斜率。与前两个模型相比,SPCM的计算效率很高,这让它可用于实时的价格分析。

Agent-based simulation models,是一类计算结构和规则,用于模拟自主代理(无论是个人还是集体实体,如组织或团体)的行为和交互,最终目标是评估它们对整个系统的影响。

这类模型极其灵活,但这种灵活要求模型使用者自己确定很多变量,比如参与者是谁,他们可能用的策略是什么,他们互相交互的方式等。另外,multi-agent模型更多地关注的是质量问题而不是定量结果,比如他们可以预测价格是否高于边际成本,以及这个是否会影响参与者的收益;但是如果要求得到更定量的结论,比如高精度的预测价格,这类模型会产生问题。

Fundamental模型

试图捕捉电力生产和交易中存在的基本物理量和经济指标的关系。 假设基本因素(负载,天气条件,系统参数等)之间的功能相互关联,并且通常通过Statistical,Reduced-form或Computational Intelligence独立地对基本输入进行建模和预测。 此外,文献中考虑的许多EPF方法是基于时间序列、回归和神经网络模型的混合解决方案,其使用一些Fundamental的因素 - 例如负载,燃料价格,风力或温度 - 作为输入变量。主要分为两个子类:parameter rich models 和 parsimonious structural models。

Parameter-rich fundamental models,通常被开发为专有的内部产品,因此,它们的细节不会公开披露。 公布的大部分结果都与水电主导电力市场有关。顾名思义,此类模型运用很多输入参数,Vahviläinen and Pyykkönen (2005) 提出了一个模型,使用了27个标量参数(13个气候参数、4个需求和10个供给参数),并使用了29个公式来描述参数之间的关系。

Parsimonious structural models是parameter-rich模型的简化,可以追溯到Barlow (2002)提出的由对市场供给和需求曲线的实证研究得出的现货价格过程,运用了Box–Cox transformation的逆。

这类模型面对的挑战主要有两点,第一是数据难以获得,根据市场的不同,关于工厂容量、成本、需求模式和运输能力等数据不一定可以供研究人员建模使用。第二是在建模的时候应用一些关于市场的假设,所以数据的随机性变化会对模型的可信度产生较大影响。另外由于这类模型使用的数据一般是在较长时间范围内获取的,所以更适合用于中期预测而不是短期价格预测。所以在应用这类模型的时候存在着很多风险。

Reduced-form模型

金融风格的Reduced-form(定量,随机)价格动态模型的一个共同特征是,它们的主要目的不是提供准确的每小时的价格预测,而是复制每日电价的主要特征,如未来时间点的边际分布、价格动态以及商品价格之间的相关性。这些模型是衍生品定价和风险管理系统的核心。如果选择的价格过程不适合描述电价的主要属性,则模型的结果可能不可靠。同时,如果模型过于复杂,计算负担将阻止其在交易部门中的使用(Weron,2006)。

Jump-diffusion models Markov regime-switching models

通常此类模型不会准确地预测每小时价格,但可以发现电力现货价格的主要特征,通常是在每日的时间尺度下。这些模型简化但合理地描述了价格动态,并且通常用于衍生品定价和风险分析(参见Benth et al.,2008; Eydeland&Wolyniec,2003)。 有趣的是,当涉及到波动性或价格飙升的预测时,简化模型的表现相当不错。

Statistical模型

统计模型运用数学方法组合过去的电价数据和/或外部数据,一般是生产数据、需求数据、天气数据。一般分为两类:加法模型和乘法模型。加法模型把各个参数加起来,乘法模型则是乘起来,这两种模型可以相互转换,比如对乘法模型求对数。统计模型最大的优势在于它很好解释变量的影响,方便理解模型内部的行为。然而统计模型也因为它不好支持非线性拟合而受到批评。

Similar-day使用和预测当天相似的那天的数据来预测,它可以使用比如需求量、天气等数据来判断两天的相似程度。 可以使用指数平滑(exponential smoothing methods)来提高精确度,但这种模型在与其他模型比较中精确度不是很理想。

回归模型是使用最广泛的一种,很好理解,这里不做过多描述。值得一提的是在建模的时候很多人使用小波变换(wavelet),可以提高精确度。

AR-MA类型的时间序列分析模型,基本的时间序列分析模型。这种模型对于平稳的时间序列数据的表现比较好,所以产生了差分ARMA(又称ARIMA,AutoRegressive Integrated Moving Average)模型,它将数据(n阶)差分化,即把\(X_t\)变化成\(X_t - X_{t-1}\)以获取平稳的时间序列(一阶差分)。另外的还可以做季节差分(SARIMA,seasonal ARIMA)等。

ARX类型的时间序列分析模型,X代表eXgenous,即输入外部数据的AR模型,因为电价也受很多外源因素的影响。由此衍生了ARX, ARMAX, ARIMAX, SARIMAX等模型。

Threshold autoregressive models (TAR), SETAR(Self Exciting TAR), STAR(Smooth Transition AR), LSTAR(Logistic STAR), TARX(TAR eXgenous)等等。

Heteroskedasticity and GARCH-type models,异方差性和GARCH类模型。包括AutoRegressive Conditional Heteroskedastic (ARCH), Generalized ARCH (GARCH), (S)AR(IMA)-GARCH等等。

统计型模型的精确度不仅取决于模型的选取、算法的使用,也取决于获取的数据的质量。对于处理价格激增,统计模型的效果不是很好,尤其是对于只是用价格作为数据的模型,对于价格spike的识别可以用以下方法:recursive filters (Cartea & Figueroa, 2005; Weron, 2008), variable price thresholds (Trück, Weron, & Wolff, 2007), fixed price change thresholds (Bierbrauer et al., 2004)(不推荐,因为忽视了长期和季节性变化), regime-switching classification (RSC;Janczura et al., 2013), and wavelet filtering (Stevenson, 2001;Weron, 2006)。

Computational intelligence models

CI(有的文献中也称AI)模型是受自然事物启发产生的计算方法,结合了学习、进化、模糊化的元素,可以灵活的适应复杂的动态模型,解决传统模型不能解决的问题。

CI模型的分类

每一个的CI模型都可以根据它的架构和学习算法分类,架构表示神经元的连接方式,学习算法表示模型怎样根据训练数据调整优化它的各项权重。在EPF的背景下,它也可以依据输出向量的维度分类,输出一维或多维。一维的一般用于预测下一小时电价 (e.g. Gonzalez, San Roque, & Garcia-Gonzalez, 2005; Mandal, Senjyu, & Funabashi, 2006),h小时后电价 (e.g. Amjady, 2006; Hu et al., 2008; Rodriguez & Anders, 2004)等等。多维的一般用于一次性预测接下来几个小时的电价,不如前者常见(e.g. Yamin, Shahidehpour, & Li, 2004)。根据神经元的拓扑结构可以分为两类,前馈网络(feed-forward networks)和递归网络(recurrent networks),前者不含循环而后者有。前馈网络更多的被用于预测价格而递归网络往往被用于分类(Jain, Mao, & Mohiuddin, 1996; Rutkowski, 2008)。

此外CI模型还可以被用于区间预测(interval forecasting,与置信区间confidence interval有区别),在这里不展开说了。

前馈神经网络

最简单的前馈神经网络只包含一个输入层,一个输出层,中间由一个感知神经元连接,它等价于一个线性回归的模型。通过增加中间神经元(隐藏层)的层数和个数,可以做到拟合非线性的关系(MLP, Multi Layer Perceptron)。每个神经元里都有一个激活函数,可以将输入进行一些处理,常用的有ReLU,tanh,softmax等等。在激活函数中可以使用径向基函数(Raidal Basis Function),构成一类特殊的模型。径向基通常使用高斯核函数(Gaussian Kernel)。

简单的MLP和RBF模型通常被当作测试对比模型,真正应用的模型大多是他们与其他模型的混合模型,比如Shafie-Khah et al. (2011) 提出了一个 wavelet-ARIMA-RBF模型,结合了小波变换、ARIMA和RBF的优缺点。研究指出,RBF更适合研究局部数据的特点,MLP适合描述整体的数据趋势。

递归神经网络

详见另一篇博文:递归神经网络

前馈神经网络存在一个问题,它不能描述相邻两个数据之间的关系,RRN则可以很好的解决这一点,前面cell的输出是后面cell的输入,或者有一个贯穿整个模型的状态记忆量。

模糊神经网络

模糊逻辑是通常的布尔逻辑的推广,因为它的输入值可以不止为0或1,还可以是某些定性范围。例如,温度可以是低,中或高。模糊逻辑允许从模糊或噪声的输入推导出输出,重要的是,不需要指定输入到输出的精确映射。模糊神经网络则是应用了模糊逻辑推广的神经网络,一般还要使用一个去模糊化函数以获取精确结果。

支持向量机

向量机的讲解推荐支持向量机通俗导论(理解SVM的三层境界)

与ANN不同,SVM通过把数据非线性投影到高维度,再对投影后的数据使用简单的线性函数以拟合数据的非线性关系,而ANN是通过复杂的函数来拟合非线性关系。SVM的一个优点是它得出的是全局的最值,而不是ANN给出的局部最值(因为一般使用梯度下降优化)。

优势和劣势

主要的优势是可以拟合复杂的、非线性的关系,因此它通常比纯统计学的模型效果要更好一些。但同时它不太灵活,这是它的主要缺陷。另外,CI模型种类繁多,存在很多变种,而且不同模型间难以比较(参数、输入数据等经常不同),参数、激活函数选择众多,所以很难选择一个最好的模型。

后记

电价预测是一个涉及广泛的研究领域,永远都无法找到一个最令人满意的预测方法,数据精度、模型调参、模型间的组合多种多样······不管是预测什么东西都是这样,也正是因为其中存在的不确定性和创造性,这个领域才如此的有吸引力。

Built with Hugo
Theme Stack designed by Jimmy