《電力大數(shù)據(jù)》引發(fā)技術(shù)變革的電力大數(shù)據(jù)
3 引發(fā)技術(shù)變革的電力大數(shù)據(jù)
3.1 數(shù)據(jù)規(guī)模大,數(shù)據(jù)處理時效性要求高——傳統(tǒng)技術(shù)手段不能經(jīng)濟(jì)地滿足業(yè)務(wù)性能需求
3.1.4實際案例:基于大數(shù)據(jù)的短期負(fù)荷預(yù)測
1、現(xiàn)狀和需求
電力系統(tǒng)短期負(fù)荷預(yù)測結(jié)果關(guān)系到電力系統(tǒng)調(diào)度運行和生產(chǎn)計劃的制定,準(zhǔn)確的短期負(fù)荷預(yù)測結(jié)果有助于提高系統(tǒng)的安全性和穩(wěn)定性,能夠減少發(fā)電成本。電網(wǎng)中短期負(fù)荷預(yù)測主要根據(jù)自然條件與人為影響等多個因素與負(fù)荷之間的非線性關(guān)系,在滿足一定準(zhǔn)確度要求的條件下,確定未來幾天的負(fù)荷數(shù)據(jù),其中負(fù)荷足指電力需求攝(功率)或用電量。負(fù)荷預(yù)測的建模與預(yù)測是根據(jù)歷史數(shù)據(jù)資料所包含的信息,建立理想的模型及處理隨機因素仍然是負(fù)荷預(yù)測的主要問題,影響負(fù)荷預(yù)測準(zhǔn)確度的原因是多方面的,典體可分為以下三個方面:
1)影響因素的不確定性導(dǎo)致負(fù)荷規(guī)律難以把握。影響負(fù)荷走勢的因素包括溫度、降水等天氣因素,也包含重大設(shè)備檢修、重大文體活動等人為因素。這些因素呈現(xiàn)顯著的隨機性和不確定性,因此負(fù)荷時間序列的變化呈現(xiàn)非平穩(wěn)的隨機過程:,
2)負(fù)荷預(yù)測模型的質(zhì)量直接關(guān)乎預(yù)測準(zhǔn)確度的高低,負(fù)荷預(yù)測模型的建模與預(yù)測是依據(jù)歷史數(shù)據(jù)資料所包含的信息,因此預(yù)測模型反映歷史數(shù)據(jù)所包含信息的有效性和程度決定了預(yù)測水平的高低;
3)信息不完整由于大量用戶的用電行為與影響因素(如氣象因素)之間的關(guān)系在歷史數(shù)據(jù)中是沒有記載的,信息的缺失和不完整是無法避免的,這些因素是負(fù)荷預(yù)測誤差進(jìn)一步減小的瓶頸。
2.應(yīng)用場景
目前,電網(wǎng)公司根據(jù)其業(yè)務(wù)要求大踏步推進(jìn)用電信息采集系統(tǒng)的建設(shè)。據(jù)國家電網(wǎng)公司相關(guān)報告指出,預(yù)計其用電信息采集系統(tǒng)智能電表數(shù)量到2015年將達(dá)到三億塊,用戶用電信息采集頻率更加頻繁:每15分鐘甚至每5分鐘就需要采集一次數(shù)據(jù),且數(shù)據(jù)是雙向互動流轉(zhuǎn),規(guī)模和頻率呈指數(shù)級增長。以河南省為例,河南全省實現(xiàn)全采集、全覆蓋后,用戶總量將達(dá)到4000萬,接入終端量接近300萬,采集數(shù)據(jù)總量接近60TB,年增量約為30TB。
實現(xiàn)對電網(wǎng)用戶的用電信息全采集,為準(zhǔn)確把握用戶級負(fù)荷變化規(guī)律提供了數(shù)據(jù)基礎(chǔ)。目前調(diào)度部門短期負(fù)荷預(yù)測的對象主要針對總量負(fù)荷,或者再深一層次變電站的母線負(fù)荷,通過母線負(fù)荷累加獲得總量負(fù)荷。而電網(wǎng)負(fù)荷是由眾多用戶負(fù)荷構(gòu)成,不同用戶的負(fù)荷受自身行業(yè)屬性和生產(chǎn)特點影響,負(fù)荷規(guī)律也是千差萬別,從電網(wǎng)負(fù)荷總量上分析負(fù)荷變化規(guī)律忽略了用戶的用電規(guī)律,因此分析結(jié)果必然存在一定的偏頗,更加無法精確定位負(fù)荷波動的源頭(即用戶)。而用電信息采集系統(tǒng)的海量用戶級負(fù)荷信息將使從用戶級負(fù)荷入手的短期負(fù)荷預(yù)測成為可能。
同時,隨著電網(wǎng)公司GIS數(shù)據(jù)平臺等業(yè)務(wù)輔助平臺的完善,以及多源數(shù)據(jù)平臺的融合,行業(yè)標(biāo)準(zhǔn)劃分?jǐn)?shù)據(jù)、季節(jié)天氣等與短期負(fù)荷密切耦合的相關(guān)因素數(shù)據(jù)也將會納入到短期負(fù)荷預(yù)測的基礎(chǔ)數(shù)據(jù)庫中。眾所周知,負(fù)荷的影響因素眾多、非線性極強。結(jié)合負(fù)荷數(shù)據(jù)與影響因素數(shù)據(jù),研究負(fù)荷隨多種因素的變化規(guī)律。進(jìn)而總結(jié)用戶的用電規(guī)律,將是提高短期負(fù)荷預(yù)測準(zhǔn)確度的一種有效手段。
3.大數(shù)據(jù)解決方案
電網(wǎng)公司現(xiàn)有數(shù)據(jù)源頭已經(jīng)可以定位至用戶級負(fù)荷層面,結(jié)合其完備的業(yè)務(wù)輔助平臺數(shù)據(jù)庫,在這里,我們提出一個基于大數(shù)據(jù)技術(shù)的短期負(fù)荷預(yù)測解決方案。
該方案的主體思路是采用對每個用戶的負(fù)荷進(jìn)行獨立預(yù)測,最后累加的方法。數(shù)據(jù)源為電網(wǎng)用電信息采集系統(tǒng)數(shù)據(jù)庫及相關(guān)影響因素數(shù)據(jù)庫,軟件采用大數(shù)據(jù)技術(shù)(如聚類分析、灰色關(guān)聯(lián)分析、決策樹等)對負(fù)荷數(shù)據(jù)進(jìn)行預(yù)處理,把握每個用戶負(fù)荷與天氣、日類型等影響因素的密切關(guān)系,并根據(jù)不同用戶特性構(gòu)建預(yù)測模型,最后累加所有用戶的預(yù)測結(jié)果得到系統(tǒng)預(yù)測負(fù)荷,原理框架如下圖所示。
下面,將詳細(xì)介紹組成該方案的五個步驟。
步驟1:負(fù)荷曲線聚類分析
甶于負(fù)荷曲線的走勢與日類型、天氣因素等密切相關(guān),對歷史負(fù)荷曲線的聚類分析是負(fù)荷預(yù)測的基礎(chǔ)步驟。針對海量的用戶負(fù)荷,若無針對性地研究每個用戶的用電規(guī)律將會造成巨大的資源浪費。因此,合理的數(shù)據(jù)挖掘技術(shù)(即聚類分析)能夠?qū)⒂秒娨?guī)律相近的負(fù)荷日期歸為一類。聚類分析技術(shù)通過計算各個向量之間的空間距離,將其由零散分布的獨立樣本逐漸歸為趨勢相近的若干類。
步驟2:確立關(guān)鍵影響因素
對影響負(fù)荷的因素進(jìn)行關(guān)聯(lián)度排序,剔除一些對負(fù)荷影響小的因素,從而達(dá)到約簡分類規(guī)則,簡化預(yù)測模型的目的。
在關(guān)聯(lián)分析方法中,灰色關(guān)聯(lián)分析法是一種應(yīng)用較多,效果得到普遍公認(rèn)的關(guān)聯(lián)度量化方法。采用該算法計算每個因素[如日最高氣溫,日平均氣溫、平均濕度、日類型(星期幾)等]與負(fù)荷曲線之間的灰色關(guān)聯(lián)度、將預(yù)測日前一年的歷史負(fù)荷數(shù)據(jù)、氣象數(shù)據(jù)以及日類型數(shù)據(jù)集作為分析樣本,設(shè)定母序列為負(fù)荷值,天氣因素、日類型為若干子序列。采用灰色關(guān)聯(lián)分析算法分析各個子序列與母序列的相關(guān)性,最后將一年每天的灰色關(guān)聯(lián)度求均值即可得到各個影響因素的灰色關(guān)聯(lián)度。對灰色關(guān)聯(lián)度進(jìn)行排序,選定值較大的前四個作為影響該用戶負(fù)荷的關(guān)鍵影響因素。
步驟3:建立分類規(guī)則
通過步驟1以及步驟2得到了待預(yù)測日過去一年的歷史負(fù)荷曲線的分類結(jié)果和影響負(fù)荷的關(guān)鍵因素。步驟3需要找到分類結(jié)果與關(guān)鍵影響因素間的耦合關(guān)系,即造成聚類結(jié)果的依據(jù),并以分類規(guī)則的形式表現(xiàn)出來。該步驟的作用是當(dāng)已知待預(yù)測日的關(guān)鍵影響因素值時,可以將預(yù)測口遵循分類規(guī)則分配到對應(yīng)的聚類中去.從而該類的結(jié)果就可以作為預(yù)測日的相似日數(shù)據(jù)集來訓(xùn)練模型。
CART決策樹算法是一種直觀的表征分類關(guān)系的規(guī)律表示方法,在每個節(jié)點(除葉節(jié)點外〉將選用Gini指數(shù)最小的關(guān)鍵影響因素.將當(dāng)前節(jié)點的歷史負(fù)荷數(shù)據(jù)集分割為兩個子集,直到最后的分類結(jié)果與步驟1中的聚類結(jié)果吻合。該過程完成了對歷史負(fù)荷及關(guān)鍵影響因素數(shù)據(jù)與聚類結(jié)果間耦合關(guān)系的學(xué)習(xí),能夠消楚完善地表征分類規(guī)則。
步驟4:將待測日分類
當(dāng)?shù)玫筋A(yù)測日的關(guān)鍵因素日特征向量(即關(guān)鍵因素值組成的向量)后,將其輸入步驟3建立的決策樹模型中,即可輸出相應(yīng)的分類結(jié)果。
步驟5:訓(xùn)練預(yù)測模型并預(yù)測
針對步驟1的分類結(jié)果,將每類的負(fù)荷數(shù)據(jù)及相應(yīng)的關(guān)鍵因素數(shù)據(jù)構(gòu)建訓(xùn)練樣本針對每類負(fù)荷數(shù)據(jù)的變化規(guī)律和特征,選取匹配的預(yù)測模型完成對該日負(fù)荷的預(yù)測。在這個過程中,我們選用支持向量機方法,該方法的核函數(shù)通常為RBF核函數(shù),因為此核函數(shù)下需要確定的支持向量機參數(shù)有核參數(shù),不敏感洗漱和懲罰參數(shù)。不同的參數(shù)組合,匹配不同類型的負(fù)荷,具有更強的建模針對性。根據(jù)步驟4中得出的待預(yù)測日的分類結(jié)果,選用對應(yīng)的支持向量機模型完成預(yù)測。
步驟6: 計算系統(tǒng)負(fù)荷
根據(jù)目標(biāo)預(yù)測系統(tǒng),針對系統(tǒng)中的每個用戶重復(fù)步驟1~5,該過程涉及的數(shù)據(jù)體量巨大,可以采用Hadoop大數(shù)據(jù)平臺進(jìn)行計算,最后累加所有用戶負(fù)荷,并考慮網(wǎng)損即可得出最終的系統(tǒng)負(fù)荷。Hadoop大數(shù)據(jù)平臺的使用主要包括涉及HDFS和HBase的數(shù)據(jù)存儲和管理系統(tǒng),下表為該預(yù)測方案針對該地區(qū)120萬負(fù)荷的預(yù)測在Hadoop大數(shù)據(jù)平臺上實現(xiàn)的效果,預(yù)測結(jié)果滿足短期負(fù)荷預(yù)測時間要求。
表3-1Hadoop大數(shù)據(jù)平臺的預(yù)測效果
書名:電力大數(shù)據(jù):能源互聯(lián)網(wǎng)時代的電力企業(yè)轉(zhuǎn)型與價值創(chuàng)造
ISBN:978-7-111-51693-4
作者:賴征田
出版日期:2016-01
出版社:機械工業(yè)出版社
責(zé)任編輯:繼電保護(hù)
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計落地:鼓勵“光儲充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計 -
中國自主研制的“人造太陽”重力支撐設(shè)備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng)
-
新基建助推 數(shù)據(jù)中心建設(shè)將迎爆發(fā)期
2020-06-16數(shù)據(jù)中心,能源互聯(lián)網(wǎng),電力新基建 -
泛在電力物聯(lián)網(wǎng)建設(shè)下看電網(wǎng)企業(yè)數(shù)據(jù)變現(xiàn)之路
2019-11-12泛在電力物聯(lián)網(wǎng) -
泛在電力物聯(lián)網(wǎng)建設(shè)典型實踐案例
2019-10-15泛在電力物聯(lián)網(wǎng)案例
-
新基建之充電樁“火”了 想進(jìn)這個行業(yè)要“心里有底”
2020-06-16充電樁,充電基礎(chǔ)設(shè)施,電力新基建 -
燃料電池汽車駛?cè)雽こ0傩占疫€要多久?
-
備戰(zhàn)全面電動化 多部委及央企“定調(diào)”充電樁配套節(jié)奏
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計落地:鼓勵“光儲充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計 -
中國自主研制的“人造太陽”重力支撐設(shè)備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業(yè)發(fā)展
-
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng) -
5G新基建助力智能電網(wǎng)發(fā)展
2020-06-125G,智能電網(wǎng),配電網(wǎng) -
從智能電網(wǎng)到智能城市