建設泛在電力物聯網,是國家電網有限公司推進“三型兩網”建設的重要內容和關鍵環節。而其中,如何構建一個強大的數據平臺,是加快推進泛在電力物聯網建設的前提和基礎。
泛在電力物聯網的數據量將大幅增加
電力行業歷來重視數據和信息技術,從上世紀80年代起,就采用實時數據庫處理發電以及電網采集的各種數據。但隨著電網規模的擴大,數據采集量的大幅增加,傳統的實時數據庫和IT架構已經無法滿足海量數據的處理需求。最近幾年,電力行業開始采用互聯網行業的大數據平臺技術,最典型的就是將Kafka、Hadoop、HBase、Spark、Redis等技術集成在一起處理海量數據。比如智能電表的用電信息采集系統、電費的計算等,都采用這類方案。
推進泛在電力物聯網建設,需要全方位對電網運行狀態、客戶用電等進行實時監測、預警、分析,數據采集點和采集頻次會大幅增加,數據量將在原來的基礎上增加上百倍。
以智能電表為例,現在客戶的智能電表是一天發送一條記錄。如果改為與商業智能電表一樣,15分鐘發送一條記錄到云端,數據量將至少增加96倍,數據插入請求數也相應增加96倍以上。以全網智能電表5億臺來統計,一天產生的數據條數多達480億條,現有的大數據解決方案和架構將面臨巨大的挑戰,即使通過水平擴展增加服務器數量來處理,其運營成本也將數量級地增加。
從配網的情況來看,即使采集點和采集頻率不顯著增加,但以D5000、CC2000為代表的主流產品,受限于歷史數據處理能力,依然只能圍繞實時采集數據、歷史斷面數據構建應用,拓撲分析技術無法在時間維度縱向擴展。
電網數據采集及監控系統(SCADA)作為物聯網的一部分,不但要看實時數據,還需要看歷史數據,不單需要實時監控,更需要故障預警、趨勢分析、運營指標分析、效率分析等。通過快速存取、分析高頻采集數據,將為電網的安全高效運行提供更精準的數據決策支撐。
另一方面,泛在電力物聯網與通用的物聯網一樣,不僅會存在云端的數據中心,也會存在邊緣節點。這些邊緣節點具備一定的計算和存儲能力,能進行數據的預處理和緩存,大幅緩解數據中心平臺的壓力,而且能更好地保證邊緣節點覆蓋的區域有更好的數據實時響應能力,更好地支撐本地業務實時智能化決策與執行。但是邊緣計算與云計算需要通過緊密協同才能更好地滿足各種需求場景的匹配,從而最大化邊緣計算和云計算的應用價值。
采集點的增加和采集頻次提高,能帶來什么樣的效益呢?以智能電表為例,如果將所有電表的數據采集頻次提高到1次/15分鐘,電網將實現對每個臺區線損的實時監測,而不是現在的T-1模式,從而對異常線損實時處理。同時,對輸電線路故障實時監測,再也無需客戶上報,大大提升運維效率和服務質量。
以Hadoop體系為代表的互聯網大數據解決方案,主要處理的是互聯網領域的非結構化數據,比如爬蟲數據、微博與微信數據等。但是,泛在電力物聯網的數據與互聯網數據有顯著不同的特點,表現在幾個方面:數據都是時序的,由傳感器和設備不斷產生,形成一個數據流;除視頻、圖像外,都是結構化的數據;數據是機器日志類型的,不會有刪除或更新的動作;數據是有保留時長的,到期刪除;數據流量是平穩可預測,知道測點數、采集頻率,能較為準確估算流量大小;數據需要進行實時計算、分析;數據的分析、計算一般都是基于某一個時間段和地域進行;數據量巨大,一天產生幾百億條記錄。
除數據特征不一樣之外,在數據處理上,泛在電力物聯網與典型的互聯網相比,還有不一樣的需求。比如插值計算、數學函數計算以及某個具體時間點的斷面數據等。而且這些數據的處理往往與采集設備的管理直接掛鉤,需要依據采集設備的歸屬、地域以及其他屬性進行各種分類統計。
構建相適應的大數據平臺
隨著泛在電力物聯網的加快建設,現有的互聯網大數據技術平臺將遇到巨大的挑戰,因為電力數據規模將增加幾個數量級,數據分析的量也更多,實時性要求也更高。因此,需要進一步加大信息技術的創新力度,構建和完善適應泛在電力物聯網建設需求的大數據平臺。
這個新一代的大數據平臺,要有以下幾個特點:充分利用泛在電力物聯網的數據特點,在技術上做各種優化,大幅度提高數據插入、查詢的性能,降低電網運營成本;必須能實時處理各種數據插入、查詢請求,提升電網運行效率;必須是水平擴展的,隨著數據量的增加,只需要增加服務器擴容即可;支持邊緣計算與云計算的邊緣協同;必須是易于維護的,降低對運維人員的要求;必須是開放的,有業界流行的標準SQL接口,便于各種應用集成;必須通過Python、R或其他接口來方便集成各種機器學習、人工智能算法。
當前,國內外諸多互聯網企業已經注意到物聯網興起后,傳統的大數據技術正面臨新的考驗和挑戰,并開始著手研發新一代大數據平臺。相信隨著泛在電力物聯網建設不斷加快,必將構建新一代的能源電力大數據平臺,從而進一步挖掘和利用好電網的數據資源,提升電網運營的效率和效益,保障電網安全穩定運行,為社會提供新的應用和服務。