時間:2022年03月05日 分類:電子論文 次數:
摘要:智能變電站作為智能電網戰略的重要支點,隨著智能變電站一次設備的不斷增多,設備信息數據量呈指數級增長,傳統的數據檢索方法已經無法適應海量數據的處理要求,如何準確高效的檢索變電站設備信息成為研究的焦點問題。因此提出了一種基于知識圖譜的智能變電站設備一次信息檢索方法,首先對智能變電站的一次設備信息進行分類,獲取相關設備信息語料。然后,定義非結構化設備信息抽取框架,實現設備信息語料的高效抽取。再利用隱馬爾科夫模型對設備信息進行分詞,構建變電站一次設備信息知識圖譜,實現設備信息的可視化展示,突破二維語義表格的局限。最后,結合知識圖譜技術設計了智能變電站一次設備信息管理系統。實驗表明基于知識圖譜的智能變電站一次設備信息記錄檢索系統能提供準確的設備信息,實現智能變電站設備信息的高效檢索。
關鍵詞:智能變電站;知識圖譜;隱馬爾科夫模型;一次設備
智能變電站的日常建設和運行中,積累了大量的設備參數和運行數據等信息,但相應的信息往往閑置于系統中,影響了智能變電站的數據價值發現。隨著設備信息的不斷增加,如何高效地檢索設備信息對于變電站工作人員有著重要意義。然而,變電站設備的復雜性使得設備信息難以準確檢索[1]。變電站一次設備信息管理存在以下問題:1)變電站一次設備信息是以自然語言的形式進行描述,且格式迥異,增加了計算機對設備信息的理解難度,且設備信息的復雜性給信息的準確檢索造成了很大困難;2)一次設備信息管理的智能化程度不夠,無法從大量的監測數據和歷史數據篩選有效的數據進行利用。
隨著人工智能技術、物聯網等技術的不斷發展,為變電站設備信息的智能化管理提供了新的方向[2]。對于變電站設備信息語料,文獻[3-4]通過確立語義框架對文本進行表示,但語義框架難以適應復雜的電力設備信息情況[5],且框架依賴于專家經驗定義,難以全面考慮變電站設備復雜化的表達方式。
文獻[6-7]利用機器學習算法挖掘語料中的規律對語料特征進行表示。然而,機器學習方法所選取的特征基本上局限于關鍵詞的出現與否[8],或者詞的出現頻率[9],這些統計特征雖有一定的規律性,但對句中關鍵詞的內在邏輯缺乏充分考慮,可解釋性不足,容易局限于缺陷記錄的字面特征。隨著智能變電站戰略的不斷推進,變電站設備信息呈倍數增長,對信息儲存和檢索的要求也越來越高。知識圖譜作為一種高效的數據庫,可以對變電站設備信息進行有效的管理。因此,文中嘗試將知識圖譜方法應用在智能變電站的一次設備信息管理中。
首先,將智能變電站信息采集平臺收集的數據進行分類;然后,考慮非結構化的數據計算機難以準確識別,定義非結構化的數據提取框架,利用隱馬爾科夫模型對收集的數據進行分詞和標注,為智能變電站一次設備信息知識圖譜構建提供數據支撐;最后結合知識圖譜技術設計了智能變電站一次設備信息檢索系統。該系統能有效地提高變電站設備信息的檢索效率、提高變電站的智能化水平。
1智能變電站一次設備信息采集
隨著智能電網的更新建設,變電站也在完善它智能化的飛躍。作為電力產業的一個重要的組成部分,智能變電站中聚集的數據量不斷加速增長,加之諸多新能源數據的引入,使得如何利用現有理論知識和工具來處理變電站中的數據、為智能電網提供數據支持,成為一個亟待解決的問題。
1.1智能變電站數據來源
智能變電站的數據來源主要有原始數據、變電站中各個自動化系統的內部數據、故障錯誤記錄信息以及對周圍環境進行監測得到數據等[10]。變電站的一次設備直接連接于電力系統的高壓電網中,參與電力能源的變換、輸送、分配。變電站的一次設備種類繁多,主要包括變壓器、斷路器、隔離開關等相關設備。變壓器是電力系統交流電力能源實現轉換的主要設備,可以實現不同電壓等級的電力能源間相互轉換,以便于電力系統的連接,優化電力能源的傳輸。
變壓器數據不但包括電壓、電流、有功、無功、相位等數據,還包括變壓器的在線監測數據,主要指變壓器狀態評估、故障診斷、故障預測常使用的油溫和油色譜數據信息,還包括電力變壓器絕緣油中溶解氣體占相關氣體的比重和產生這些氣體的速率[11]數據信息。這幾種數據參量構成了電力變壓器數據的主要組成部分。斷路器是接通或斷開電力系統各設備連接的重要設備,它配有相對完善的滅弧裝置,具有斷開電力系統電流的能力。斷路器在系統正常運行時可根據需求改變電力系統的連接關系,調節潮流;在系統故障時,斷路器可以斷開故障電流,切斷故障設備和系統的電氣連接。
斷路器的動作信息是變電站日常運行、管理的重要參考數據。智能變電站中的開關設備有密閉性高、靈敏性好等特點,其中氣體絕緣組合電器設備(gasin⁃sulatedswitchgea,GIS)微水和觸頭溫度等多種參數都是需要在線監測的重要參數。對于GIS,在線監測系統主要監測兩類數據,一類是六氟化硫(sulfurhexafluoride,SF6)氣體的密度,另一類是當有少量的水隨SF6進入到監測系統時,所產生的水的含量。
GIS在線監測系統的局部放電監測系統可以監測設備制造、安裝以及維修時帶入的導電微小顆粒和一些異類物質、導通電流、內部氣隙、接地受阻等缺陷。GIS實時系統可以通過采集不同位置信息來確定隱患的方位。通過采用感應器對設備內部的溫度信息的采集,GIS的高速光導纖維溫度測量儀可以快速、準確地獲得設備內部的溫度信息。隔離開關、接地開關、電容器、電抗器以及互感器等常見的變電站一次設備所產生的數據在變電站維護、故障診斷中都發揮了重要的作用。環境監測數據對智能變電站數據來說也有相當重大的意義。智能變電站的微氣象監測系統能夠定時收集智能變電站周圍的環境數據,包括空氣濕度、霧霾信息等數據。
1.2智能變電站數據分類
為了便于數據采集、加工等工作的運作,把智能變電站的數據作分類處理。其中,一次設備的數據體量龐大、種類繁多,相關相似數據進行聚類分析,大致可分為五種,分別為基本數據、在線監測數據、運行數據、試驗數據以及事故數據。
1)基本數據。基本數據是指一次設備的臺賬、設計參數等,數據通常較為完整準確。包括電力設備的基本參數等信息,如額定值、功率、尺寸大小、出產廠家、出產日期等。這些數據是永久存儲在電力設備數據庫中的數據,其他的數據是設備的流數據。
2)在線監測數據。在線監測數據是對變電站設備狀況進行連續或周期性的自動監視檢測,具有監測頻率高、數據體量大的特點,能夠反映相關設備的電氣、機械以及化學特性,例如變壓器的絕緣油色譜分析、電容套管的介損等。3)運行數據。運行數據是指在一次設備運行期間,按規定的檢查內容和周期對各類一次設備進行巡檢后獲得的書面或電子文檔記錄。運行數據是反映電氣設備具體運行情況的數據,如電流、電壓、有功、無功、斷路器動作次數等。
4)試驗數據。試驗數據能夠反映設備電氣、機械、化學等性質的數據,其具體值通過利用專業儀器試驗得到。
通常所說的設備試驗數據都是在設備停電之后進行試驗而得到的數據,如直流電阻、絕緣電阻,還包括在設備不停電情況下,遠離設備本體進行的數據試驗,如油的耐壓值等。5)事故數據。在發生故障時,在智能變電站中,事故數據主要指發生短路事故時相關設備的數據,如短路電流的有效值和峰值,短路電流的波形等。
1.3智能變電站數據的特點
設備信息數據一般以一定的形式和結構存儲于智能變電站數據庫中,歷史數據是對變電站既往運行管理狀態的忠實記錄,使變電站未來的管控更加有章可循、有理可依。歷史數據特點如下:1)存儲格式迥異。由于電力系統中目前對數據的存儲格式并沒有統一的標準,導致數據通常以最原始的形式存放。2)數據類型復雜。智能變電站中的數據有整型、實型、布爾型等,此外還包含大量的文檔、視頻等非結構化數據。
3)重復性。關于某種電力設備的狀態數據很有可能在相當長的一段時間內處于穩定的狀態,甚至無論在內容、格式或者具體的值域方面都完全相同,但卻在數據庫中被重復存儲。歷史數據的這種重復性存儲模式不但浪費了寶貴的存儲資源,而且在數據的搜索和提取時也將對系統的效率造成影響。
2智能變電站一次設備知識圖譜構建
2.1智能變電站一次設備信息抽取
由于變電站一次設備信息復雜多樣,收集到的設備信息雖然有相關規范進行規定,計算機仍難以準確識別和處理。且變電站設備信息大多是非結構化的表格文檔,具有半結構化文檔的特點。以變壓器參數表格為例,數據可分為標題和數據兩部分,標題表示變壓器數據的性質和類別,數據表示變壓器實際參數,如“變壓器設備參數”為標題,“220kV”為參數數據.數據抽取的任務是提取表格中的所有設備參數信息,識別兩者的語義關系。
一般地,變電站設備信息表格的各標題大多存在的內容關聯,如設備參數中包括額定電壓、額定電流和額定輸出功率等,試驗數據中包括直流電阻、絕緣電阻和動作次數等,需要根據表格特點建立統一的抽取框架:定義1:表格邏輯結構可以表示為T=集合。其中,id表示設備信息的標識;title表示標題;type={single,multiple},表示標題的類型,single表示“單一區”,multiple表示“多值區”。通過數據匹配抽取表格中的數據。部分變電站一次設備參數如下所示:變壓器型號DC9-300/27/∛/1.1,冷卻方式AN/AF,額定電流212/5196A,空載損耗25.2kW,電壓等級10kV,制造廠商沈陽特變電工。
2.2隱馬爾科夫文本分詞模型
變電站設備信息中含有大量構詞規律復雜的專業術語,因此本文使用隱馬爾科夫分詞模型(hiddenmarkovmodel,HMM)進行設備信息的處理。設備信息中每個漢字都有屬于自己的構詞詞位。構詞詞位可用四種標簽表示,B代表詞首位、M代表詞中位、E代表詞尾位,S代表獨立字。設備信息語料中的每條信息構成觀測序列,每個字的構詞詞位標注構成狀態序列。設備信息分詞就轉換為構詞詞位標注問題,基于已加工好的語料庫,得到HMM的參數信息,再通過維特比算法得到待分詞文本的構詞詞位標注序列。
2.3智能變電站一次設備信息知識圖譜自動構建
知識圖譜構建的一般過程主要分為3步,即知識抽取、知識表示、知識加工。1)知識表示。用h表示實體,t表示實體的屬性,h和t之間的關系用r表示,那么三元組(h,r,t)表示為實體h的t屬性描述。2)知識抽取。主要是抽取出非(半)結構化數據包含的實體、屬性和關系,作為構成知識圖譜的基本元素。并對實體、屬性和關系進行整合并加入現有結構化數據,初步形成知識圖譜。3)知識加工。在知識圖譜不斷應用的過程中,評估其數據質量和應用效果,并結合知識的發展與豐富,對知識圖譜進行更新與修正。變電站一次設備信息一般都以自然語言記錄隱患的設備部件、參數等內容。智能變電站一次設備信息知識圖譜的構建過程和傳統的知識圖譜構建過程進行了以下修改:
1)變電站一次設備信息除抽取實體間及實體與屬性的關系外,還要抽取屬性間關系。
2智能變電站一次設備信息知識圖譜屬于專業領域知識圖譜,實體詞義僅限于電力領域,且電力行業有明確的術語規范,實體歧義問題基本不存在,省去實體消歧步驟。3)關系抽取完成后,需要對關系進行篩選處理,避免關系出現冗余,影響知識圖譜的后續應用。
4)數據整合步驟將實體、屬性及關系形成的三元組,形成圖結構的變電站一次設備知識圖譜。Neo4j圖數據庫由于其圖形化的實體-關系屬性三元組與知識圖譜形成很好的映射。
因此,本文利用Neo4j圖數據庫的可視化功能使變電站一次設備信息具有更強的可讀性,方便使用者快速獲取及理解變電站設備相關參數和運行數據,實現了設備信息的分析和儲存,并且建立了設備信息之間的相互關聯。變電站一次設備知識圖譜中的實體及關系數量眾多,隨著設備的不斷更新換代,知識圖譜也應進行補全以保證設備信息檢索的準確性和實效性。Neo4j圖數據庫支持大數據集合并且可以不斷擴展其容量,可以滿足知識圖譜的需求。
3智能變電站設備一次信息檢索系統
本文基于Centos系統使用Docker部署Djan⁃go后臺、ElasticSearch及Vue前端等請求并配置相關參數,聯調使用。采用編程設計智能變電站設備信息檢索模塊,界面簡潔易操作,對于變電站工作人員來說,不需要過多的學習時間。變電站工作人員可以通過輸入查詢內容,經過語義理解和問題模板匹配轉換為計算機可識別的Cypher語言進行知識查詢,利用Cypher對知識庫的實體關系直接進行檢索,并通過數據可視化庫(data-drivendocument,D3.js)技術以實體關系-屬性三元組的形式展示。基于知識圖譜的智能變電站一次設備信息檢索系統不僅可以為工作人員提供檢索服務,還可以利用知識圖譜的圖結構關聯分析特點,設計引導式的圖譜檢索對結果進行可視化的展示。
4實驗分析
智能變電站一次設備信息檢索以儲存的一次設備為基礎,當工作人員進行一次設備查詢檢索時,工作人員輸入的自然語言查詢語句經過語義分析處理后輸入檢索系統中,然后與知識圖譜中的設備信息進行匹配,并將整合后的查詢結果以可視化三元組的形式展現,而傳統的關鍵詞搜索方法則使用SQL語句進行查詢。本系統選取500kV變電站作為測試試點,實驗數據共96.2MB。其中包含一次設備信息6萬余條,天氣數據20MB。
通過準確率(Precision)和召回率(Recall)證明變電站設備信息知識圖譜的檢索效果優于傳統關鍵詞搜索方法,其中Re⁃call是指正確結果與實際存在的正確結果的比例,性能越好Recall值越大。基于知識圖譜的一次設備信息檢索方法在Precision和Recall兩個指標上整體高于傳統的關鍵詞檢索方法,知識圖譜在語義級檢索上的表現優于傳統方法。在信息檢索條件3時,指標相差最大,主要原因是“雷擊”和“故障”在數據庫中沒有關系,而變電站一次設備知識圖譜中存有它們的三元組關系。基于知識圖譜的變電站一次設備信息檢索系統能夠滿足日常檢索需求,它可以快速有效的檢索設備信息,能減少錯誤操作,提高智能變電站的安全性。
5結論
文中提出了基于知識圖譜技術的智能變電站一次設備信息檢索方法,并通過實驗進行分析驗證。通過深入分析智能變電站設備信息利用率不高、檢索效率低的問題,提出利用知識圖譜技術對一次設備信息進行管理。知識圖譜技術有效實現了設備信息的高效檢索和可視化展示。
采用編程技術調用知識圖譜中的設備信息。基于知識圖譜技術的智能變電站一次設備信息檢索系統可以提高設備信息的檢索效率及準確性,對智能變電站的穩定運行提供數據支撐。該系統在一定程度上提高了變電站一次設備信息的檢索效率,同時也提高了變電站的智能化水平。在后續研究中,將在關系抽取步驟中提取更多語料特征,提高知識圖譜構建的精確性,從而提升設備信息的檢索效果,這也是后續研究的重要方向。
參考文獻
[1]劉梓權,王慧芳.基于知識圖譜技術的電力設備缺陷記錄檢索方法[J].電力系統自動化,2018,42(14):158-164.LiuZiquan,WangHuifang.Amethodofpowerequipmentde⁃fectrecordretrievalbasedonknowledgemappingtechnology[J].PowerSystemAutomation,2018,42(14):158-164.
[2]曹靖,陳陸燊,邱劍,等.基于語義框架的電網缺陷文本挖掘技術及其應用[J].電網技術,2017,41(2):637-643.CaoJing,ChenLushen,QiuJian,etal.Semanticframeworkbaseddefecttextminingtechniqueandapplicationinpowergrid[J].PowerSystemTechnology,2017,41(2):637-643.
[3]趙振兵,段記坤,孔英會,等.基于門控圖神經網絡的栓母對知識圖譜構建與應用[J].電網技術,2021,45(1):98-106.ZhaoZhenbing,DuanJikun,KongYinghui,etal.Construc⁃tionandapplicationofboltandnutpairknowledgegraghbasedonGGNN[J].GridTechnology,2021,45(1):98-106
[4]HuangY,ZhouX.Knowledgemodelforelecticpowerbigdatabasedonontologyandsemanticweb[J].CSEEJournalofPowerandEnergySystems,2015,1(1):19-27.
[5]RudinC,WaltzD,AndersonRN,etal.MachinelearningfortheNewYorkcitypowergird[J].IEEETransactiononPatternAnalysisandMachineIntelligence,2012,34(2):328-345.
作者:張子建,劉俊宇,梁煜,黃曉歐