本發明涉及線損監測領域,尤其涉及一種基于數據挖掘的線損分析方法。
背景技術:
1、隨著電網的規模擴大,輸電線路和配電線路的線損問題愈加明顯。線損是指電能在輸送過程中,由于電阻等原因造成的損耗。線損不僅會影響電能的利用效率,還會造成經濟損失,影響電力系統的穩定運行。特別是在高負荷和復雜拓撲結構下,如何有效地識別和處理線損異常,成為電網運行管理中的一個關鍵問題。
2、而電網的數字化、智能化管理成為未來發展的重要趨勢。通過現代信息技術、數據分析、機器學習等手段,可以實現對電網運行狀態的實時監測和智能分析。特別是基于三維電網模型的綜合應用,可以更加直觀地展示電網的結構和運行狀況,將實時監測數據、線損計算結果、設備運行狀態等信息直接映射到三維模型中,使得電網運行和維護更加高效和精確。
技術實現思路
1、為了解決上述問題,本發明的目的在于提供一種基于數據挖掘的線損分析方法,不僅能對電網中的線損進行異常檢測和分析,還通過三維可視化平臺提供直觀的展示和實時監控,提高了電網線損管理的智能化和精細化水平。
2、為實現上述目的,本發明采用以下技術方案:
3、一種基于數據挖掘的線損分析方法,包括以下步驟:
4、步驟s1:獲取電力系統的運行數據以及gis數據;
5、步驟s2:對收集到的數據進行清洗和預處理,包括去除缺失值和異常值,將不同量綱的數據進行歸一化處理;并從歸一化處理數據中提取電力運行狀態特征;
6、步驟s3:基于gis數據和電力系統的運行數據,構建電網的三維模型;
7、步驟s4:基于priori算法,用于發現電力運行狀態與線損之間的隱含關系,并將其作為隱含特征;
8、步驟s5:結合隱含特征和電力運行狀態特征,構建線損異常檢測模型;根據實時監測數據,基于線損異常檢測模型獲取線損異常點;
9、步驟s6:結合三維電網模型,基于線損異常檢測模型獲取的線損異常點,分析在空間上的分布;
10、步驟s7:構建三維電網線損的可視化分析平臺,展示線損數據和分析結果。
11、進一步的,運行數據包括變電站位置、輸電線路路徑、線路負荷、設備狀態;所述gis數據包括高程、地形、坐標系統、道路和建筑物;。
12、進一步的,步驟s3具體為:
13、將gis數據進行格式轉換,統一gis數據格式,并通過坐標轉換,將地理坐標轉換為適合三維渲染的投影坐標:
14、
15、z=h;
16、其中,λ和φ分別為經度和緯度,h為高度;(x,y,z)為轉換后的投影坐標;
17、基于電網的拓撲結構,生成三維模型,包括變電站、輸電線路和用戶分布;
18、將整個電網模型映射到實際的地理坐標系中,利用圖形渲染技術實現三維可視化:
19、創建三維場景,并將相機和光源初始化;
20、為每個節點創建三維幾何形狀,并將其位置設為計算出的三維坐標;
21、為每條邊創建線段幾何形狀,并將其起點和終點設置為節點的三維坐標。
22、進一步的,基于priori算法,用于發現電力運行狀態與線損之間的隱含關系,并將其作為隱含特征,具體如下:
23、給定一個包含歷史記錄的事務數據集d,其中每條記錄t∈d包含一個設備運行狀態集合t和對應的線損值l;
24、d={(t1,l1),(t2,l2),…,(ts,ls),…,(tn,ln)};
25、其中,ts為第s個設備運行狀態的項集,li為對應的線損值;
26、項集i在事務集d中的支持度support(i)定義為該項集在d中出現的次數除以總事務數:
27、
28、其中,t.t表示事務t的設備狀態項集;
29、設定一個最低支持度閾值σ,只有支持度support(i)≥σ的項i才被認為是頻繁項集;
30、使用逐層迭代的方法,從單項頻繁項集開始,逐步生成更大項集;
31、設lk表示所有大小為k的頻繁項集:
32、lk={i∈ik|support(i)≥σ};
33、關聯規則的置信度定義為在包含a的事務中也包含b的概率。
34、進一步的,線損異常檢測模型構建,具體如下:
35、獲取設備運行狀態特和環境特征,并結合基于步驟s5獲取隱含特征,使用主成分分析進行降維,得到訓練數據集;
36、構建線性回歸、隨機森林和xgboost模型,并基于訓練數據集訓練;
37、訓練過程中,采用交叉驗證評估模型性能:
38、
39、其中,mi′為i′模型,k為折數,msek(mi′)為模型mi′第k折的均方誤差;
40、使用網格搜索與貝葉斯優化方法調參,得到最優超參數;
41、
42、其中,θ為超參數空間;mi′(θ)為具有特定超參數θ的i′模型;為i′模型的最優超參數;
43、使用加權平均構建綜合預測模型,評估綜合模型性能并應用于異常檢測
44、
45、其中,w1,w2,w3為權重參數,和分別為線性回歸、隨機森林和xgboost模型的預測值,并計算預測值和正常值的誤差,為綜合預測值;
46、利用高斯混合模型對誤差進行建模,并計算誤差的自適應閾值,用于識別異常數據點。
47、進一步的,獲取設備運行狀態特和環境特征,并結合基于步驟s5獲取隱含特征,使用主成分分析進行降維,具體如下:
48、獲取的獲取設備運行狀態特和環境特征,并結合基于步驟s5獲取隱含特征,得到特征矩陣x={x1,x2,...xi,...,xn}t:
49、xi={xi1,xi2,...,xim,fi1,fi2,...,fik,hi1,hi2,...,hip};
50、其中,xi表第i個樣本,xim表示第i個樣本的第m個運行狀態特征,fik表示第i個樣本的第k個隱含特征,hip表示第i個樣本的第p個環境特征,n為樣本數量;t為轉置;
51、標準化輸入特征矩陣:
52、
53、其中,μ和σ分別是特征的均值和標準差,z是標準化后的特征矩陣;
54、計算協方差矩陣c:
55、
56、計算協方差矩陣的特征值和特征向量:
57、cvi″=λi″vi″;
58、其中,vi″為協方差矩陣c的第i個特征向量,λi″為對應的特征值;
59、選擇前k′個最大特征值對應的特征向量作為主成分,得到降維后的數據:
60、xcpa=zvk′;
61、其中,vk′包括是包含前k′個特征向量的矩陣。
62、進一步的,利用高斯混合模型對誤差進行建模,并計算誤差的自適應閾值,用于識別異常數據點,具體如下:
63、首先,計算模型預測值與正常值之間的誤差:
64、
65、其中,l為正常值;
66、使用高斯混合模型對預測誤差進行建模:
67、
68、其中,j為高斯分布的數量;πj′為第j′個高斯分布的混合系數;是均值為uj′、方差為的高斯分布;
69、使用期望最大化算法對誤差數據進行擬合,得到參數
70、根據擬合好的gmm模型,計算每個誤差值的概率密度:
71、最后,使用分位數法,根據誤差的累積分布函數確認閾值:
72、對于給定的誤差分布p(e),其cdf為:
73、
74、選定一個置信水平α,相應的分位數q1-α,表示為:
75、f(q1-α)=1-α
76、即,找到使得cdf等于1-α的誤差值,這個值q1-α就是振蕩的閾值。
77、進一步的,使用期望最大化算法對誤差數據進行擬合,具體如下:
78、隨機初始化參數
79、計算責任度γ(zij′),即在給定當前參數下,第j′個成分對數據點ei的后驗概率:
80、
81、更新參數:
82、
83、
84、其中,ei是第i個樣本的誤差;
85、迭代上述步驟,直到收斂條件滿足。
86、進一步的,結合三維電網模型,基于線損異常檢測模型獲取的線損異常點,分析在空間上的分布,具體如下:
87、將實時監測數據和線損計算結果映射到三維模型中;
88、使用optics空間聚類算法,找到異常點的聚集區域:
89、①對于每個點,找到其鄰域內的所有點;
90、②定義一個點的核心距離為其鄰域內存在至少minpts個點的最小距離;
91、③定義可達距離為從核心點到目標點的最大距離;
92、④對所有點按照核心距離進行排序,生成順序圖;
93、⑤將聚類結果映射回三維模型中,不同顏色或標記顯示不同的聚類結果;
94、并分析造成局部區域線損異常的原因。
95、進一步的,可視化分析平臺的可視化內容包括:三維電網拓撲,展示電網的三維結構和設備位置;線損分布熱圖,在三維模型中疊加熱地圖層,直觀展示不同區域的線損分布;動態監控,實時展示電網運行狀態和線損變化情況。
96、本發明具有如下有益效果:
97、1、本發明不僅能對電網中的線損進行異常檢測和分析,還通過三維可視化平臺提供直觀的展示和實時監控,提高了電網線損管理的智能化和精細化水平;
98、2、本發明結合apriori算法,挖掘電力運行狀態與線損的隱含關系,提高特征的全面性和準確性,增強異常檢測模型的預測能力,并構建基于綜合特征的線損異常檢測模型,通過實時監測數據及時發現和預警線損異常,提高電網運行的穩定性和安全性;
99、3、本發明結合三維電網模型和基于線損異常檢測模型,可以在空間上準確定位和分析線損異常點,進而找到異常發生的具體原因,不僅有助于及時發現和處理電網中的故障,還能為電網的優化和管理提供科學依據,最終提升供電的可靠性和效率。