本發明涉及輸變電設備檢測領域,具體涉及一種多維度實時變電設備數據的閾值自適應設置異常檢測方法。
背景技術:
眾所周知,設備的運行狀態對于電廠生產影響巨大,設備在正常工況運行過程中體現出來的功能特征、表象特征以及電氣特征與異常狀態下的特征是有差異的。根據設備狀態預警,做出檢修計劃,將節省電廠巨大的人力、物力、財力,具有非常大的經濟潛力。
目前,在設備狀態預警方面,設備生產廠商根據制造工藝設定各個部件不同預警級別的閾值方法,現有設備異常檢測方法采用靜態閾值設置的方法,即以現有數據平均值為基準,上下分別以均值的固定百分比(例如150%、300%)作為上下閾值,進行數據異常檢測。
上下閾值之間的區域為“正常”區域,上下閾值之外的區域為“異常”區域。靜態閾值設置無法反映數據的動態實時特點。閾值上下界設置采用業務專家的主觀經驗,無法反映數據客觀規律。閾值的確定直接影響了對于變電設備的檢測精度以及數據處理的效率,然而目前靜態閾值的方式已經無法滿足日趨復雜的變電設備檢測。
技術實現要素:
本發明的目的在于克服現有技術的不足,提供一種多維度實時變電設備數據的閾值自適應設置異常檢測方法,解決變電設備狀態參數異常檢測閾值區間較多依賴變電設備專家離線計算及主觀經驗,而無法根據設備運行實時狀態自適應方式變化的問題,采用了多種歸一化方式進行數據處理,并且對采集的實時測點數據首先進行多重的去野值判斷,提高了數據的有效性和處理效率。
本發明提供了一種多維度實時變電設備數據的閾值自適應設置異常檢測方法,依次包括如下步驟:
步驟1:在變電系統數據庫里,找到變電設備的所有歷史指標信息,選取一段時間內變電設備在正常運行狀態下和非正常運行狀態下的歷史數據;
步驟2:
A.對選取的變電設備的正常運行狀態下的歷史數據按照如下公式進行歸一化處理:
其中,hn1為h1歸一化后的值,hmax1和hmin1分別為變電設備正常運行狀態下的歷史數據的最大值和最小值,h1為變電設備正常運行狀態下的歷史數據;
B.對選取的變電設備的非正常運行狀態下的歷史數據按照如下公式進行歸一化處理:
其中,hn2為h2歸一化后的值,hmax2和hmin2分別為變電設備非正常運行狀態下的歷史數據的最大值和最小值,h2為變電設備非正常運行狀態下的歷史數據;
步驟3:
A:將歸一化后的hn1做平均值計算,得到平均值H1,并且設置閾值補償參數L1,設置正常狀態下初始野值濾除閾值的下限值為H1-L1,上限值為H1+L1,;
B:將歸一化后的hn2做平均值計算,得到平均值H2,計算ΔH=|H1-H2|,并且設置誤差閾值補償參數L2,設置非正常狀態下初始野值濾除誤差閾值的下限值為ΔH-L2,上限值為ΔH+L2;
步驟4:
A.將正常狀態下初始野值濾除閾值的下限值為H-L,上限值為H+L分別利用如下公式進行還原,得到還原后的初始野值濾除閾值的上、下限值:
B.將非正常狀態下初始野值濾除誤差閾值的下限值為ΔH-L2,上限值為ΔH+L2分別利用如下公式進行還原,得到還原后的初始野值濾除誤差閾值的上、下限值:
步驟5:實時獲取變電設備運行狀態多維度實時測點數據,判斷:
A:比較實時測點數據和初始野值濾除閾值的上、下限值的差值,如果差值沒有落入初始野值濾除閾值的上、下限值構成的閾值范圍,則剔除此實時測點數據,如果都落入則進入下一步驟;
B:判斷實時測點數據是否落入初始野值濾除閾值的上、下限值構成的閾值范圍,如果未落入則剔除此實時測點數據,如果落入則進行歸一化處理,獲得變電設備運行狀態的實時多維度歸一化數據序列;
步驟6:通過對變電設備運行狀態的實時多維度歸一化數據序列應用降維操作,產生變電設備運行狀態的實時降維數據序列;
步驟7:應用可配置的預測器,對變電設備運行狀態的實時降維數據序列進行預測計算,產生變電設備運行狀態的預測數據序列;
步驟8:應用變電設備運行狀態的實時數據及預測數據進行分值計算,得到變電設備運行狀態分值;
步驟9:確定變電設備運行狀態閾值區間,包括上閾值界、下閾值界;
步驟10:應用變電設備運行狀態閾值區間,判斷當前時刻分值是否在閾值區間范圍,判斷變電設備的狀態異常。
其中,步驟5中進行歸一化處理,獲得變電設備運行狀態的實時多維度歸一化數據序列具體為:
多維度實時變電設備參數xt定義為t時刻變電設備數據集合,x(i)定義為多維度變電設備數據的第i維,i=1,2,…,n,表示為:
xt=(x(1),x(2),…,x(i),…,x(n))
對多維度實時變電設備參數xt進行正規化,實現歸一化運算,
得到t時刻變電設備運行狀態的實時多維度歸一化數據序列到nt,其中NOR(xt)是正規化運算,||xt||,是xt的模。
其中,步驟6具體為對變電設備運行狀態的實時多維度歸一化數據序列nt進行降維運算:
yt=PCA(nt)
得到t時刻變電設備運行狀態的實時降維數據序列yt,其中PCA(xt)是降維運算,通過對變電設備運行狀態的實時多維度歸一化數據序列應用降維操作,產生變電設備運行狀態的實時降維數據序列。
其中,步驟7具體為:應用變電設備運行狀態的實時降維數據序列yt和變電設備運行狀態的實時數據及預測數據進行分值計算,
得到變電設備運行狀態分值到zt。
其中,步驟9具體為:
[Q1-1.5IQR,Q3+1.5IQR]
其中,Q1-1.5IQR為上閾值;Q3+1.5IQR為下閾值;四分位數間距IQR=Q3-Q1。
其中,步驟10具體為:使用變電設備運行狀態分值到zt與變電設備運行狀態閾值區間[Q1-1.5IQR,Q3+1.5IQR]進行比較,如果zt在該區間范圍,則變電設備狀態正常;否則,變電設備狀態異常。
本發明的多維度實時變電設備數據的閾值自適應設置異常檢測方法,可以實現:
解決變電設備狀態參數異常檢測閾值區間較多依賴變電設備專家離線計算及主觀經驗,而無法根據設備運行實時狀態自適應方式變化的問題,利用特定順序和特殊的處理方式,并且采用了多種歸一化方式進行數據處理,并且對采集的實時測點數據首先進行多重的去野值判斷,提高了數據的有效性和處理效率,提高了運算效率,并且能夠實時快速、自動化的檢測設備異常情況。
附圖說明
圖1為野值濾除閾值處理流程圖
圖2為變電設備參數異常檢測方法流程圖
具體實施方式
下面詳細說明本發明的具體實施,有必要在此指出的是,以下實施只是用于本發明的進一步說明,不能理解為對本發明保護范圍的限制,該領域技術熟練人員根據上述本發明內容對本發明做出的一些非本質的改進和調整,仍然屬于本發明的保護范圍。
本發明提供了一種多維度實時變電設備數據的閾值自適應設置異常檢測方法,如圖1和2所示,具體包括如下的步驟:
步驟1:在變電系統數據庫里,找到變電設備的所有歷史指標信息,選取一段時間內變電設備在正常運行狀態下和非正常運行狀態下的歷史數據;
步驟2:
A.對選取的變電設備的正常運行狀態下的歷史數據按照如下公式進行歸一化處理:
其中,hn1為h1歸一化后的值,hmax1和hmin1分別為變電設備正常運行狀態下的歷史數據的最大值和最小值,h1為變電設備正常運行狀態下的歷史數據;
B.對選取的變電設備的非正常運行狀態下的歷史數據按照如下公式進行歸一化處理:
其中,hn2為h2歸一化后的值,hmax2和hmin2分別為變電設備非正常運行狀態下的歷史數據的最大值和最小值,h2為變電設備非正常運行狀態下的歷史數據;
步驟3:
A:將歸一化后的hn1做平均值計算,得到平均值H1,并且設置閾值補償參數L1,設置正常狀態下初始野值濾除閾值的下限值為H1-L1,上限值為H1+L1,其中L1可以為根據實際需要濾除野值而設置的,也可以根據長時間變電設備的歷史數據做出的經驗選擇,例如可以是0.1,0.2等;
B:將歸一化后的hn2做平均值計算,得到平均值H2,計算ΔH=|H1-H2|,并且設置誤差閾值補償參數L2,設置非正常狀態下初始野值濾除誤差閾值的下限值為ΔH-L2,上限值為ΔH+L2,其中L2可以為根據實際要濾除野值而設置的,也可以根據長時間變電設備的歷史數據做出的經驗選擇,例如可以是0.03,0.05等;
步驟4:
A.將正常狀態下初始野值濾除閾值的下限值為H-L,上限值為H+L分別利用如下公式進行還原,得到還原后的初始野值濾除閾值的上、下限值:
B.將非正常狀態下初始野值濾除誤差閾值的下限值為ΔH-L2,上限值為ΔH+L2分別利用如下公式進行還原,得到還原后的初始野值濾除誤差閾值的上、下限值:
步驟5:實時獲取變電設備運行狀態多維度實時測點數據,判斷:
A:比較實時測點數據和初始野值濾除閾值的上、下限值的差值,如果差值沒有落入初始野值濾除閾值的上、下限值構成的閾值范圍,則剔除此實時測點數據,如果都落入則進入下一步驟;
B:判斷實時測點數據是否落入初始野值濾除閾值的上、下限值構成的閾值范圍,如果未落入則剔除此實時測點數據,如果落入則進行歸一化處理,獲得變電設備運行狀態的實時多維度歸一化數據序列;
進行歸一化處理,獲得變電設備運行狀態的實時多維度歸一化數據序列;
其中對測點數據進行歸一化運算,具體為;
多維度實時變電設備參數xt定義為t時刻變電設備數據集合,x(i)定義為多維度變電設備數據的第i維,i=1,2,…,n,表示為:
xt=(x(1),x(2),…,x(i),…,x(n))
所述歸一化處理,是指對多維度實時變電設備參數xt進行正規化,實現歸一化運算,
得到t時刻變電設備運行狀態的實時多維度歸一化數據序列到nt,其中NOR(xt)是正規化運算,||xt||,是xt的模。
其中所述變電設備包括(但不限于)開關刀閘、變壓器等,所述變電設備狀態參數包括(但不限于)電流、電壓、功率、功率因數、油溫、油中氣體數據等。
步驟6:通過對變電設備運行狀態的實時多維度歸一化數據序列應用降維操作,產生變電設備運行狀態的實時降維數據序列;
對歸一化處理后的數據序列進行多維度變電設備數據降維,具體為:
所述進行降維操作,是指對變電設備運行狀態的實時多維度歸一化數據序列nt進行降維運算:
yt=PCA(nt)
得到t時刻變電設備運行狀態的實時降維數據序列yt,其中PCA(xt)是降維運算,通過對變電設備運行狀態的實時多維度歸一化數據序列應用降維操作,產生變電設備運行狀態的實時降維數據序列;所述降維運算PCA(xt)包括(但不限于)離散余弦變換、主成分分析、離散小波變換等。
步驟7:應用可配置的預測器,對變電設備運行狀態的實時降維數據序列進行預測計算,產生變電設備運行狀態的預測數據序列;
對變電設備運行狀態的實時降維數據序列進行預測計算,產生變電設備運行狀態的預測數據序列,具體為:
所述預測計算,是指對變電設備運行狀態的實時降維數據序列yt進行預測計算,
得到t時刻變電設備運行狀態的預測數據序列其中AR(yt)是預測器;其中所述預測器包括(但不限于):多項式回歸預測器、支持向量機預測器、人工神經網絡預測器、卡爾曼預測濾波器、決策樹回歸預測器。
步驟8:應用變電設備運行狀態的實時數據及預測數據進行分值計算,得到變電設備運行狀態分值;
利用變電設備實際數據與預測數據進行分值計算,得到當前時刻電設備運行狀態分值,具體為:
所述分值計算,是指應用變電設備運行狀態的實時降維數據序列yt和變電設備運行狀態的實時數據及預測數據進行分值計算,
得到變電設備運行狀態分值到zt;
步驟9:確定變電設備運行狀態閾值區間,包括上閾值界、下閾值界;
確定變電設備運行狀態閾值區間,包括上閾值界、下閾值界,計算正常閾值范圍,具體為:
所述變電設備運行狀態閾值區間,是指
[Q1-1.5IQR,Q3+1.5IQR]
其中,Q1-1.5IQR為上閾值;Q3+1.5IQR為下閾值;四分位數間距IQR=Q3-Q1。
步驟10:應用變電設備運行狀態閾值區間,判斷當前時刻分值是否在閾值區間范圍,并做出變電設備運行狀態是否異常的結論。
所述判斷當前時刻分值是否在閾值區間范圍,并做出變電設備運行狀態是否異常的結論是指使用變電設備運行狀態分值到zt與變電設備運行狀態閾值區間[Q1-1.5IQR,Q3+1.5IQR]進行比較,如果zt在該區間范圍,則變電設備狀態正常;否則,變電設備狀態異常。
盡管為了說明的目的,已描述了本發明的示例性實施方式,但是本領域的技術人員將理解,不脫離所附權利要求中公開的發明的范圍和精神的情況下,可以在形式和細節上進行各種修改、添加和替換等的改變,而所有這些改變都應屬于本發明所附權利要求的保護范圍,并且本發明要求保護的產品各個部門和方法中的各個步驟,可以以任意組合的形式組合在一起。因此,對本發明中所公開的實施方式的描述并非為了限制本發明的范圍,而是用于描述本發明。相應地,本發明的范圍不受以上實施方式的限制,而是由權利要求或其等同物進行限定。