本發明涉及電力系統暫態穩定控制領域,特別是一種電力系統暫態穩定控制方法。
背景技術:
1、隨著光伏并網發電接入電網的比例不斷增加,光伏發電單元和電力系統之間的相互影響變得越來越復雜,而高滲透率的光伏并網將會給電力系統穩定運行帶來更大的難度與挑戰,尤其是系統的暫態同步穩定性。
2、另一方面,廣域測量系統(wide?area?measurement?system,wams)作為電力系統中一種重要的監測和控制工具,旨在實時獲取和分析電力網絡的狀態信息,并將來自不同測量點的數據進行集成和分析,為系統狀態估計、故障檢測和控制策略制定提供支持。然而,由于廣域測量系統信息在傳輸中存在時滯現象,進一步加劇了因系統狀態估計偏差,將會影響廣域測量系統和相位測量單元進行的廣域阻尼控制效果,致使暫態穩定控制策略失效。
技術實現思路
1、為解決現有技術中存在的上述技術問題,本發明針對含高比例構網型光伏發電單元的交直流系統,提供了一種電力系統暫態穩定控制方法,包括以下步驟:
2、步驟s1:構建生成式動力學模型,并根據每個時間步的隱狀態和動作對生成式動力學模型進行預測;
3、步驟s2:采用ppo算法,在經預測的生成式動力學模型上進行策略學習,生成控制策略并執行。
4、優選地,步驟s1具體包括:
5、步驟s101:構建生成式動力學模型,公式如下:
6、;
7、式中,為 t時刻的生成約束條件,為 t時刻的生成結果,為 t時刻的隱狀態,為 t時刻生成式動力學模型施加的動作, r為維度符號, b為預設的觀測值數量, d a為動作張量維度的長度,為 t時刻的終止符,為 t時刻的效益估計值,為 t+1時刻生成式動力學模型系統狀態變量的觀測值, d為1維布爾型終止張量;
8、其中,動作為發電機的pss信號(primary?synchronization?signa,主同步信號);效益估計值為發電機轉速與額定轉速差的絕對值;觀測值包括發電機電壓、各節點電壓幅值、各節點電壓相位、發電機轉速和發電機轉速關于時間的導數;
9、步驟s102:計算識別網絡隱狀態的具體分布,計算先驗網絡隱狀態的具體分布,公式如下:
10、;
11、;
12、式中,為 t+1時刻識別網絡的隱狀態,為 t+1時刻先驗網絡的隱狀態;為識別網絡,為識別網絡的網絡參數;為先驗網絡,為先驗網絡的網絡參數;“~”為變量分布符號;
13、步驟103:將隱狀態和隱狀態輸入生成網絡重構,公式如下:
14、;
15、;
16、式中,為隱狀態重構后的效益估計值,為隱狀態重構后的終止符,為隱狀態重構后的狀態觀察變量值,為隱狀態重構后的效益估計值,為隱狀態重構后的終止符,為隱狀態重構后的狀態觀察變量值,為生成網絡的網絡參數;
17、步驟104:以最大化條件似然對數為目標,擬合重構結果與原始生成結果,公式如下:
18、;
19、式中, x為生成約束條件, y為生成結果, x和 y均為輸入變量, z為隱狀態,為識別網絡表征的概率分布,為的期望;
20、步驟s105:以隱狀態代替隱狀態,預測生成式動力學模型。
21、進一步,步驟s105之后,還包括:
22、步驟s106:構建生成式動力學模型所需要維護的目標函數,公式如下:
23、;
24、式中,表示kl散度計算符,為重構過程預設的采樣次數;為采樣次序號,為時刻第次采樣的隱狀態;
25、步驟s107:堆疊多個時間步的生成式模塊,優化目標函數,公式如下:
26、;
27、式中,為總時間步數,為時間步序號,為 t時刻到 t+ t時刻先驗網絡的隱狀態,為 t時刻到 t+ t時刻生成式動力學模型施加的動作,為 t時刻到 t+ t時刻的效益估計值,為 t時刻到 t+ t時刻的終止符,為 t+1時刻到 t+1+ t時刻生成式動力學模型系統狀態變量的觀測值,為時刻先驗網絡的隱狀態,為時刻生成式動力學模型施加的動作,為時刻的效益估計值,為時刻的終止符,為時刻生成式動力學模型系統狀態變量的觀測值;
28、步驟s108:最大化經優化的目標函數,以通過優化網絡參數、網絡參數和網絡參數優化生成式動力學模型。
29、優選地,步驟s2具體包括:
30、步驟s201:初始化起始向量,公式如下:
31、;
32、式中,為初始時刻的隱狀態,為初始時刻生成式動力學模型施加的動作,為初始時刻的效益估計值,為初始時刻的終止符;
33、步驟s202:通過識別網絡,故障信息和起始向量估計起始先驗狀態;
34、步驟s203:計算預測的暫態穩定序列長度,公式如下:
35、;
36、式中, n為需計算的軌跡長度,即故障發生至控制信號到達受控設備所經控制周期數;為暫態控制下的序列長度,為故障信息的傳遞時延,為暫態控制策略的計算時耗,為生成式動力學模型的訓練時間步長;
37、步驟s204:計算實時先驗狀態,公式如下:
38、;
39、;
40、式中,為時刻識別網絡的隱狀態,為時刻識別網絡的隱狀態,為時刻生成式動力學模型施加的動作,為時刻的效益估計值,為時刻的終止符,為時刻生成式動力學模型系統狀態變量的觀測值,為時刻預測的步數,為+1時刻識別網絡的隱狀態,為時刻識別網絡的隱狀態,為時刻識別網絡的隱狀態,為時刻生成式動力學模型施加的動作;
41、步驟s205:計算效益估計值和終止符,公式如下:
42、;
43、式中,為時刻的效益估計值,為時刻的終止符,為時刻生成式動力學模型系統狀態變量的觀測值, h為序列差長度,為時刻生成式動力學模型系統狀態變量的觀測值;
44、步驟s206:基于效益估計值和終止符,根據ppo算法生成控制策略,公式如下:
45、;
46、式中,為策略網絡,為策略網絡的當前參數,為時序差分誤差,為折扣因子,為值網絡,為值網絡的當前參數;
47、執行控制策略。
48、與現有技術相比,本發明的有益效果為:
49、本發明所提供的技術方案可通過在動態的生成式動力學模型上運行ppo算法,通過強化學習技術,搜索并優化最優控制軌跡和相應的控制策略,減輕時滯影響,提升控制策略的穩定性和效率。