本發明涉及無線通訊的,尤其涉及一種工業無線信道預測方法。
背景技術:
::1、2、傳統的深度學習方法(如cnn、lstm),例如申請號為202211281296.x的發明公開了一種無線網絡信道狀態預測方法、裝置、設備及存儲介質。盡管在某些應用中取得了良好的效果,但在異構環境下存在兩個問題。第一,現有模型難以有效區分los與nlos場景的信道的共性與差異,導致泛化性能受限。多任務學習(mtl)雖通過共享特征提升異構建模能力,但其多目標優化過程復雜,難以在資源受限的環境中部署。第二,傳統深度學習模型缺乏實時調整機制,面對信道狀態的劇烈波動時,魯棒性和適應性不足。3、隨著云計算和邊緣計算的發展,云邊協同架構作為一種有效的解決方案,逐漸應用于工業無線信道的預測任務。云服務器主要負責處理全局特征建模和復雜數據計算,分析信道的全局模式和長期趨勢;邊緣計算節點則負責近實時的數據處理和短期動態的預測,以降低通信延遲和計算負載。然而,現有的云邊協同架構仍存在一些不足,尤其是在任務調度策略上,傳統的靜態調度和啟發式方法往往難以適應信道狀態的動態變化,導致在實時性和預測精度之間難以取得理想的平衡。4、為了解決這一問題,近年來,深度強化學習(drl)方法在多任務優化和資源調度方面得到了廣泛應用。drl通過動態決策優化,能夠適應復雜的工業環境。然而,現有的基于drl的調度方法大多數專注于單一目標的優化(如最小化延遲),缺乏能夠有效處理多目標(如延遲和預測精度)之間的沖突的機制,限制了其在工業環境中的應用。5、為了彌補以上信道預測的精度與預測任務延遲的不足,需要設計一種更適用于實際工業場景,且具有更好泛化性以及高精度、低延遲的工業無線信道預測方法。技術實現思路1、針對現有方法在工業無線信道的預測中存在精度低、延遲高的技術問題,本發明提出一種基于多時間尺度注意力機制的云邊協同工業無線信道預測方法,將以多時間尺度注意力模型為核心的預測模型部署于設計的云邊協同工業無線信道預測架構中,利用多目標動態信道預測任務調度算法對預測任務進行智能分配,實現在云端和邊緣端之間動態平衡預測精度和延遲。2、為了達到上述目的,本發明的技術方案是這樣實現的:3、一種基于多時間尺度注意力機制的云邊協同工業無線信道預測方法,包括以下步驟:4、s1、建立包括一臺云服務器、至少一臺與云服務器通信的邊緣服務器,以及至少一個與邊緣服務器通信的工業終端設備的云邊協同工業無線信道預測架構;5、s2、基于雙深度q網絡和時序加權注意力機制,建立多目標動態信道預測任務調度算法并部署在邊緣服務器;建立基于多時間尺度注意力機制的云邊協同工業無線信道預測模型,包括部署在云服務器的云端預測模型和部署在邊緣服務器的邊緣預測模型;6、s3、工業終端設備實時采集信道數據并基于信道特性將信道數據標記為los或nlos場景數據,將標記后的信道數據上傳至邊緣服務器;7、s4、邊緣服務器接收到工業終端設備上傳的標記后的信道數據后,通過多目標動態信道預測任務調度算法進行信道預測任務分配;若信道預測任務被分配給邊緣服務器,則邊緣服務器將標記后的信道數據輸入邊緣預測模型,得到信道狀態預測結果;若信道預測任務被分配給云服務器,則邊緣服務器將標記后的信道數據上傳至云服務器,云服務器通過云端預測模型獲得信道狀態預測結果。8、進一步,在建立多目標動態信道預測任務調度算法前,需獲取基于多目標動態信道預測任務調度的馬爾可夫決策模型,方法為:對狀態空間和邊緣服務器的動作空間建模;建立綜合考慮信道預測精度與信道預測任務延遲的獎勵函數;9、所述對狀態空間和邊緣服務器的動作空間建模包括如下步驟:10、在時隙t內,系統狀態由邊緣服務器的負載、網絡帶寬、數據量和傳輸時延構成;11、智能體選擇的動作at={0,1},其中,動作at=0表示信道預測任務分配至邊緣服務器,動作at=1表示信道預測任務分配至云服務器,當邊緣服務器的負載lt大于等于邊緣服務器的負載上限lmax時,信道預測任務僅上傳至云服務器,此時動作at=1,其中,lmax表示邊緣服務器的負載上限;12、所述建立綜合考慮信道預測精度與信道預測任務延遲的獎勵函數的方法為:建立在時隙t內的延遲獎勵;建立在時隙t內的誤差獎勵;綜合延遲獎勵與誤差獎勵,得到獎勵函數。13、進一步,所述系統狀態的表達式為:st={lt,bt,ct,dt},其中,lt為邊緣服務器的負載,bt為邊緣服務器的網絡帶寬,ct為邊緣服務器的數據量,dt為邊緣服務器的傳輸時延;14、所述延遲獎勵的表達式為:15、16、其中,ttans表示數據傳輸延遲,tinfer表示云邊協同工業無線信道預測模型的推理延遲;所述誤差獎勵的表達式為:17、18、其中,error(st,at)表示預測誤差的具體度量;19、所述獎勵函數的表達式為:其中,α1和α2為權重系數且均大于零。20、進一步,所述基于雙深度q網絡和時序加權注意力機制,建立多目標動態信道預測任務調度算法的方法為:建立包括獨立的延遲網絡與誤差網絡的雙重深度q網絡,并在q值計算之前引入設計的時序加權注意力機制,得到基于時序加權注意力的雙重深度q網絡;21、所述邊緣服務器接收到工業終端設備上傳的標記后的信道數據后,通過多目標動態信道預測任務調度算法進行信道預測任務分配的方法為:邊緣服務器利用基于時序加權注意力的雙重深度q網絡,以當前系統狀態st作為輸入,通過獎勵函數rt計算獎勵值,基于獎勵值通過ε-greedy策略選擇動作at,根據動作at進行信道預測任務的分配。22、進一步,通過設計的時序加權注意力機制,基于時序加權注意力的雙重深度q網絡輸出q值的方法為:23、通過獨立的延遲網絡與誤差網絡分別估計延遲q值與誤差q值24、25、其中,θl和θe分別為延遲網絡和誤差網絡的參數;26、通過設計的時序加權注意力機制動態調整延遲q值和誤差q值的權重,基于歷史的上下文向量和平均獎勵信號通過gru模塊,生成動態權重其中,和分別為平均延遲和平均誤差,和分別表示延遲和誤差的權重;27、將動態權重與當前時隙的上下文向量vt逐元素相乘,得到加權上下文向量并與延遲q值和誤差q值結合輸入多頭注意力機制來捕捉短期與長期依賴特性,然后拼接多頭注意力機制的輸出并通過全連接層生成綜合q值qt。28、進一步,所述云端預測模型由多時間尺度注意層、任務特定分支層和輸出層依次連接組成;所述邊緣預測模型由多時間尺度注意層和輸出層依次連接組成;云端預測模型和邊緣預測模型中的多時間尺度注意層相同;29、所述多時間尺度注意層由變量選擇網絡、lstm編碼器、gate和add&norm層ⅰ、門控殘差網絡ⅰ、多尺度局部自注意力網絡、gate和add&norm層ⅱ、以及門控殘差網絡ⅱ依次連接組成。30、進一步,所述云端預測模型和邊緣預測模型均通過多時間尺度注意層從標記后的信道數據中提取多時間尺度特征,包括以下步驟:31、先將標記后的信道數據組織為滑動窗口時間序列,滑動窗口時間序列被送入對應的變量選擇網絡,經變量選擇網絡處理后,得到滑動窗口時間序列中每個特征向量的加權特征,進而得到滑動窗口時間序列的加權特征矩陣;32、滑動窗口時間序列的加權特征矩陣輸入lstm編碼器進行時序依賴特征的提取,得到隱藏狀態序列;33、對隱藏狀態序列進行隨機失活操作,生成稀疏化的狀態序列并送入gate和add&norm層ⅰ,得到門控狀態序列;34、通過門控殘差網絡ⅰ對門控狀態序列進一步進行特征提取,生成輸入至多尺度局部自注意力網絡的特征,經多尺度局部自注意力網絡處理后,得到多時間尺度特征矩陣;35、多時間尺度特征矩陣經過gate和add&norm層ⅱ、門控殘差網絡ⅱ依次處理后,得到多時間尺度特征。36、進一步,在邊緣預測模型中,多時間尺度特征被傳入輸出層,在輸出層中將多時間尺度特征映射為信道狀態預測結果,得到未來t個預測時間步長的信道狀態預測序列37、進一步,在云端預測模型中,多時間尺度特被傳遞給任務特定分支層,分別針對los和nlos場景進行特性提?。?8、對于los場景,通過lstm層ⅰ、門控殘差網絡ⅲ、lstm層ⅱ依次對多時間尺度特征進行特征提取,得到長期全局特征o′為多時間尺度特征,k為窗口長度,dh為隱藏層維度,grn為門控殘差網絡操作,lstm為長短期記憶網絡操作;39、對于nlos場景,通過一維卷積網絡ⅰ、門控殘差網絡ⅳ、一維卷積網絡ⅱ依次對多時間尺度特征進行特征提取,得到局部特征conv-1d為一維卷積操作;40、通過門控機制融合將長期全局特征與局部特征進行融合,融合過程如下:41、glos=σ(wloshlos+blos)42、hfusion=glos⊙hlos+(1-glos)⊙hnlos43、其中,wlos和blos分別是門控單元的權重和偏置,glos為門控值,σ(·)為sigmoid激活函數,hfusion為融合后的特征矩陣;44、融合后的特征矩陣hfusion被傳遞給輸出層,得到未來t個預測時間步長的信道狀態預測序列45、進一步,所述邊緣預測模型通過淺層參數共享機制與云端預測模型共享多時間尺度注意力層的參數,邊緣預測模型通過淺層參數更新機制進行多時間尺度注意力層的參數更新:46、(1)淺層參數共享機制中,來自云端預測模型共享的多時間尺度注意力層參數θshared被卸載到邊緣服務器,替換邊緣預測模型中多時間尺度注意力層的參數集,邊緣預測模型的參數表示為:47、θedge-pm={θshared,θadjustable}48、其中,θadjustable表示邊緣預測模型的特定參數,共享的多時間尺度注意力層參數被凍結,僅需訓練θadjustable部分以適配邊緣服務器的特定任務需求;49、(2)淺層參數更新機制中,當邊緣服務器收集的實時數據達到設定容量時,數據將被上傳至云服務器,云服務器對云端預測模型的多時間尺度注意力層參數進行微調,并共享至邊緣服務器。50、與現有技術相比,本發明的有益效果:51、1、本發明綜合考慮了工業無線信道環境的復雜性和高動態性,基于數據驅動的深度學習和強化學習,建立了基于分層智能調度的云邊協同工業無線信道預測架構。具有較高精度和低延遲。52、2、本發明具有較強的泛化性和實用性,基于多時間尺度注意力機制的云邊協同工業無線信道預測模型可解決復雜動態場景下的信道數據的異構性等問題,彌補了過往算法信道預測的精度不足缺點。53、3、本發明具有較強的魯棒性,通過所設計的多目標動態信道預測任務調度能夠適應環境惡劣的工業場景,在實際工業應用中,實時性強,可靠性高。當前第1頁12當前第1頁12