本發明涉及衛星星座通信,尤其涉及一種基于多級冗余的星載路由器異常恢復系統及方法。
背景技術:
1、在衛星星座通信領域,星內各個業務載荷及星務綜合電子經由星載路由器實現基于以太網協議的互聯互通。星內各載荷、星間各衛星以及衛星和地面站之間的通信過程,都依賴于星載路由器的正確配置和正常運行。由于衛星運行環境往往處于高溫/低溫、真空、單粒子等嚴苛條件,星載路由器可能會面臨flash故障、emmc故障、電源故障等多種可能的故障場景,導致以太網數據的轉發與路由異常,無法滿足衛星星座經由星載路由器實現數據鏈路正常通信的需求。目前現有技術針對上述通信異常場景,缺乏系統層面的高可用恢復機制,以保障星載路由器通信業務的可用性。
技術實現思路
1、本發明的目的在于針對上述現有技術存在的不足,提出一種基于多級冗余的星載路由器異常恢復系統及方法,旨在為處于異常狀態的衛星星座系統提供高可用的通信業務恢復方案。
2、為實現上述目的,本發明采取如下技術方案:一種基于多級冗余的星載路由器異常恢復系統,包括星務綜合電子和星載路由器;所述星載路由器內部集成了主路由交換單元和備路由交換單元,主路由交換單元和備路由交換單元均包含一個cpld、兩個flash和一個emmc,其中兩個flash互為備份;emmc中安裝有onie和sonic兩個操作系統;每次啟動由cpld控制其中一個flash上電,flash中安裝的uboot經由引導系統控制鏈路引導emmc中存儲的操作系統啟動;兩個交換單元經由遙測遙控控制鏈路與星務綜合電子交互;星載路由器單設備選擇主flash-主sonic、備flash-主sonic、主flash-備sonic、備flash-備sonic四條路線中任一路線進入sonic系統,任一路線進入系統后選擇系統重啟、sonic系統配置重加載、基于sonic在線重裝sonic系統以及基于onie重裝sonic系統四種方式恢復系統可用性。
3、進一步地,sonic系統配置重加載過程中,在保證系統不重啟的前提下,僅重啟數據庫之外的業務容器,通過遙測狀態可監控容器是否重啟完成,容器狀態恢復正常即可表明重加載命令執行完畢。
4、進一步地,重裝sonic系統的方法包括基于sonic在線重裝sonic系統以及基于onie重裝sonic系統;若sonic系統下遙測遙控收發正常,兩種方法任選其一;否則只能采用基于onie系統重裝sonic系統的方法。
5、進一步地,基于sonic在線重裝sonic系統執行前需要檢查容器狀態,若狀態正常再執行重裝操作,否則需要切換到onie系統進行重裝;sonic系統在線安裝基于遙控指令進行,安裝完成后當前sonic系統中包含兩個系統,重啟即可自動切換到新系統。根據遙測返回的系統狀態信息判斷系統業務是否恢復正常,若業務已恢復,則執行遙控指令卸載舊版本系統;否則切換到onie系統重裝。
6、進一步地,若sonic系統處于異常狀態無法在線重裝,則基于遙測遙控指令切換到onie系統再重裝sonic系統;首先判斷onie系統遙測狀態是否正常,若正常,則執行遙控指令安裝系統,嘗試從掛載盤加載備份安裝包,若安裝包不存在或校驗碼異常,嘗試通過遙控指令從星務綜合電子獲取可用的安裝包再次執行安裝指令,直到正常安裝完成;安裝指令執行成功后系統會切換到sonic系統,根據遙測返回的系統狀態信息判斷系統業務是否恢復正常。
7、進一步地,若主flash異常,備flash正常,則切換到備flash,通過遙控指令刪除emmc中保存的最新的配置信息及主備flash同步標識,并將備flash的配置信息更新到emmc中,并在emmc創建備flash的同步標識;切換回主flash后,由引導系統根據emmc中保存的flash同步標識同步默認flash的配置信息,并在emmc創建主flash的同步標識;若備flash異常,主flash正常,恢復方法同理;若主備flash均異常,則當前sonic系統無法恢復,切換到備sonic系統恢復通信鏈路業務;所述備sonic系統為備路由交換單元中的sonic系統。
8、進一步地,?若onie系統出現異常,切換到sonic系統檢查遙測遙控功能是否可用,若sonic系統遙測遙控正常,則基于sonic系統重裝進而恢復系統可用性;首先嘗試通過遙控指令嘗試從掛載盤加載onie系統鏡像安裝包,若掛載盤不存在目標鏡像或校驗碼異常,則從星務綜合電子獲取正確的安裝包,解壓并執行安裝腳本將最新的鏡像鏈接到系統,根據遙測返回的系統狀態信息判斷系統重裝是否成功。
9、本發明還提供了一種基于多級冗余的星載路由器異常恢復方法,基于上述的一種基于多級冗余的星載路由器異常恢復系統實現;針對衛星星座通信過程中星內、星間或星地數據鏈路業務異常場景,結合星務綜合電子、星載路由器系統cpld、星載路由器sonic系統與星載路由器onie系統間的控制鏈路通信狀態,執行對應的恢復方案,保障數據鏈路業務可用性;所述恢復方案包含以下步驟:
10、a)檢查sonic系統狀態,如果sonic系統遙測狀態與遙控指令收發異常,進入步驟b,否則基于sonic系統遙測狀態與遙控指令檢查sonic系統狀態,若存在異常進入步驟b,否則結束本步驟;
11、b)嘗試重啟sonic系統,重啟后檢查sonic系統狀態是否恢復,若已恢復則結束本步驟,否則進入步驟c;
12、c)若sonic系統能夠正常收發遙測遙控狀態信息則進入步驟d,否則檢查onie系統狀態,若onie系統能夠正常收發遙測遙控狀態信息且mac配置狀態均正常則進入步驟e,否則進入步驟f;
13、d)嘗試重新加載sonic系統配置,若執行后系統恢復則結束本步驟,否則檢查sonic系統mac是否異常,若存在異常則進入步驟f,否則進入步驟g;
14、e)嘗試在onie系統下基于遙測遙控指令重裝sonic恢復系統可用性,若恢復失敗則進入步驟h,否則結束本步驟;
15、f)嘗試切換備flash進入sonic系統,通過同步備份引導系統的配置恢復系統可用性,若恢復失敗則進入步驟h,否則結束本步驟;
16、g)嘗試在sonic系統下重裝sonic恢復系統可用性,若恢復失敗則進入步驟h,否則結束本步驟;
17、h)嘗試通過遙控指令切換到備路由交換單元恢復業務可用性。
18、進一步地,若sonic系統狀態正常,則排查通信鏈路上其他載荷狀態及網絡配置;
19、通信鏈路上其他載荷狀態及網絡配置狀態結合星載路由器遙測返回的對應端口狀態和端口計數進行分析;若計數正常增長,表示報文發出,若星地鏈路不通,則由星地通信載荷和地面站排查故障;若星間鏈路不通,則由星間通信載荷定位問題。
20、進一步地,基于備份引導系統的配置恢復系統可用性的方法基于雙flash冗余架構設計,通過遙測指令控制sonic系統將備flash存儲的配置信息更新到emmc中完成同步,星載路由器再次進入默認flash時首先加載同步后最新的配置信息,進而實現引導系統可用性的恢復。
21、本發明的有益效果是,基于多級冗余設計提出了一個系統級星載路由器異常恢復方法,針對衛星星座通信過程中由于星載路由器異常導致的星內、星間或星地數據鏈路通信業務異常場景,結合星務綜合電子、星載路由器系統cpld、星載路由器sonic系統與星載路由器onie系統間的控制鏈路通信狀態,基于高可用的在軌恢復手段實現數據鏈路通信業務可用性的在軌恢復。與傳統的衛星通信方案相比,本發明所述的星座路由器基于多級冗余設計,單設備可選擇主flash-主sonic、備flash-主sonic、主flash-備sonic、備flash-備sonic四條路線進入sonic系統,任一路線進入系統后可選擇系統重啟、軟件配置重加載、在線重裝sonic系統以及基于onie重裝sonic系統四種方式恢復系統可用性,可組合產生16條系統恢復路線,保障星座數據鏈路通信業務的高可用性。