本發明涉及計算機,特別涉及一種基于大語言模型智能代理的mrna疫苗序列設計系統、一種基于大語言模型智能代理的mrna疫苗序列設計方法和一種電子設備。
背景技術:
1、針對給定病原體或腫瘤相關靶標,mrna疫苗的研發通常包括抗原篩選與設計、t細胞與b細胞表位預測、mrna序列工程優化(包括編碼區與非編碼區)、遞送體系設計以及體內外驗證等多個環節。其中,mrna序列本身的計算設計與優化是決定表達效率、穩定性與安全性的關鍵步驟,對疫苗的最終效果具有重要影響。
2、在mrna疫苗的序列設計階段,相關技術路線通常從目標蛋白或多肽序列出發,按照如下思路進行計算設計:首先,通過免疫信息學和結構生物學方法,從病原體蛋白或腫瘤抗原中篩選潛在保護性表位;利用mhc?i/ii結合預測工具(如netmhcpan、netmhciipan及iedb平臺上的多種算法)預測候選肽段與多種hla等位基因的結合親和力,以評估t細胞免疫應答潛力。接著,在保持蛋白氨基酸序列不變的前提下,對mrna編碼區進行密碼子優化,以提高翻譯效率和蛋白表達水平;其中,常用指標包括密碼子適應性指數(codonadaptation?index,?cai)、gc含量分布、密碼子對模式及避免某些不利二核苷酸頻率等,部分研究采用深度生成模型或專門的優化算法,對密碼子組合進行搜索與優化。然后,通過rna二級結構預測工具(如viennarna套件中的rnafold等)估計局部及整體結構穩定性;例如,近年提出的lineardesign等算法,將mrna序列設計視為在巨大組合空間中兼顧結構穩定性與密碼子使用的優化問題,用動態規劃等方法顯著提高全長mrna的穩定性與表達性能。最后,對5′utr、3′utr、poly(a)尾及首端帽結構進行工程化設計,以改善核糖體加載、翻譯起始及mrna半衰期;可通過引入n1-甲基假尿苷等化學修飾、優化局部結構等方式,平衡免疫原性、穩定性與表達水平。然而,該相關技術路線往往會導致設計周期變長,且多目標沖突(如te>80%與off-target<5%)難以高效權衡。
3、同時,為了支持上述設計路線,相關技術中已經開發了多種計算工具和部分集成平臺。例如,結構與穩定性優化工具、表位與免疫原性預測工具、mrna疫苗設計工作流與web平臺。這些工具和平臺在一定程度上提高了mrna疫苗設計的計算效率,使研究人員能夠快速獲得候選mrna序列,并在表達、穩定性與免疫原性等方面進行初步篩選。
4、盡管相關技術中的工具和平臺在一定程度上提高了mrna疫苗設計的計算效率,使研究人員能夠快速獲得候選mrna序列并進行初步篩選,但目前仍存在如下局限性:1、工具分散、接口異構mrna疫苗設計涉及表位預測、密碼子優化、二級結構預測、穩定性評估、免疫原性與安全性評估等多種計算工具和模型,這些工具多以獨立web服務、命令行軟件或腳本庫形式存在,接口格式、輸入輸出數據結構各不相同,研究人員需要手工編寫腳本進行對接與數據轉換,使用門檻高、易出錯,通常人工干預占比>50%;2、工作流固定、缺乏靈活調度相關技術中的設計流程多采用固定的“線性工作流”,工具組合方式和調用順序在平臺開發階段預先設定。面對不同病原體、不同抗原或不同適應證的個性化需求(例如偏重免疫原性、安全性或表達效率),相關技術中的系統難以實現靈活調整,通常需要人工重新設計工作流、修改腳本,導致工作量大、迭代慢;3、多目標優化能力不足、閉環設計不完善mrna疫苗序列需要在表達效率、結構穩定性、免疫原性、安全性、可制造性等多個指標之間進行權衡。相關技術往往單獨優化某一或少數指標,缺乏面向mrna疫苗的統一多目標評價與優化機制,難以在統一框架下進行候選序列的系統性迭代設計與篩選,導致te與off-target沖突難以pareto最優;4、缺乏以智能代理為核心的自動化設計平臺,當前mrna疫苗設計流程仍嚴重依賴生物信息學專家手工選擇工具、編寫腳本以及調整參數,無法充分利用大語言模型在任務理解、流程規劃和工具調度方面的能力。
技術實現思路
1、為了解決上述問題中的至少一個而提出了本發明。根據本發明第一方面,提供一種基于大語言模型智能代理的mrna疫苗序列設計系統,所述系統,包括:用戶交互與任務解析模塊、任務規劃與智能代理調度模塊、rna設計技能庫及技能描述模塊、多目標評價與閉環優化模塊和數據與模型管理模塊。
2、所述用戶交互與任務解析模塊,用于接收疫苗設計參數,并通過大語言模型對所述疫苗設計參數進行解析和轉換,得到任務描述對象。
3、所述任務規劃與智能代理調度模塊,與所述用戶交互與任務解析模塊和所述rna設計技能庫及技能描述模塊連接,用于根據所述任務描述對象和所述rna設計技能庫及技能描述模塊中的技能,構建dag工作流,通過智能代理調用所述rna設計技能庫及技能描述模塊中的技能,生成候選mrna序列,并在所述dag工作流的執行過程中,根據綜合評分結果,動態調整從所述rna設計技能庫及技能描述模塊中選擇的技能。
4、所述rna設計技能庫及技能描述模塊,與所述多目標評價與閉環優化模塊和所述數據與模型管理模塊連接,用于對mrna分子設計與多維度特性評估功能進行封裝,得到多個技能模塊,對各個所述技能模塊進行統一定義、注冊和管理。
5、所述多目標評價與閉環優化模塊,與所述任務規劃與智能代理調度模塊連接,用于對所述候選mrna序列進行多維度指標分析和綜合評價,得到所述綜合評分結果,并將所述綜合評分結果反饋至所述任務規劃與智能代理調度模塊。
6、所述數據與模型管理模塊,與所述多目標評價與閉環優化模塊連接,用于管理和存儲系統數據和與各rna設計技能相關的模型參數與工具配置。
7、其中,所述系統數據包括:所述任務描述對象和所述候選mrna序列。
8、在本發明的一個實施例中,所述用戶交互與任務解析模塊,包括:
9、輸入接收子模塊,用于接收通過自然語言輸入的疫苗設計參數。
10、任務語義解析子模塊,與所述輸入接收子模塊連接,用于通過大語言模型對所述疫苗設計參數進行語義分析,得到結構化的解析結果。
11、任務配置構建子模塊,與所述任務語義解析子模塊連接,用于將所述解析結果轉化為所述任務描述對象。
12、其中,所述疫苗設計參數包括目標抗原信息、適應證場景和設計約束。
13、在本發明的一個實施例中,所述任務規劃與智能代理調度模塊,包括:
14、任務規劃子模塊,與所述用戶交互與任務解析模塊和所述rna設計技能庫及技能描述模塊連接,用于根據所述任務描述對象,從所述rna設計技能庫及技能描述模塊中查詢相關的技能集合,并結合技能之間的依賴關系、輸入輸出兼容性和資源約束,構建所述dag工作流。
15、智能代理決策子模塊,與所述任務規劃子模塊連接,用于在所述dag工作流的執行過程中,通過大語言模型對中間結果進行分析,得到評價結果,并根據所述評價結果動態調整技能調用順序、參數配置和優化策略。
16、調度與執行協調子模塊,與所述rna設計技能庫及技能描述模塊和所述多目標評價與閉環優化模塊連接,用于下發調用任務、對技能調用的輸入數據進行數據格式轉換、將技能調用結果與執行日志發送給所述多目標評價與閉環優化模塊。
17、其中,所述調用任務為調用所述rna設計技能庫及技能描述模塊中的工具接口。
18、在本發明的一個實施例中,所述rna設計技能庫及技能描述模塊,包括:
19、技能描述子模塊,用于為所述技能庫中的各個技能模塊分別定義一個結構化技能描述對象。
20、技能注冊與發現子模塊,與所述技能描述子模塊連接,用于提供技能注冊接口、技能檢索和技能過濾,并在技能注冊過程中對所述技能描述對象進行校驗。
21、技能調用接口子模塊,與所述多目標評價與閉環優化模塊和所述數據與模型管理模塊連接,用于封裝統一調用接口、提供標準化的調用方法,并將所述技能調用結果封裝為統一的結果對象,將所述結果對象發送至所述多目標評價與閉環優化模塊和所述數據與模型管理模塊。
22、其中,所述結構化技能描述對象包括:技能標識與版本信息、適用對象類型、輸入參數定義、輸出結果定義、依賴關系、性能與資源信息、調用方式中的至少三者。
23、在本發明的一個實施例中,所述多目標評價與閉環優化模塊,包括:
24、候選序列管理子模塊,用于管理在各個迭代輪次中產生的候選mrna序列,為所述候選mrna序列分配唯一標識,并維護候選序列狀態集合。
25、多指標評價子模塊,與所述候選序列管理子模塊、所述任務規劃與智能代理調度模塊和所述數據與模型管理模塊,用于調用所述rna設計技能庫中的評估類技能對所述候選mrna序列進行多維度指標分析,得到多個典型指標,并將各個所述候選mrna序列對應的典型指標以標準化形式轉化為evaluationrecord對象,并發送至所述數據與模型管理模塊。
26、多目標綜合評分子模塊,與所述多指標評價子模塊連接,用于根據任務權重和約束條件,通過預設評分策略,將多個所述典型指標映射為綜合評分結果。
27、閉環優化控制子模塊,與所述多目標綜合評分子模塊和所述任務規劃與智能代理調度模塊連接,用于根據所述綜合評分結果,對所述候選mrna序列進行篩選,對篩選出的mrna序列構建反饋摘要信息,并將所述反饋摘要信息發送至所述任務規劃與智能代理調度模塊,還用于控制迭代過程的終止條件。
28、其中,所述候選序列狀態集合包括候選集、當前主選集和歷史淘汰集,所述終止條件包括達到預設評分閾值、迭代輪數上限和改進幅度不足。
29、在本發明的一個實施例中,所述數據與模型管理模塊,包括:
30、任務與配置管理子模塊,用于存儲各個設計任務對應的任務描述對象,并記錄任務創建、更新和執行的時間點。
31、序列與評價結果存儲子模塊,用于存儲所述候選mrna序列及其對應的evaluationrecord對象,并支持通過篩選條件檢索候選mrna序列,其中,所述篩選條件包括:任務id、輪次編號和評分區間。
32、技能與模型版本管理子模塊,用于對rna設計技能的注冊信息和版本信息進行管理,記錄各個rna設計技能的歷史變更,并管理系統內部各個模型的版本與參數。
33、日志與審計子模塊,用于記錄日志信息,并支持對設計過程的審計與質量分析。
34、在本發明的一個實施例中,所述系統還包括:實驗反饋集成模塊。
35、所述實驗反饋集成模塊,與所述多目標評價與閉環優化模塊和所述任務規劃與智能代理調度模塊連接,包括:實驗數據接收子模塊、數據標準化與映射子模塊和反饋接口子模塊。
36、其中,所述實驗數據接收子模塊,用于接收所述mrna疫苗候選序列的體外或體內實驗數據。
37、所述數據標準化與映射子模塊,與所述實驗數據接收子模塊連接,用于將所述實驗數據轉換為統一的數據結構,并將所述數據結構映射為用于更新多目標評價策略的實驗反饋參數。
38、所述反饋接口子模塊,與所述數據標準化與映射子模塊、所述多目標評價與閉環優化模塊和所述任務規劃與智能代理調度模塊連接,用于將所述實驗反饋參數發送至所述多目標評價與閉環優化模塊和所述任務規劃與智能代理調度模塊。
39、所述實驗數據包括:表達水平、免疫應答強度和安全性指標。
40、在本發明的一個實施例中,所述系統還包括:代碼生成與執行模塊。
41、所述代碼生成與執行模塊,包括:代碼模板與生成子模塊、安全執行環境子模塊和結果解析與錯誤處理子模塊。
42、其中,所述代碼模板與生成子模塊,用于維護多個與rna設計技能相關的腳本模板,并根據技能描述對象中的調用方式及參數定義,由大語言模型生成或補全腳本代碼。
43、所述安全執行環境子模塊,用于在隔離的執行環境中運行由所述代碼生成子模塊生成的腳本,并記錄腳本運行過程中的標準輸出、錯誤信息和返回值。
44、所述結果解析與錯誤處理子模塊,用于解析腳本運行產生的結果文件或標準輸出,還用于當檢測到錯誤或異常時,將錯誤信息整理為提示,由大語言模型給出修正建議或自動生成修復后的腳本。
45、根據本發明第二方面,提供了一種基于大語言模型智能代理的mrna疫苗序列設計方法,應用于上述的基于大語言模型智能代理的mrna疫苗序列設計系統,所述方法包括:
46、獲取疫苗設計參數,并發送至用戶交互與任務解析模塊,所述用戶交互與任務解析模塊通過大語言模型對所述疫苗設計參數進行解析和轉換,得到任務描述對象。
47、任務規劃與智能代理調度模塊根據所述任務描述對象和rna設計技能庫及技能描述模塊中的技能,構建dag工作流,并通過智能代理調用所述rna設計技能庫及技能描述模塊中的技能,生成候選mrna序列。
48、多目標評價與閉環優化模塊對候選mrna序列進行多維度指標分析和綜合評價,得到綜合評分結果,并將所述綜合評分結果反饋至所述任務規劃與智能代理調度模塊。
49、判斷所述候選mrna序列是否滿足預設的設計約束或收斂條件。
50、若滿足,則輸出當前的候選mrna序列。
51、若不滿足,則智能代理基于所述綜合評分結果,對所述候選mrna序列進行修飾、替換或重新生成,形成新一輪候選mrna序列,并返回所述多目標評價與閉環優化模塊對候選mrna序列進行多維度指標分析和綜合評價的步驟。
52、其中,在所述dag工作流的執行過程中,所述任務規劃與智能代理調度模塊根據綜合評分結果,動態調整從所述rna設計技能庫及技能描述模塊中選擇的技能。
53、根據本發明第三方面,提供一種電子設備,包括存儲器、處理器和存儲在所述存儲器上的計算機程序,所述計算機程序被所述處理器執行時,實現上述任意一種基于大語言模型智能代理的mrna疫苗序列設計方法。
54、根據本發明實施例提供的基于大語言模型智能代理的mrna疫苗序列設計系統和方法,本發明的基于大語言模型智能代理的mrna疫苗序列設計系統,具有如下有益效果:
55、1、通過將大語言模型與多種mrna序列分析與優化工具集成,在計算機環境中自動完成針對目標抗原的mrna疫苗序列生成、評價與優化,適用于預防性或治療性mrna疫苗的候選序列設計與篩選,從而提升了設計效率,降低了依賴人工經驗與手工腳本編排的程度。
56、2、通過采用大語言模型智能代理作為中樞,能夠根據用戶給出的疫苗設計參數,自動理解并分解設計任務,另外,本發明能夠替代大量人工進行工具組合、參數調整和中間結果處理,減少對生物信息學工程師編寫膠水代碼的依賴,縮短設計周期,降低人為出錯概率。
57、3、通過引入rna設計技能庫及技能描述模塊,本發明對多種異構工具進行統一結構化描述,屏蔽了底層實現差異,降低了工具集成與維護難度,為后續的自動調度與擴展新工具提供了基礎,并支持按需動態發現與組合,實現異構mrna設計工具的統一抽象與管理。
58、4、本發明的系統具有面向mrna疫苗設計的多目標閉環優化機制,在綜合考慮表達效率、穩定性、免疫原性、安全性及可制造性的前提下,通過迭代生成和評價候選mrna序列,有助于提升最終候選序列的綜合質量,實現自動化的in?silico優化過程。
59、5、本發明利用大語言模型智能代理結合技能模塊,并根據具體mrna疫苗項目的設計目標和約束條件自動選擇技能、確定調用順序和參數配置,突破了傳統固定線性工作流的限制,提高了mrna設計流程的靈活性與可定制化能力,從而支持根據任務需求動態編排工作流,而不僅僅是執行固定的線性工作流。