日韩中文字幕久久久97都市激情,久久91网,亚洲天堂最新,国产精品嫩草影院九色,亚洲午夜精品一本二本,精品少妇一区二区三区蜜桃,av一道本

數據處理方法、服務器、存儲介質和程序產品與流程

文檔序號:42170088發布日期:2025-06-13 16:26閱讀:14來源:國知局
本申請涉及計算機技術,尤其涉及一種數據處理方法、服務器、存儲介質和程序產品。
背景技術
::1、隨著信息技術的飛速發展,數據驅動決策在各行各業中發揮著越來越重要的作用。數據庫作為存儲和管理大量結構化數據的核心工具,其高效訪問與操作能力對系統流程的優化至關重要。然而,傳統的數據庫查詢依賴于結構化查詢語言(structured?querylanguage,簡稱sql),這要求用戶具備一定的編程知識和技能,限制了非技術人員的直接數據訪問和分析能力。為了解決這一瓶頸,自然語言處理(natural?language?processing?,簡稱nlp)技術逐漸應用于數據庫查詢領域,催生了自然語言轉sql(即nl2sql)的研究與應用。2、nl2sql是指將自然語言查詢轉換為可在關系數據庫上執行的sql查詢,是將自然語言處理與數據庫管理相結合的典型應用。nl2sql的核心目標在于理解用戶以自然語言形式提出的查詢意圖,并生成準確反映該意圖的sql語句,從而使用戶能夠無需掌握復雜的sql語法,直接通過自然語言與數據庫進行高效交互。這一技術不僅降低了數據庫訪問的門檻,還拓寬了數據分析的用戶群體,具有廣泛的應用前景。3、近年來,大規模語言模型(large?language?model,簡稱llm)的出現為nl2sql技術的發展注入了新的活力。相比傳統方法,llm在理解復雜語言結構、語義推理和生成能力方面表現出色,顯著提升了nl2sql系統的性能。這些大模型能夠通過大規模數據訓練,捕捉豐富的語言模式和知識,從而更準確地理解用戶意圖,生成符合數據庫架構的sql查詢。此外,借助llm使得nl2sql系統能支持口語對話,進一步簡化用戶與數據庫的交互過程,為商業應用和系統流程改革提供了新的可能性。4、基于nl2sql技術產生了聊天式商業智能(chat-based?business?intelligence,簡稱chatbi)類的產品,使用戶能夠以對話的方式輕松進行數據查詢和分析。目前市面上的chatbi類產品面向應用級數據庫(即一個應用對應一個數據庫/數據源,一個數據庫中數據表的數量小于100,即databases?=?1,tables?<?100),基于用戶查詢在單一數據源中進行查詢。面向多數據庫的應用時,依賴數據治理和數據隔離,無法支持用戶針對全域數據庫的查詢需求。技術實現思路1、本申請提供一種數據處理方法、服務器、存儲介質和程序產品,用以解決基于nl2sql的查詢系統,在面向多數據庫應用時,無法支持用戶針對全域數據庫的查詢需求的問題。2、第一方面,本申請提供一種數據處理方法,包括:3、接收輸入的自然語言查詢;根據各數據庫的描述信息和各所述數據庫的表連通子圖的描述信息,召回與所述自然語言查詢相關的候選數據庫;根據所述自然語言查詢、所述候選數據庫中各數據表的描述信息和各表列的描述信息,對所述候選數據庫進行精排序,獲得精排序結果;根據所述精排序結果選擇至少一個所述候選數據庫,作為與所述自然語言查詢關聯的目標數據庫;在所述目標數據庫中確定與所述自然語言查詢關聯的目標數據表和目標表列。4、第二方面,本申請提供一種數據處理方法,包括:5、響應于自然語言到sql的轉換請求,獲取待轉換的自然語言查詢;根據企業級數據庫中各數據庫的描述信息和各所述數據庫的表連通子圖的描述信息,召回與所述自然語言查詢相關的候選數據庫;根據所述自然語言查詢、所述候選數據庫中各數據表的描述信息和各表列的描述信息,對所述候選數據庫進行精排序,獲得精排序結果;根據所述精排序結果選擇至少一個所述候選數據庫,作為與所述自然語言查詢關聯的目標數據庫;在所述目標數據庫中確定與所述自然語言查詢關聯的目標數據表和目標表列;根據所述目標數據庫、目標數據表和目標表列,生成所述自然語言查詢對應的sql語句;輸出所述sql語句。6、第三方面,本申請提供一種服務器,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述服務器執行如前述任一方面所提供的方法。7、第四方面,本申請提供一種計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有計算機執行指令,當處理器執行所述計算機執行指令時,實現如前述任一方面所提供的方法。8、第五方面,本申請提供一種計算機程序產品,包括計算機程序,該計算機程序被處理器執行時實現如前述任一方面所提供的方法。9、本申請提供的數據處理方法、服務器、存儲介質和程序產品,該方法根據各數據庫的描述信息和各所述數據庫的表連通子圖的描述信息,召回與所述自然語言查詢相關的候選數據庫;根據所述自然語言查詢、所述候選數據庫中各數據表的描述信息和各表列的描述信息,對所述候選數據庫進行精排序,獲得精排序結果;根據所述精排序結果選擇至少一個所述候選數據庫,作為與所述自然語言查詢關聯的目標數據庫;在所述目標數據庫中確定與所述自然語言查詢關聯的目標數據表和目標表列。該方法在多個數據庫和海量數據表的場景中,基于一種智能路由策略,在數據庫的全域范圍內,基于統一的數據庫的描述信息、數據庫的表連通子圖的描述信息、數據表的描述信息和表列的描述信息,將用戶查詢智能路由到全域范圍內與用戶查詢關聯的目標數據庫、目標數據表和目標表列,實現用戶的全域數據查詢需求,并且無需依賴復雜的數據治理和場景隔離,通過統一的智能路由,簡化了多數據庫查詢的流程,提升了多數據庫查詢的操作便捷性。技術特征:1.一種數據處理方法,其特征在于,包括:2.根據權利要求1所述的方法,其特征在于,還包括:3.根據權利要求2所述的方法,其特征在于,生成所述各數據庫的描述信息,包括:4.根據權利要求2所述的方法,其特征在于,生成所述各數據庫的表連通子圖的描述信息,包括:5.根據權利要求2所述的方法,其特征在于,生成所述各數據庫中數據表的描述信息,包括:6.根據權利要求2所述的方法,其特征在于,生成所述各數據庫中表列的描述信息,包括:7.根據權利要求2-6中任一項所述的方法,其特征在于,所述根據各數據庫的描述信息和各所述數據庫的表連通子圖的描述信息,召回與所述自然語言查詢相關的候選數據庫,包括:8.根據權利要求7所述的方法,其特征在于,所述根據所述自然語言查詢、各所述數據庫的描述文本和各所述數據庫的表連通子圖的描述文本,計算所述自然語言查詢與各所述數據庫的文本相似度,根據所述文本相似度篩選出所述候選數據庫的第一候選集,包括:9.根據權利要求7所述的方法,其特征在于,所述根據所述自然語言查詢的向量表示、各所述數據庫的描述向量和各所述數據庫的表連通子圖的描述向量,計算所述自然語言查詢與各所述數據庫的向量相似度,根據所述向量相似度篩選出所述候選數據庫的第二候選集,包括:10.根據權利要求2-6中任一項所述的方法,其特征在于,所述根據所述自然語言查詢、所述候選數據庫中各數據表的描述信息和各表列的描述信息,對所述候選數據庫進行精排序,獲得精排序結果,包括:11.根據權利要求10所述的方法,其特征在于,所述根據所述自然語言查詢、所述候選數據庫中各數據表的描述信息和各表列的描述信息,計算所述候選數據庫的至少一項精排分數,包括:12.根據權利要求1-6中任一項所述的方法,其特征在于,還包括:13.根據權利要求1-6中任一項所述的方法,其特征在于,所述在所述目標數據庫中確定與所述自然語言查詢關聯的目標數據表和目標表列,包括:14.一種數據處理方法,其特征在于,包括:15.一種服務器,其特征在于,包括:16.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有計算機執行指令,當處理器執行所述計算機執行指令時,實現如權利要求1-14任一項所述的方法。17.一種計算機程序產品,包括計算機程序,其特征在于,該計算機程序被處理器執行時實現如權利要求1-14任一項所述的方法。技術總結本申請提供一種數據處理方法、服務器、存儲介質和程序產品。該方法涉及計算機技術,在多數據庫和海量數據表場景中,在數據庫的全域范圍內,根據各數據庫的描述信息和各數據庫的表連通子圖的描述信息,粗召回相關的候選數據庫;根據自然語言查詢、候選數據庫中各數據表的描述信息和各表列的描述信息,對候選數據庫精排序,根據精排序結果確定與自然語言查詢關聯的目標數據庫、目標數據表和目標表列,結合粗召回和多層級精排,將用戶查詢智能路由到關聯的目標數據庫、目標數據表和目標表列,實現用戶的全域數據查詢需求,無需依賴復雜的數據治理和場景隔離,通過統一的智能路由簡化了多數據庫查詢的流程,提升了多數據庫查詢的操作便捷性。技術研發人員:薛靜遠,李屾受保護的技術使用者:阿里云飛天(杭州)云計算技術有限公司技術研發日:技術公布日:2025/6/12
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1