本發明屬于智能駕駛與行為識別,具體涉及一種基于大語言模型的車輛駕駛風格識別方法及裝置。
背景技術:
1、隨著自動駕駛技術的發展,理解并精準識別人類駕駛員的駕駛風格,對于實現個性化人機共駕、提升駕駛安全性與舒適性至關重要。目前,駕駛風格識別主要依賴于機器學習模型對車輛傳感器時序數據的分析。
2、現有的技術方案主要存在以下局限性:首先,如基于隨機森林的傳統模型,雖具備一定的分類能力,但其高度依賴人工特征工程的質量,難以有效捕捉駕駛行為中蘊含的時序動態特征與長程依賴關系,且模型可解釋性較差。其次,一些基于深度學習的改進方案,如采用膠囊網絡或變分貝葉斯推斷的方法,雖然在特征融合上有所優化,但普遍存在計算復雜度高、模型泛化能力弱、對連續變化的駕駛行為適應性不足等問題。
3、更為根本的是,現有方法大多僅聚焦于數值化的車輛動力學數據,完全忽視了駕駛場景的語義信息以及駕駛員的主觀意圖、操作邏輯等可由自然語言描述的上下文信息。這種對“語義維度”的缺失,導致現有系統難以深入理解駕駛行為的內在機理,無法建立駕駛操作與駕駛員認知狀態之間的關聯,從而限制了識別模型的準確性、魯棒性及其在真實復雜場景下的應用潛力。
4、因此,本領域迫切需要一種能夠深度融合時序數據與語義信息,從而實現對駕駛風格更精準、更擬人化理解的創新技術方案。
技術實現思路
1、本發明旨在克服現有技術的不足,提供一種基于大語言模型的車輛駕駛風格識別方法及裝置。其核心目的在于解決現有識別方法因忽視駕駛行為的語義上下文而導致的深度解析能力不足、識別精度有限及泛化能力弱的問題。通過深度融合車輛時序數據與駕駛語義信息,實現對駕駛風格更精準、更魯棒的識別。
2、為了解決上述技術問題,本發明是這樣實現的:
3、本發明實施例提供了一種基于大語言模型的車輛駕駛風格識別方法,包括以下步驟:
4、(1)通過設定窗長和重疊率的滑動時間窗,對多源車輛傳感器時序數據進行分割,提取包括直線行駛、制動、轉彎和換道模式的駕駛模式時序片段;同步采集駕駛人通過語音或文本輸入的反饋信息,并將所述反饋信息與對應的駕駛模式時序片段通過時間戳進行關聯;
5、(2)對所述駕駛模式時序片段中的車輛動力學特征參數進行主成分分析降維,選取累計貢獻率大于90%的主成分,并對降維后的數據進行譜聚類處理,生成標簽化駕駛模式數據組,所述標簽對應保守、正常或激進駕駛風格;
6、(3)構建駕駛行為語義規則庫,所述規則庫包括對直線行駛、制動、轉彎和換道模式的關鍵特征參數的文本化描述規則;將所述標簽化駕駛模式數據組中的關鍵車輛動力學特征參數及其對應的模式標簽轉化為文本描述,輸入預訓練的大語言模型,由所述大語言模型基于所述語義規則庫進行語義匹配度評估,輸出每一時序片段的匹配度分數,并依據設定的分數閾值篩選出核心時序片段;
7、(4)使用長短期記憶網絡對所述核心時序片段進行時序特征提取,并將步驟(1)中關聯的駕駛人反饋信息經自然語言處理轉化為語義向量,與提取的時序特征進行拼接,生成時序-語義融合特征;
8、(5)將所述時序-語義融合特征的特征名與特征值組合成文本描述,輸入所述大語言模型,由所述大語言模型基于駕駛風格識別任務輸出每個特征的語義先驗權重;
9、(6)將所述語義先驗權重與隨機森林模型基于袋外數據計算得到的數據驅動權重,通過預設的融合系數α進行線性加權融合,得到每一特征的特征加權權重;
10、(7)使用所述特征加權權重對所述時序-語義融合特征進行加權處理,并利用加權后的特征和所述標簽化駕駛模式數據組的標簽訓練隨機森林分類模型,以實現駕駛風格識別。
11、進一步的,步驟(1)中,所述直線行駛模式的識別包括:
12、計算滑動窗口內方向盤轉角的標準差,篩選標準差小于0.5°且方向盤轉角最大值小于5°,同時車速變化率大于設定閾值的窗口,所述車速變化率閾值范圍為0.7至0.9。
13、進一步的,所述制動模式的識別包括:
14、計算滑動窗口內最大制動減速度,篩選減速度大于0.3g且速度降低超過設定閾值的窗口,所述速度降低閾值設置為15km/h至25km/h。
15、進一步的,所述轉彎模式的識別包括:
16、計算滑動窗口內方向盤轉角絕對值的最大值,篩選最大值大于70°且前一時段被識別為直線行駛模式的窗口。
17、進一步的,所述換道模式的識別包括:
18、計算滑動窗口內的方向盤轉角香農熵、橫向加速度均方根、橫擺角速度標準差和速度香農熵,篩選所有特征指標同時超過設定閾值的窗口,并進一步識別方向盤轉角在正負方向均超過設定角度的區間,所述正負角度閾值分別為+10°和-10°。
19、進一步的,步驟(3)中,所述匹配度分數的具體計算步驟包括:
20、將關鍵車輛動力學特征參數及其模式標簽轉化為文本描述,輸入預訓練大語言模型,輸出未歸一化logits值;
21、使用sigmoid函數將logits值轉換為0-1之間的概率值;
22、將所述概率值乘以100并限制在0~100范圍內,得到所述匹配度分數;
23、所述分數閾值為60至80。
24、進一步的,步驟(6)中,所述加權融合的具體公式為:
25、;
26、其中,為特征的融合權重,為語義先驗權重,為隨機森林袋外數據驅動權重,為融合系數,取值范圍為[0,1]。
27、本發明還提供了一種基于大語言模型的車輛駕駛風格識別裝置,包括存儲器和處理器,所述存儲器上存儲有計算機程序,所述處理器執行所述程序時實現所述的方法的步驟。
28、本發明相較于現有技術,其有益效果在于:
29、(1)深度語義融合,提升識別精度:創新性地將大語言模型的深層語義理解與推理能力引入駕駛風格識別領域,實現了對數值化車輛數據與文本化語義信息的深度融合,能夠捕捉駕駛行為背后隱含的意圖與邏輯,從根本上提升了識別的準確性和擬人化水平。
30、(2)增強特征判別力與魯棒性:通過llm生成的匹配度分數篩選核心駕駛片段,有效去除了時序數據中的噪聲干擾。同時,利用llm分析的語義先驗權重與數據驅動權重相融合,優化了特征空間,使模型更關注于關鍵判別性特征,顯著提高了模型的魯棒性和泛化能力。
31、(3)技術協同,解決傳統模型局限:通過lstm-rf-llm的級聯架構,充分發揮了lstm對時序依賴的建模能力、rf集成學習的分類優勢以及llm的語義解析能力,形成了技術協同效應,有效克服了傳統隨機森林模型特征提取能力不足、深度學習模型可解釋性差以及對語義信息利用缺失的缺陷。
32、(4)為高階應用提供可靠支撐:本發明所提供的精準、可靠的駕駛風格識別結果,能夠為個性化車載服務推薦、智能座艙人機交互、高級駕駛輔助系統的自適應策略調整等高階應用提供堅實的技術基礎,具有廣闊的產業化應用前景。