本申請涉及小分子,具體涉及一種分子性質分析方法、裝置、設備、存儲介質和程序產品。
背景技術:
1、在化學領域,預測小分子的分子性質是一項重要的研究內容,這通常需要使用分子描述符、機器學習算法或圖神經網絡(gnn)等技術。在gnn領域,已經有不少的研究通過調整gnn或機器學習算法來提高分子性質的預測準確性。
2、但是,傳統的gnn或機器學習算法在預測結果的可解釋性上存在一定的局限性。
技術實現思路
1、基于上述問題,本申請提供一種分子性質分析方法、裝置、設備、存儲介質和程序產品,能夠建立小分子的構效關系,解釋分子性質的預測結果。
2、第一方面,本申請提供了一種分子性質分析方法,該方法包括:根據多個小分子的分子圖數據和預先訓練的分子性質預測模型,得到各小分子對應的高維向量和分子性質;多個小分子對應的高維向量進行聚類分析,得到聚類結果;根據聚類結果對多個小分子的分子結構和分子性質進行分析,得到分析結果;其中,分析結果用于表征分子結構與分子性質之間的對應關系。
3、本申請實施例的技術方案建立了小分子的構效關系,不僅可以解釋分子性質的預測結果,而且還可以輔助研究人員基于該構效關系進行小分子的篩選和設計。
4、在一些實施例中,根據聚類結果對多個小分子的分子結構和分子性質進行分析,得到分析結果,包括:根據聚類結果確定各小分子所屬類別對應的分子性質;對于聚類后多個類別中的目標類別,根據多個小分子之間的官能團相似性得到目標官能團;根據目標類別對應的分子性質和目標官能團,得到分析結果。本申請實施例的技術方案建立了小分子的官能團與分子性質之間的對應關系,不僅可以解釋分子性質的預測結果,而且還可以輔助研究人員篩選和設計具備特定官能團的小分子,從而提高篩選效率和設計效率。
5、在一些實施例中,根據聚類結果確定各小分子所屬類別對應的分子性質,包括:對聚類結果進行降維處理,得到降維結果;根據降維結果確定各小分子所屬類別對應的分子性質。本申請實施例的技術方案進行降維處理,可以更直觀地展示小分子所屬類別與分子性質之間的對應關系,更方便法分析小分子的構效關系,從而提高分子性質的分析效率。
6、在一些實施例中,根據多個小分子的分子圖數據和預先訓練的分子性質預測模型,得到各小分子對應的高維向量和分子性質,包括:將各小分子的分子圖數據輸入分子性質預測模型,得到分子性質預測模型中目標嵌入層輸出的各小分子對應的高維向量,以及分子性質預測模型輸出的分子性質。本申請實施例的技術方案中,將小分子表示為一個高維向量,使得高維向量與預測出的分子性質之間具有一定相關性,從而可以在聚類分析后建立小分子的構效關系,進而輔助研究人員進行小分子的篩選和設計。
7、在一些實施例中,該方法還包括:獲取訓練樣本集;訓練樣本集包括多個樣本圖數據和各樣本圖數據對應的分子性質標注;基于訓練樣本集和初始預測模型進行模型訓練,得到分子性質預測模型。本申請實施例的技術方案提供了一種模型訓練方式,以便利用訓練過的分子性質預測模型得到小分子的高維向量和分子性質,從而建立小分子的構效關系,為解釋預測結果提供依據。
8、在一些實施例中,基于訓練樣本集和初始預測模型進行模型訓練,得到分子性質預測模型,包括:將訓練樣本集的樣本圖數據輸入初始預測模型,得到初始預測模型輸出的預測分子性質;根據預設損失函數計算預測分子性質與樣本圖數據對應的分子性質標注之間的損失值;在損失值不符合收斂條件的情況下,進行模型參數調整;基于訓練樣本集和參數調整后的模型進行訓練,直至模型輸出的損失值符合收斂條件時結束訓練,并將結束訓練時的模型確定為分子性質預測模型。本申請實施例的技術方案提供了一種模型訓練方式,通過訓練出的分子性質預測模型可以得到小分子的高維向量和分子性質,從而根據對小分子的高維向量進行聚類分析建立小分子的構效關系,為解釋預測結果提供依據。
9、在一些實施例中,獲取多個小分子的分子圖數據,包括:獲取各小分子的分子構型數據;分別對各小分子的分子構型數據進行格式轉換,得到各小分子的smiles碼;分別將各小分子的smiles碼輸入到預先訓練的圖神經網絡,得到圖神經網絡輸出的各小分子的分子圖數據。本申請實施例的技術方案提供了一種分子圖數據的獲取方式,可以方便后續利用分子性質預測模型分子性質預測,提高預測準確性。
10、第二方面,本申請還提供了一種分子性質分析裝置,該裝置包括:
11、性質預測模塊,用于根據多個小分子的分子圖數據和預先訓練的分子性質預測模型,得到各小分子對應的高維向量和分子性質;
12、聚類分析模塊,用于對多個小分子對應的高維向量進行聚類分析,得到聚類結果;
13、構效分析模塊,用于根據聚類結果對多個小分子的分子結構和分子性質進行分析,得到分析結果;其中,分析結果用于表征分子結構與分子性質之間的對應關系。
14、第三方面,本申請還提供了一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現第一方面中任一項所述的方法。
15、第四方面,本申請還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現第一方面中任一項所述的方法。
16、第五方面,本申請還提供了一種計算機程序產品,包括計算機程序,該計算機程序被處理器執行時實現第一方面中任一項所述的方法。
1.一種分子性質分析方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述根據所述聚類結果對多個所述小分子的分子結構和分子性質進行分析,得到分析結果,包括:
3.根據權利要求2所述的方法,其特征在于,所述根據所述聚類結果確定各所述小分子所屬類別對應的分子性質,包括:
4.根據權利要求1所述的方法,其特征在于,所述根據所述多個小分子的分子圖數據和預先訓練的分子性質預測模型,得到各所述小分子對應的高維向量和分子性質,包括:
5.根據權利要求4所述的方法,其特征在于,所述方法還包括:
6.根據權利要求5所述的方法,其特征在于,所述基于所述訓練樣本集和初始預測模型進行模型訓練,得到所述分子性質預測模型,包括:
7.根據權利要求1-6任一項所述的方法,其特征在于,所述方法還包括:
8.一種分子性質分析裝置,其特征在于,所述裝置包括:
9.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至7中任一項所述的方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7中任一項所述的方法。
11.一種計算機程序產品,包括計算機程序,其特征在于,該計算機程序被處理器執行時實現權利要求1至7中任一項所述的方法。