背景技術:
0、背景
1、癌癥為全世界疾病的主要原因。每年,在世界各地有數千萬人被診斷為患有癌癥,并且多于一半的患者最終因其而死亡。在許多國家,癌癥列為繼心血管疾病之后第二大最常見的死亡原因。早期檢測與許多癌癥的改善結果相關。
2、為了檢測癌癥,有幾種篩選測試可得。身體檢查和歷史記錄調查了一般健康征象,包括檢查疾病征象,諸如腫塊或其他不尋常的身體癥狀。患者的健康習慣和過去的疾患和治療的歷史也將被收集。實驗室測試為另一種類型的篩選測試,并且在進行實驗室測試之前,可能包括醫學程序以取得組織、血液、尿液或身體中其他物質的樣品。成像程序通過生成身體內部區域的視覺表示來篩選癌癥。遺傳測試檢測與一些類型癌癥相關的某些基因的有害突變。遺傳測試對于許多診斷方法為特別有用的。
3、乳腺癌臨床亞型通過激素受體(er/pr)和人類表皮生長因子受體2?(her2)的表達確定。不同的亞型具有不同的發生率、預后、復發風險和總體存活率。準確的亞型分類對于提供治療決策信息具有關鍵意義。使用免疫組織化學(ihc)鑒定乳腺癌亞型目前被認為是臨床實踐中的護理標準。可以進行另外的確認性測試,諸如fish。不太頻繁地使用的pam50(prosigna)測試基于50個基因的基因表達提供了更多關于分子亞型的信息(例如轉移的風險、存活率等)。使用cfdna進行監測可以解決挑戰,其中ihc測試或其他測試通常在治療開始時進行,然而乳腺癌亞型可以隨著時間的推移而改變和演化(亞型轉換或受體轉化的現象)。亞型轉換可由于腫瘤細胞內的遺傳突變和其他分子變化以及還有治療干預的結果而發生。本領域非常需要檢測cfdna用于在治療之前、期間和之后監測受試者。
技術實現思路
0、發明概述
1、本文描述了一種方法,所述方法包括:檢測多于一個位點中的至少一個位點中的甲基化;為多于一個位點中的每一個生成多于一個一個或更多個度量;以及處理一個或更多個度量以表征樣品。在其他實施方案中,一個或更多個度量從來自多于一個位點中的每一個的甲基化判定獲得。在其他實施方案中,方法包括獲得樣品。在其他實施方案中,方法包括具有獲得的樣品。在其他實施方案中,方法包括從一組訓練樣品的甲基化數據構建分類模型,所述一組訓練樣品包括以下中的一個或更多個:hr+/her2-、hr+/her2+、hr-/her2+和hr-/her2-。在其他實施方案中,使用一與多(one?vs.?rest)分類訓練分類模型。在其他實施方案中,訓練包括排序。在其他實施方案中,基于排序來選擇區域。在其他實施方案中,基于多于一個位點中的每一個的顯著性和/或權重進行排序。在其他實施方案中,使用交叉驗證來訓練分類模型。在其他實施方案中,方法包括使用1折、2折、3折、4折、5折、6折、7折、8折、9折、10折或更多折交叉驗證的交叉驗證。在其他實施方案中,為多于一個位點中的每一個生成多于一個一個或更多個度量包括伯努利概率分布和/或混合模型。在其他實施方案中,處理一個或更多個度量以表征樣品包括基于多于一個位點中的一個或更多個位點中的輸入dna的量來計算腫瘤分子的概率。在其他實施方案中,位點包括定制組。
2、在其他實施方案中,定制組被配置為計算機模擬組。在其他實施方案中,定制組被配置在物理組中。在其他實施方案中,定制組包括一組癌基因、一組癌基因的啟動子區、hrr基因、免疫腫瘤學(io)基因、癌癥途徑、在癌癥中發現的甲基化峰或在臨床樣品中發現的甲基化峰。在其他實施方案中,至少基于文獻注釋、常見甲基化峰位置和/或公共數據集來細化定制組。在其他實施方案中,多于一個位點包括選自由以下組成的組的一個或更多個基因:tlcd3b、ppp1r1b、tmem200b、glp1r、fjx1、zbed4、pfkfb3、mdfi、znf280b、ciz1、pou4f3、med1、arhgef4、sertm1、frmd3、notum、mbp、cldn10、fabp3、anxa6、pm20d2、bhlhe23、lrfn5、hoxd10、echdc1、gstp1、cckbr、mir4500hg、cald1、pde4b、insc、hla-e、nrg1、cyyr1、mir3185、cdh12、anp32e、slc7a4、ltbp4、ccdc28b、dlx4、adcy8、sp8、asphd1、hoxb8、agps、hlf、nfix、kcna2、robo3、ccdc92b、kcnh8、ppp4r4、foxc2、ppp2r2c、capg、znf329、il12rb2、hoxd-as2、sorcs1、hoxd13、samm50、unc13a、cacng8、cadps、hif3a、csmd3、mir137、dlx4、begain、phactr2、znf667、fendrr、srp68、tubb2a、slc16a12、marcks、c1ql1、foxl2、erbb2、layn、pdgfra、hrk、fam20a、loc105377879、wnt3a、myh11、nmnat2、kcnip4、trank1、syt2、znf536、neurog3、lin28a、dmrt3、mcoln2、itga4、pnky、chrnb1、glis3、haglr、pik3cd、dio3os、duox2、crhr1、fam20a、rfx4、plxnc1、p2rx6、tlcd3b、ppp1r1b、tmem200b、glp1r、fjx1、zbed4、pfkfb3、mdfi、znf280b、ciz1、pou4f3、med1、arhgef4、sertm1、frmd3、notum、mbp、cldn10、fabp3、anxa6、pm20d2、bhlhe23、lrfn5、hoxd10、echdc1、gstp1、cckbr、mir4500hg、cald1、pde4b、insc、hla-e、nrg1、cyyr1、mir3185、cdh12、anp32e、slc7a4、ltbp4、ccdc28b、dlx4、adcy8、sp8、asphd1、hoxb8、agps、hlf、nfix、kcna2、robo3、ccdc92b、kcnh8、ppp4r4、foxc2、ppp2r2c、capg、znf329、il12rb2、hoxd-as2、sorcs1、hoxd13、samm50、unc13a、cacng8、cadps、hif3a、csmd3、mir137、dlx4、begain、phactr2、znf667、fendrr、srp68、tubb2a、slc16a12、marcks、c1ql1、foxl2、erbb2、layn、pdgfra、hrk、fam20a、loc105377879、wnt3a、myh11、nmnat2、kcnip4、trank1、syt2、znf536、neurog3、lin28a、dmrt3、mcoln2、itga4、pnky、chrnb1、glis3、haglr、pik3cd、dio3os、duox2、crhr1、fam20a、rfx4、plxnc1、p2rx6、tlcd3b、ppp1r1b、tmem200b、glp1r、fjx1、zbed4、pfkfb3、mdfi、znf280b、ciz1、pou4f3、med1、arhgef4、sertm1、frmd3、notum、mbp、cldn10、fabp3、anxa6、pm20d2、bhlhe23、lrfn5、hoxd10、echdc1、gstp1、cckbr、mir4500hg、cald1、pde4b、insc、hla-e、nrg1、cyyr1、mir3185、cdh12、anp32e、slc7a4、ltbp4、ccdc28b、dlx4、adcy8、sp8、asphd1、hoxb8、agps、hlf、nfix、kcna2、robo3、ccdc92b、kcnh8、ppp4r4、foxc2、ppp2r2c、capg、znf329、il12rb2、hoxd-as2、sorcs1、hoxd13、samm50、unc13a、cacng8、cadps、hif3a、csmd3、mir137、dlx4、begain、phactr2、znf667、fendrr、srp68、tubb2a、slc16a12、marcks、c1ql1、foxl2、erbb2、layn、pdgfra、hrk、fam20a、loc105377879、wnt3a、myh11、nmnat2、kcnip4、trank1、syt2、znf536、neurog3、lin28a、dmrt3、mcoln2、itga4、pnky、chrnb1、glis3、haglr、pik3cd、dio3os、duox2、crhr1、fam20a、rfx4、plxnc1、p2rx60。在其他實施方案中,多于一個位點包括選自由以下組成的組的一個或更多個基因:tlcd3b、mir137、robo3、unc13a、lin28a、asphd1、kcnh8、cadps、nmnat2和pou4f3。在其他實施方案中,表征樣品包括確定一種或更多種生物標志物的基因表達。在其他實施方案中,方法包括將患者診斷為罹患癌癥。在其他實施方案中,方法包括將患者預后為對癌癥易感。在其他實施方案中,樣品包括無細胞dna。
3、本文描述了一種方法,所述方法包括:檢測多于一個位點中的至少一個位點中的甲基化;為多于一個位點中的每一個生成多于一個甲基化判定;從甲基化判定獲得一個或更多個度量;以及處理一個或更多個度量以生成患者罹患癌癥的概率。在其他實施方案中,生成患者罹患癌癥的概率包括確定癌癥亞型。在其他實施方案中,癌癥亞型被表征為hr、her2、tnbc中的一種或更多種。在其他實施方案中,方法包括將患者診斷為罹患癌癥。在其他實施方案中,方法包括將患者預后為對癌癥易感。在其他實施方案中,樣品包括無細胞dna。在其他實施方案中,多于一個位點包括選自由以下組成的組的一個或更多個基因:tlcd3b、ppp1r1b、tmem200b、glp1r、fjx1、zbed4、pfkfb3、mdfi、znf280b、ciz1、pou4f3、med1、arhgef4、sertm1、frmd3、notum、mbp、cldn10、fabp3、anxa6、pm20d2、bhlhe23、lrfn5、hoxd10、echdc1、gstp1、cckbr、mir4500hg、cald1、pde4b、insc、hla-e、nrg1、cyyr1、mir3185、cdh12、anp32e、slc7a4、ltbp4、ccdc28b、dlx4、adcy8、sp8、asphd1、hoxb8、agps、hlf、nfix、kcna2、robo3、ccdc92b、kcnh8、ppp4r4、foxc2、ppp2r2c、capg、znf329、il12rb2、hoxd-as2、sorcs1、hoxd13、samm50、unc13a、cacng8、cadps、hif3a、csmd3、mir137、dlx4、begain、phactr2、znf667、fendrr、srp68、tubb2a、slc16a12、marcks、c1ql1、foxl2、erbb2、layn、pdgfra、hrk、fam20a、loc105377879、wnt3a、myh11、nmnat2、kcnip4、trank1、syt2、znf536、neurog3、lin28a、dmrt3、mcoln2、itga4、pnky、chrnb1、glis3、haglr、pik3cd、dio3os、duox2、crhr1、fam20a、rfx4、plxnc1、p2rx6、tlcd3b、ppp1r1b、tmem200b、glp1r、fjx1、zbed4、pfkfb3、mdfi、znf280b、ciz1、pou4f3、med1、arhgef4、sertm1、frmd3、notum、mbp、cldn10、fabp3、anxa6、pm20d2、bhlhe23、lrfn5、hoxd10、echdc1、gstp1、cckbr、mir4500hg、cald1、pde4b、insc、hla-e、nrg1、cyyr1、mir3185、cdh12、anp32e、slc7a4、ltbp4、ccdc28b、dlx4、adcy8、sp8、asphd1、hoxb8、agps、hlf、nfix、kcna2、robo3、ccdc92b、kcnh8、ppp4r4、foxc2、ppp2r2c、capg、znf329、il12rb2、hoxd-as2、sorcs1、hoxd13、samm50、unc13a、cacng8、cadps、hif3a、csmd3、mir137、dlx4、begain、phactr2、znf667、fendrr、srp68、tubb2a、slc16a12、marcks、c1ql1、foxl2、erbb2、layn、pdgfra、hrk、fam20a、loc105377879、wnt3a、myh11、nmnat2、kcnip4、trank1、syt2、znf536、neurog3、lin28a、dmrt3、mcoln2、itga4、pnky、chrnb1、glis3、haglr、pik3cd、dio3os、duox2、crhr1、fam20a、rfx4、plxnc1、p2rx6、tlcd3b、ppp1r1b、tmem200b、glp1r、fjx1、zbed4、pfkfb3、mdfi、znf280b、ciz1、pou4f3、med1、arhgef4、sertm1、frmd3、notum、mbp、cldn10、fabp3、anxa6、pm20d2、bhlhe23、lrfn5、hoxd10、echdc1、gstp1、cckbr、mir4500hg、cald1、pde4b、insc、hla-e、nrg1、cyyr1、mir3185、cdh12、anp32e、slc7a4、ltbp4、ccdc28b、dlx4、adcy8、sp8、asphd1、hoxb8、agps、hlf、nfix、kcna2、robo3、ccdc92b、kcnh8、ppp4r4、foxc2、ppp2r2c、capg、znf329、il12rb2、hoxd-as2、sorcs1、hoxd13、samm50、unc13a、cacng8、cadps、hif3a、csmd3、mir137、dlx4、begain、phactr2、znf667、fendrr、srp68、tubb2a、slc16a12、marcks、c1ql1、foxl2、erbb2、layn、pdgfra、hrk、fam20a、loc105377879、wnt3a、myh11、nmnat2、kcnip4、trank1、syt2、znf536、neurog3、lin28a、dmrt3、mcoln2、itga4、pnky、chrnb1、glis3、haglr、pik3cd、dio3os、duox2、crhr1、fam20a、rfx4、plxnc1、p2rx60。在其他實施方案中,多于一個位點包括選自由以下組成的組的一個或更多個基因:mir137、robo3、unc13a、lin28a、asphd1、kcnh8、cadps、nmnat2和pou4f3。在其他實施方案中,方法包括選擇選自曲妥珠單抗、帕妥珠單抗、ado-恩美曲妥珠單抗、奈拉替尼(neratinib)、拉帕替尼、圖卡替尼(tucatinib)、馬吉妥昔單抗(margetuximab)和德曲妥珠單抗(trastuzumabderuxtecan)的治療。在其他實施方案中,方法包括向患者施用治療,其中治療是曲妥珠單抗、帕妥珠單抗、ado-恩美曲妥珠單抗、奈拉替尼、拉帕替尼、圖卡替尼、馬吉妥昔單抗和/或德曲妥珠單抗。在其他實施方案中,多于一個位點中的至少一個位于選自由以下組成的組的一個或更多個基因中:tlcd3b、ppp1r1b、tmem200b、glp1r、fjx1、zbed4、pfkfb3、mdfi、znf280b、ciz1、pou4f3、med1、arhgef4、sertm1、frmd3、notum、mbp、cldn10、fabp3、anxa6、pm20d2、bhlhe23、lrfn5、hoxd10、echdc1、gstp1、cckbr、mir4500hg、cald1、pde4b、insc、hla-e、nrg1、cyyr1、mir3185、cdh12、anp32e、slc7a4、ltbp4、ccdc28b、dlx4、adcy8、sp8、asphd1、hoxb8、agps、hlf、nfix、kcna2、robo3、ccdc92b、kcnh8、ppp4r4、foxc2、ppp2r2c、capg、znf329、il12rb2、hoxd-as2、sorcs1、hoxd13、samm50、unc13a、cacng8、cadps、hif3a、csmd3、mir137、dlx4、begain、phactr2、znf667、fendrr、srp68、tubb2a、slc16a12、marcks、c1ql1、foxl2、erbb2、layn、pdgfra、hrk、fam20a、loc105377879、wnt3a、myh11、nmnat2、kcnip4、trank1、syt2、znf536、neurog3、lin28a、dmrt3、mcoln2、itga4、pnky、chrnb1、glis3、haglr、pik3cd、dio3os、duox2、crhr1、fam20a、rfx4、plxnc1、p2rx6、tlcd3b、ppp1r1b、tmem200b、glp1r、fjx1、zbed4、pfkfb3、mdfi、znf280b、ciz1、pou4f3、med1、arhgef4、sertm1、frmd3、notum、mbp、cldn10、fabp3、anxa6、pm20d2、bhlhe23、lrfn5、hoxd10、echdc1、gstp1、cckbr、mir4500hg、cald1、pde4b、insc、hla-e、nrg1、cyyr1、mir3185、cdh12、anp32e、slc7a4、ltbp4、ccdc28b、dlx4、adcy8、sp8、asphd1、hoxb8、agps、hlf、nfix、kcna2、robo3、ccdc92b、kcnh8、ppp4r4、foxc2、ppp2r2c、capg、znf329、il12rb2、hoxd-as2、sorcs1、hoxd13、samm50、unc13a、cacng8、cadps、hif3a、csmd3、mir137、dlx4、begain、phactr2、znf667、fendrr、srp68、tubb2a、slc16a12、marcks、c1ql1、foxl2、erbb2、layn、pdgfra、hrk、fam20a、loc105377879、wnt3a、myh11、nmnat2、kcnip4、trank1、syt2、znf536、neurog3、lin28a、dmrt3、mcoln2、itga4、pnky、chrnb1、glis3、haglr、pik3cd、dio3os、duox2、crhr1、fam20a、rfx4、plxnc1、p2rx6、tlcd3b、ppp1r1b、tmem200b、glp1r、fjx1、zbed4、pfkfb3、mdfi、znf280b、ciz1、pou4f3、med1、arhgef4、sertm1、frmd3、notum、mbp、cldn10、fabp3、anxa6、pm20d2、bhlhe23、lrfn5、hoxd10、echdc1、gstp1、cckbr、mir4500hg、cald1、pde4b、insc、hla-e、nrg1、cyyr1、mir3185、cdh12、anp32e、slc7a4、ltbp4、ccdc28b、dlx4、adcy8、sp8、asphd1、hoxb8、agps、hlf、nfix、kcna2、robo3、ccdc92b、kcnh8、ppp4r4、foxc2、ppp2r2c、capg、znf329、il12rb2、hoxd-as2、sorcs1、hoxd13、samm50、unc13a、cacng8、cadps、hif3a、csmd3、mir137、dlx4、begain、phactr2、znf667、fendrr、srp68、tubb2a、slc16a12、marcks、c1ql1、foxl2、erbb2、layn、pdgfra、hrk、fam20a、loc105377879、wnt3a、myh11、nmnat2、kcnip4、trank1、syt2、znf536、neurog3、lin28a、dmrt3、mcoln2、itga4、pnky、chrnb1、glis3、haglr、pik3cd、dio3os、duox2、crhr1、fam20a、rfx4、plxnc1、p2rx60。在其他實施方案中,多于一個位點中的至少一個位于選自由以下組成的組的一個或更多個基因中:mir137、robo3、unc13a、lin28a、asphd1、kcnh8、cadps、nmnat2和pou4f3。在其他實施方案中,方法包括將患者診斷為罹患癌癥。在其他實施方案中,方法包括將患者預后為對癌癥易感。在其他實施方案中,樣品包括無細胞dna。
4、本文描述了一種確定個體中癌癥的診斷、預后、易感性的方法,包括:確定個體中相對于基因的正常基線標準存在或不存在更低或更高水平的表達。在各種實施方案中,基因包括re1沉默轉錄因子(rest)途徑靶。在各種實施方案中,基因包括以下中的一種或更多種:mir137、robo3、unc13a、lin28a、asphd1、kcnh8、cadps、nmnat2和/或pou4f3。在其他實施方案中,方法包括癌癥亞型分型,諸如乳腺癌亞型her2、hr和tnbc。在其他實施方案中,方法包括為受試者選擇治療。在其他實施方案中,方法包括為受試者施用治療。
5、例如,公開了一種為受試者選擇療法治療的方法,包括:a)從受試者獲得生物樣品;b)確定生物樣品中mir137、robo3、unc13a、lin28a、asphd1、kcnh8、cadps、nmnat2和/或pou4f3的表達水平;c)將表達水平與對照進行比較;和d)基于比較選擇療法治療。在一些實施方案中,對照來自一個或更多個沒有癌癥的受試者。在一些實施方案中,從cfdna的分析推斷表達水平。在一些實施方案中,mir137、robo3、unc13a、lin28a、asphd1、kcnh8、cadps、nmnat2和/或pou4f3的異常表達指示受試者對療法治療具有抗性,并因此選擇替代療法治療。在一些實施方案中,方法涉及施用替代療法。在一些實施方案中,方法涉及確定mir137、robo3、unc13a、lin28a、asphd1、kcnh8、cadps、nmnat2和/或pou4f3的表達。在其他實施方案中,方法包括癌癥亞型分型,諸如乳腺癌亞型her2、hr和tnbc。
6、還公開了一種為受試者選擇療法治療的方法,包括:a)從受試者獲得生物樣品;b)確定生物樣品中re1沉默轉錄因子(rest)途徑的一種或更多種組分的表達水平;c)將表達水平與對照進行比較;和d)基于比較選擇療法治療。在一些實施方案中,對照來自一個或更多個沒有癌癥的受試者。在一些實施方案中,從cfdna的分析推斷表達水平。在一些實施方案中,re1沉默轉錄因子(rest)途徑的一種或更多種組分的異常表達指示受試者對療法治療具有抗性,并因此選擇替代療法治療。在一些實施方案中,方法涉及施用替代療法。
7、還公開了一種鑒定受試者是否對療法治療具有抗性的方法,其中方法包括:a)從受試者獲得生物樣品;b)確定生物樣品中re1沉默轉錄因子(rest)途徑的一種或更多種組分的表達水平;c)將表達水平與對照進行比較;和d)基于比較將受試者分類為對療法治療具有抗性。在一些實施方案中,對照來自一個或更多個沒有癌癥的受試者。在一些實施方案中,從cfdna的分析推斷表達水平。在一些實施方案中,re1沉默轉錄因子(rest)途徑的一種或更多種組分的異常表達指示受試者對療法治療具有抗性。在一些實施方案中,方法涉及施用替代療法。
8、還公開了re1沉默轉錄因子(rest)途徑的一種或更多種組分作為癌癥的生物標志物的用途。在一些實施方案中,生物標志物是針對癌癥的療法治療的抗性。在其他實施方案中,方法包括癌癥亞型分型,諸如乳腺癌亞型her2、hr和tnbc。
9、在一些實施方案中,本文公開的系統和方法的結果被用作輸入以生成報告。報告可以是紙質或電子格式。例如,通過本文公開的方法和系統確定的遺傳結果,諸如在樣品中檢測到核酸變體的存在,可以直接顯示在這樣的報告中。在一些實施方案中,在這樣的報告中僅顯示疾病諸如癌癥的存在或不存在。
10、本文公開的方法的各個步驟,或通過本文公開的系統實施的步驟,可以在相同或不同的時間、在相同或不同的地理位置(例如,國家)和/或由相同或不同的人來實施。在一些實施方案中,將報告通信給受試者,例如患有癌癥并且已經通過本文描述的方法和系統經歷了測試的受試者,或者通信給保健專業人員,諸如治療患有癌癥的受試者的醫生。