利用Cox回歸尋找治療靶點的5+分思路
\大家好,今天和大家分享的是2020年8月發表在journal of cellular physiology(IF=5.546)上的一篇文章:“Prognostic scoring system for osteosarcoma using network-regularized high-dimensional Cox-regression analysis and potential therapeutic targets”。基于mRNA的表達數據和臨床數據,作者開發了一種新的骨肉瘤患者預后評分系統。使用網絡正則化高維Cox回歸(network‐regularized high‐dimensional Cox regression,NET)分析mRNA的表達數據,根據回歸系數和mRNA表達值確定預后風險評分,利用The Connectivity Map(CMap)預測骨肉瘤的治療靶點。
Prognostic scoring system for osteosarcoma using network‐regularized high‐dimensional Cox‐regression analysis and potential therapeutic targets
基于網絡正則化高維Cox回歸分析的骨肉瘤預后評分系統及潛在治療靶點
一、研究背景
骨肉瘤是一種可以產生惡性骨樣物質且具有高死亡率的腫瘤,它在青少年中最常見。在過去的二十年中,骨肉瘤患者的生存率沒有明顯改善。隨著個性化和精確化醫學的發展,對患者的基因進行研究,以確定新的治療靶點是目前的研究趨勢。為了識別基因組數據中預后相關的變量,統計學家開發了許多新的分組變量的選擇方法,如網絡正則化高維Cox回歸(network‐regularized high‐dimensional Cox regression, NET)分析。
二、分析流程

三、結果解讀
1.預后評分系統
作者從GEO數據庫下載了包含53例高級別骨肉瘤患者的mRNA表達數據和臨床信息的數據集(GSE21257),其中34例來自5年內發生轉移的患者,其余19例來自未發生轉移的患者。患者特征總結在表1中。

表1.骨肉瘤患者具體信息和風險分組
作者使用Coxnet包對骨髓瘤患者基因表達數據進行網絡正則化高維cox回歸分析( network‐regularized high‐dimensional Cox regression, NET),評估OS和mRNA表達值之間的關系。
為了獲得更有意義的結果,需要一些額外的參數。作者從六個大型數據庫(Biocarta, HumanCyc, KEGG, NCI, Panther, Reactome)獲取數據,使用graphite包構建了基因-基因通路矩陣作為正則化參數Ω。使用留一法進行NET分析來進行交叉驗證,根據最小交叉驗證誤差確定混合參數α,該參數決定L1范數和L2范數的平衡。當α的值為1時,19個基因被選擇;當α值為0.1時,148個基因被選擇,圖1和表2描述了根據α值選擇的基因數量和預后意義。圖1中橫坐標為α值,縱坐標C-index是評價模型預測能力的一個指標(C-index大于0.75表示模型對OS具有優秀的預測能力),結果顯示α的值為1和0.1時的對OS都有非常好的預測能力,考慮到其效率,最佳α值為1。預后風險評分為基因的表達水平與相應的回歸系數的乘積之和。

表2.α值為1時的19個被選基因

圖1.不同α值對應的變量數量和C-index
2.風險分層系統
基于預測評分系統,作者構建了風險分層系統對患者的預后進行預測。通過五折交叉驗證根據c指數的大小確定風險分界值,所有患者的風險評分介于9.740和6.618之間,最佳的風險分界值為8.518559,樣本被分為高風險和低風險兩組(高風險:20,低風險:33;表1),兩組之間包括年齡、性別和組織學等級在內的臨床信息沒有顯著差異(表1)。
在應用最佳α值1時,高風險組和低風險組的OS具有顯著差異(p < 0.0001,圖2)。并且,預后評分系統系統獲得了較高的c指數(0.967),而年齡和性別等其他變量則獲得了較低的c指數,這證明風險分層系統在預測高級別骨肉瘤預后方面非常準確。

圖2.高風險組和低風險組生存分析(OS)
如圖3c所示,進行時間依賴性ROC曲線分析,AUC值為0.953~1.000,表示風險分層系統OS對具有優秀的預測能力。此外,作者還根據組織學分級將樣本分為兩個亞組(圖4d為組織學1、2級的亞組,圖4e為組織學3、4級的亞組),進行了生存分析,結果表明,在不同組織學分級的亞組中,高風險組和低風險組的OS同樣具有顯著差異。

圖3.風險分層系統預測不同生存時間的ROC曲線

圖4.按照組織學分級的亞組分析
經單因素Cox回歸分析發現,GSE21257中的臨床變量(年齡、性別和年級)與預后無顯著相關性(表3),多因素Cox回歸分析也得到了相似的結果。

表3.Cox回歸分析
3.骨肉瘤治療靶點的預測
作者使用The Connectivity Map(CMap)預測骨肉瘤的治療藥物和治療靶點。CMap是由Broad研究所開發的一個基于干預基因表達的基因表達譜數據庫,主要用于揭示小分子化合物,基因和疾病狀態的功能聯系。
在預后評分系統中,風險得分高表示預后較差,而風險得分低表示預后較好。按照此標準,表示良好預后的基因信號應為:具有正回歸系數的基因下調,具有負回歸系數的基因上調。將α值為0.1時選擇的148個基因分為正和負回歸系數組,將正回歸系數組作為下調基因,負回歸系數組作為上調基因輸入到CMap程序。結果顯示,BACE2、IN2、RBBP6、 SNX2等基因敲除或下調,linifanib和APEX抑制劑等藥物的使用,可以改善骨肉瘤患者的預后;而SCAP、PREEN、KBTBD、 ZNF114基因敲除或下調,糖原合成酶抑制劑SB‐216763的使用,可能會導致預后變差(圖4)。

圖5.Connectivity Map分析結果
小結
基于從GEO數據庫中獲取的mRNA的表達數據和臨床數據,作者開發一種新的骨肉瘤患者預后評分系統。對mRNA的表達數據進行NET分析確定回歸系數,正則化系數Ω和混合系數α使分析結果更有意義。風險評分為基因的表達水平與相應的回歸系數的乘積,通過五折交叉驗證和c指數確定風險分界值,時間依賴性ROC曲線分析和亞組分析用于檢驗該系統的預測能力。使用The Connectivity Map(CMap)預測骨肉瘤的治療藥物和治療靶點。
請輸入評論內容...
請輸入評論/評論長度6~500個字
圖片新聞


分享









