杜克大學沈西凌團隊利用大數據比較分析方法闡明癌癥微生物組圖譜


盡管微生物群組研究不斷擴展 , 但由于難以獲得臨床活檢組織 , 研究內部器官的微生物組成及其與疾病的關系仍然具有挑戰性 。
《癌癥基因組圖集》(TCGA)中的測序數據包含人類各器官腫瘤和微生物基因組的測序片段信息 。 最近 , 對TCGA測序數據的分析已被用來證明血液微生物DNA具有診斷某些癌癥的潛力 。 由于腫瘤微生物組對腫瘤類型具有高度特異性 , 因此利用TCGA測序數據中對微生物DNA和RNA的分析,在診斷應用以及探索分子和臨床相關的宿主-微生物相互作用方面具有巨大潛力 。
然而 , 這些數據集的分析受到污染微生物遺傳信息的困擾 。 污染主要來自于樣品的加工,處理和測序等環節 , 在低生物量組織樣本中污染微生物遺傳信息相對更加豐富 , 以至于不能真實的揭示癌癥是如何影響微生物組的 。
北京時間2020年12月31日凌晨0時 , 美國杜克大學生物醫學工程系沈西凌教授團隊在Cell Host & Microbe雜志發表論文 , 題為“The cancer microbiome atlas: a pan-cancer comparative analysis to distinguish tissue-resident microbiota from equiprevalent contaminants” 。

杜克大學沈西凌團隊利用大數據比較分析方法闡明癌癥微生物組圖譜
本文插圖



在沈西凌教授的指導和帶領下, 實驗室的研究生Anders Dohlman設計了一個大數據分析模型 , 用于分析《癌癥基因組圖集》(TCGA)中跨樣本類型的微生物種表達和分布情況 , 揭示出在不同器官樣本中都存在的微生物種主要是污染微生物 。
研究中還發現不同的測序中心(哈佛大學, Baylor實驗室, Broad研究所) 都有其獨特的污染微生物信息 。 去除此類微生物種可減輕批次效應 , 并分離出組織駐留的微生物組 。 這種分析的結果已經過匹配的TCGA樣品進行了驗證 。

【杜克大學沈西凌團隊利用大數據比較分析方法闡明癌癥微生物組圖譜】杜克大學沈西凌團隊利用大數據比較分析方法闡明癌癥微生物組圖譜
本文插圖



基于以上的研究 , 沈西凌教授團隊發表了全新的癌癥微生物組圖譜(TCMA) 。 新的TCMA數據庫具有以下優點:
1. 將TCGA微生物組數據分離為組織固有的和污染微生物部分 。
2. 通過基因 , 序列和核苷酸分辨率區分“混合證據”物種 , 例如大腸桿菌 。
3. 經過去污染微生物凈化算法, 該數據庫包含針對來自1,772名患者的3,689個胃腸道癌樣品的去污微生物圖譜 。
杜克大學沈西凌團隊利用大數據比較分析方法闡明癌癥微生物組圖譜
本文插圖


TCMA構成了在與癌癥相關的宿主-微生物相互作用的未來研究中進行驗證和產生假設的強大資源 。 雖然現有的經過凈化處理的微生物成分的集合只揭示口咽、食道、胃腸道和結直腸組織的腫瘤相關微生物組的信息 , 但是類似的去污分析可用于擴大微生物分析在各種器官和相關疾病中 , 更增加了公共NGS數據的可用性 。
這將有助于指導微生物組在人類健康和疾病中作用的進一步研究 。
相關論文信息:
https://doi.org/10.1016/j.chom.2020.12.001
編輯 | 余荷
排版 | 王大雪
欲知更多內容 , 敬請圍觀小柯機器人頻道:
http://paper.sciencenet.cn/AInews/
“小柯”是一個科學新聞寫作機器人 , 由中國科學報社聯合北大團隊研發而成 。 新聞由“小柯”獨立完成 , 經領域專家和科學編輯雙重人工審校和信息補充 。 “小柯生命”是“小柯”系列學術公眾號之一 , 主要介紹生命科學領域頂級學術期刊最新論文信息 。

    推薦閱讀