發(fā)布時(shí)間: 2024-10-14 14:08:02
一、TCGA數(shù)據(jù)庫(kù)概述
(一)背景信息
TCGA數(shù)據(jù)庫(kù)即腫瘤基因組圖譜計(jì)劃,由美國(guó)國(guó)家癌癥研究所(NCI)和美國(guó)國(guó)家人類基因組研究所(NHGRI)于2006年聯(lián)合啟動(dòng)的項(xiàng)目,收錄了各種人類癌癥(包括亞型在內(nèi)的腫瘤)的臨床數(shù)據(jù),基因組變異,mRNA表達(dá),miRNA表達(dá),甲基化等數(shù)據(jù),是癌癥研究者很重要的數(shù)據(jù)來(lái)源。TCGA數(shù)據(jù)庫(kù)收錄了33種癌癥,超過20000個(gè)樣本的數(shù)據(jù)信息。這些數(shù)據(jù)包括轉(zhuǎn)錄組(mRNA,lncRNA和miRNA)、基因組(突變、CNV)、表觀組(DNA甲基化)、蛋白組及臨床信息數(shù)據(jù)。它的優(yōu)點(diǎn)是數(shù)據(jù)質(zhì)量高,組學(xué)數(shù)據(jù)豐富,樣本量大以及臨床信息全面。相比于GEO數(shù)據(jù)庫(kù),TCGA數(shù)據(jù)庫(kù)是專門收錄癌癥患者相關(guān)信息的。TCGA包括了癌癥病人各種各樣的測(cè)序數(shù)據(jù),包括RNA 測(cè)序,MicroRNA 測(cè)序,DNA 測(cè)序,基于 SNP 的平臺(tái),基于芯片的 DNA 甲基化測(cè)序,反相芯片。
(二)TCGA數(shù)據(jù)庫(kù)用途
TCGA數(shù)據(jù)庫(kù)集成了多種腫瘤類型的基因數(shù)據(jù)、臨床數(shù)據(jù)和圖片數(shù)據(jù)。TCGA數(shù)據(jù)對(duì)于研究腫瘤基因組變異、分子特征和臨床表現(xiàn)具有重要意義,可以改善臨床診斷和治療腫瘤的效果。
(三)TCGA數(shù)據(jù)采集方式
TCGA數(shù)據(jù)庫(kù)通過收集整理多種癌癥相關(guān)的各種組學(xué)數(shù)據(jù),提供了一個(gè)大型的癌癥研究參考數(shù)據(jù)庫(kù)。
(四)TCGA數(shù)據(jù)庫(kù)樣本特征
TCGA數(shù)據(jù)庫(kù)收錄了33種癌癥類型,超過30000例腫瘤樣本,超過20000個(gè)基因的表達(dá)信息。TCGA存放的主要是轉(zhuǎn)錄組數(shù)據(jù)。實(shí)際上,TCGA還存放了基因組、表觀組和蛋白組的數(shù)據(jù),而且這些數(shù)據(jù)與轉(zhuǎn)錄組數(shù)據(jù)是重疊的,臨床信息也非常全面。
二、TCGA數(shù)據(jù)庫(kù)使用指南
(一)訪問和獲取
(二)數(shù)據(jù)下載
TCGA數(shù)據(jù)庫(kù)免費(fèi)使用,無(wú)需注冊(cè)即可下載使用
1、進(jìn)入官網(wǎng)點(diǎn)擊進(jìn)入“Repository”。
2、進(jìn)入“Repository”后,先看右上角“Chart”,處是否為0,不為0的話要先清除之前下載的數(shù)據(jù),清除的方法是選擇“Chart”,然后點(diǎn)擊右下角的“Remove From Cart”進(jìn)行刪除。
3、進(jìn)入“Repository”后,在右邊篩選需要下載的數(shù)據(jù)和格式,右邊篩選包括,數(shù)據(jù)類別,數(shù)據(jù)類型,實(shí)驗(yàn)策略,工作流類型,數(shù)據(jù)格式。以臨床、病理報(bào)告為例。
4、選擇好數(shù)據(jù)加入到“Chart”。
5、打開右上角的購(gòu)物車標(biāo)圖案,里面包含了要下載的文件,在下載相關(guān)數(shù)據(jù)中點(diǎn)擊想要下載的數(shù)據(jù)即可免費(fèi)下載。
6、下載之后的界面如下:
(三)TCGA數(shù)據(jù)使用
數(shù)據(jù)下載完成之后,可以對(duì)數(shù)據(jù)格式進(jìn)行轉(zhuǎn)換,或者直接用R軟件讀取文件進(jìn)行后續(xù)分析。TCGA數(shù)據(jù)庫(kù)目前也存在一些局限。首先,TCGA是針對(duì)腫瘤研究而開啟的研究計(jì)劃,里面不含有非腫瘤疾病的數(shù)據(jù),如果開展非腫瘤疾病的數(shù)據(jù)挖掘,要用其他數(shù)據(jù)庫(kù),如GEO。其次,TCGA的樣本以腫瘤組織為主,正常或癌旁對(duì)照組織的樣本數(shù)過少,往往需要結(jié)合GTEx數(shù)據(jù)庫(kù)中的正常樣本進(jìn)行校正。第三,目前單細(xì)胞測(cè)序已經(jīng)普及,而TCGA的數(shù)據(jù)仍然局限于二代測(cè)序,需要結(jié)合其他數(shù)據(jù)庫(kù)來(lái)完成深度分析。
三、TCGA數(shù)據(jù)類型
TCGA存放的主要是轉(zhuǎn)錄組數(shù)據(jù)。同時(shí)涵蓋了基因組、表觀遺傳、蛋白組等各個(gè)組學(xué)數(shù)據(jù),提供了一個(gè)全方位、多維度的數(shù)據(jù)。
四、TCGA數(shù)據(jù)庫(kù)研究案例
透明細(xì)胞腎細(xì)胞癌頻繁基因突變及其與臨床病理特征的相關(guān)性: 基于中國(guó)人群和 TCGA 數(shù)據(jù)庫(kù)的初步研究
2024年8月,北京致癌作用與轉(zhuǎn)化研究重點(diǎn)實(shí)驗(yàn)室泌尿外科學(xué)者在《BMC urology》(醫(yī)學(xué)-3區(qū))發(fā)表了題為“Frequent gene mutations and the correlations with clinicopathological features in clear cell renal cell carcinoma: preliminary study based on Chinese population and TCGA database”的研究論文。本文章基于癌癥基因組圖譜 (TCGA) 在線數(shù)據(jù)庫(kù),使用 TCGA-KIRC 隊(duì)列來(lái)驗(yàn)證中心突變基因表達(dá)與 ccRCC 預(yù)后之間的關(guān)系。應(yīng)用單因素和多因素 Cox 回歸分析來(lái)評(píng)估該樞紐基因的預(yù)后意義。結(jié)果表明:VHL 基因是 ccRCC 中最常見的突變基因。在我們的隊(duì)列中,BAP1 和 PTEN 與較高的腫瘤分級(jí)顯著相關(guān),DNM2 與較低的腫瘤等級(jí)顯著相關(guān)。BAP1 或 PTEN、BAP1 或 SETD2、BAP1 或 TP53、BAP1 或 MTOR、BAP1 或 FAT1 和 BAP1 或 AR 突變型 (MT) 組與我們的隊(duì)列中較高的腫瘤分級(jí)顯著相關(guān)。此外,我們發(fā)現(xiàn) HMCN1 是一個(gè)樞紐突變基因,與較差的預(yù)后密切相關(guān),并可能增強(qiáng)抗腫瘤免疫反應(yīng)。
TCGA 數(shù)據(jù)庫(kù)中 LGALS2 表達(dá)的調(diào)查揭示了其在乳腺癌免疫治療和耐藥性中的臨床相關(guān)性
2023年10月,吉林大學(xué)動(dòng)物學(xué)院實(shí)驗(yàn)動(dòng)物系學(xué)者在《Scientific reports》(綜合性期刊-2區(qū))發(fā)表了題為“Investigation of LGALS2 expression in the TCGA database reveals its clinical relevance in breast cancer immunotherapy and drug resistance”的研究論文。本研究基于 TCGA 和 METABRI 等公共數(shù)據(jù)庫(kù),通過構(gòu)建 Kaplan-Meier 生存曲線、Spearman 相關(guān)性分析、嶺回歸模型,分析了 LGALS2 的表達(dá)水平以及 BRCA 患者的臨床病理特征、診斷和預(yù)后、免疫浸潤(rùn)等。研究表明,LGALS2 可作為乳腺癌的診斷和預(yù)后標(biāo)志物,它調(diào)節(jié) T 細(xì)胞參與腫瘤免疫治療的生物活性,減少患者臨床耐藥的發(fā)生。
GRN 是一種預(yù)后生物標(biāo)志物,與神經(jīng)膠質(zhì)瘤的免疫浸潤(rùn)相關(guān):一項(xiàng)基于 TCGA 數(shù)據(jù)的研究
2023年4月,中南大學(xué)湘雅醫(yī)院學(xué)者在《Frontiers in oncology》(醫(yī)學(xué)-3區(qū))發(fā)表了題目為“GRN is a prognostic biomarker and correlated with immune infiltration in glioma: A study based on TCGA data”的研究論文,本文基于TCGA 數(shù)據(jù)庫(kù),采用 Logistic 回歸研究臨床數(shù)據(jù)與 GRN 表達(dá)之間的關(guān)聯(lián)。還使用多變量 Cox 分析評(píng)估了 GRN 表達(dá)和其他臨床病理變量 (性別和年齡) 對(duì)生存率的影響。使用了相關(guān)性熱圖來(lái)識(shí)別 22 種不同類型的免疫細(xì)胞相關(guān)性。研究結(jié)果表明:GRN 表達(dá)增加與腫瘤分級(jí)有顯著關(guān)系,GRN 是 GBM 狀態(tài)的潛在指標(biāo)。
上一篇:GBD數(shù)據(jù)庫(kù)使用指南及案例
下一篇:孕產(chǎn)婦壓力、吸煙和不良分娩結(jié)局之間的關(guān)聯(lián)