發(fā)布時間: 2024-08-28 09:29:33
1.數(shù)據(jù)庫概述
1.1背景信息
NCDB數(shù)據(jù)庫(http://www.facs.org/quality-programs /cancer/ncdb.)是由美國癌癥協(xié)會和美國外科學院癌癥委員會聯(lián)合創(chuàng)立的,旨在收集和分析癌癥治療和結(jié)果數(shù)據(jù)。該數(shù)據(jù)庫自1989年起持續(xù)發(fā)展,收集美國1500多家醫(yī)院的數(shù)據(jù),收錄了超過70%的新診斷癌癥病例,已經(jīng)成為一個全面的癌癥患者數(shù)據(jù)源,為美國境內(nèi)數(shù)百萬癌癥病例的研究提供了重要支持。
1.2數(shù)據(jù)庫用途
NCDB主要用于分析和改善癌癥的診斷、治療和預(yù)后。通過對健康、社會經(jīng)濟等領(lǐng)域的數(shù)據(jù)收集與分析,NCDB能夠幫助醫(yī)療機構(gòu)和研究人員識別癌癥治療的最佳實踐,發(fā)現(xiàn)治療中的差異,并制定改善癌癥治療效果的策略。
癌癥治療效果分析:研究不同治療方法對各種癌癥類型的效果,包括手術(shù)、化療、放療的組合療法。
生存率研究:分析不同群體(如不同種族、性別、社會經(jīng)濟狀態(tài))的癌癥生存率,識別健康差異。
健康政策評估:評估健康政策或治療指南的實施效果,幫助制定新的治療策略。
醫(yī)療質(zhì)量評估:研究不同醫(yī)院或地區(qū)的治療質(zhì)量差異,推動醫(yī)療服務(wù)改進。
1.3數(shù)據(jù)采集方式
NCDB的數(shù)據(jù)主要通過參與項目的醫(yī)療機構(gòu)收集,這些機構(gòu)包括全美各地經(jīng)過認證的癌癥治療中心。數(shù)據(jù)采集方式包括使用問卷調(diào)查、病例報告系統(tǒng)、以及醫(yī)院病歷系統(tǒng)的數(shù)據(jù)記錄。
NCDB的數(shù)據(jù)質(zhì)量控制非常嚴格。參與的醫(yī)療機構(gòu)必須遵守數(shù)據(jù)提交的標準,并定期接受審計和評估,以確保數(shù)據(jù)的準確性和完整性。每個數(shù)據(jù)提交周期結(jié)束后,數(shù)據(jù)會經(jīng)過多重檢查和驗證,以確保其符合研究和分析的需求。NCDB的數(shù)據(jù)覆蓋了自1985年起的所有病例,且每年都會更新。這使得研究人員能夠進行時間趨勢分析,觀察不同時間點的治療效果和生存率變化,識別出長期趨勢和模式。
1.4樣本特征
NCDB的數(shù)據(jù)樣本涵蓋了各種癌癥患者的人口特征,如年齡、性別、地理位置、種族、社會經(jīng)濟狀態(tài)等。每年的數(shù)據(jù)包含超過70%的新診斷的癌癥病例,因此它是一個非常具有代表性的大數(shù)據(jù)集。
NCDB的患者群體主要包括那些在美國癌癥委員會(CoC)認可的癌癥計劃中接受了癌癥診斷或治療的個體。然而,那些僅與醫(yī)生在CoC機構(gòu)中互動但沒有實際接受護理的患者并不會被納入NCDB的報告范圍。該數(shù)據(jù)庫涵蓋的患者通常是被診斷為大多數(shù)原位或浸潤性原發(fā)腫瘤的患者,以及患有大多數(shù)良性腦部病變的個體。然而,由于某些皮膚癌和子宮頸原位癌的高發(fā)病率和較高治愈率,這些病例的治療信息可以不向NCDB報告。此外,NCDB在收集數(shù)據(jù)時不會包括個人識別信息,如姓名和社會安全號碼,這種做法可能會對數(shù)據(jù)庫中的患者群體產(chǎn)生一定影響。對于被診斷出患有多種惡性腫瘤的患者(無論這些診斷是否在同一時間或不同時間發(fā)生),每一個診斷都會被記錄為獨立的NCDB條目,且這些條目之間不會進行關(guān)聯(lián)。
2.使用方式
2.1訪問和獲取
用戶可以通過注冊和審核后訪問NCDB的數(shù)據(jù)。這通常包括學術(shù)研究人員、公共衛(wèi)生專家和醫(yī)療機構(gòu)。訪問權(quán)限可能需要提交研究目的和計劃,以確保數(shù)據(jù)的使用符合倫理規(guī)范。
訪問NCDB的數(shù)據(jù)通常需要通過申請程序,并需要滿足一定的資格條件。學術(shù)研究人員、醫(yī)療機構(gòu)和政府機構(gòu)通常可以申請訪問權(quán)限,但需提交詳細的研究計劃和倫理審查結(jié)果。數(shù)據(jù)訪問可能有不同級別,從匯總數(shù)據(jù)到個體級別數(shù)據(jù),具體權(quán)限視研究目的和數(shù)據(jù)敏感性而定。
2.2數(shù)據(jù)使用指南
NCDB為用戶提供詳細的操作指南,說明如何下載數(shù)據(jù)、使用統(tǒng)計工具進行分析、以及如何解釋分析結(jié)果。用戶通常需要具備一定的數(shù)據(jù)分析技能,才能充分利用這些數(shù)據(jù)進行研究。
3.數(shù)據(jù)類型
NCDB數(shù)據(jù)庫包括大量的癌癥相關(guān)數(shù)據(jù)類型,主要包括健康指標、腫瘤特征、治療方案、治療結(jié)果、社會經(jīng)濟狀況等。這些數(shù)據(jù)有助于研究癌癥的發(fā)病率、治療效果、以及不同社會群體的健康差異。
NCDB的數(shù)據(jù)是高度結(jié)構(gòu)化的,分為多個數(shù)據(jù)集和變量。每個數(shù)據(jù)集通常與癌癥的某一特定方面相關(guān),如腫瘤的類型、分期、治療方法、患者生存率等。數(shù)據(jù)庫還包括有關(guān)醫(yī)院信息、治療設(shè)備、以及患者的長期隨訪數(shù)據(jù)。每個記錄都包含患者的詳細人口統(tǒng)計信息、腫瘤特征(如腫瘤的大小、分級、位置)、治療方法(如手術(shù)、放療、化療)和治療結(jié)果(如生存時間、復發(fā)情況)。
盡管NCDB數(shù)據(jù)非常豐富,但它也有一定的局限性。例如,它主要包括經(jīng)過認證的癌癥治療中心的數(shù)據(jù),而不一定代表所有癌癥患者。數(shù)據(jù)中的社會經(jīng)濟變量有限,可能無法全面反映患者的社會背景。此外,盡管NCDB包含了大量的病例信息,但個別患者的詳細治療歷史和病程進展可能未完全記錄,尤其是在多次轉(zhuǎn)診或跨機構(gòu)治療的情況下。
4.研究案例
2024年8月,美國明尼蘇達州羅切斯特市梅奧診所神經(jīng)外科學者在《J Neurooncol》(二區(qū)Top,IF=3.2)發(fā)表題為:“The impact of socioeconomic determinants on the access to care and survival in patients with spinal chordomas- a national cancer database analysis”的研究論文。文章基于NCDB數(shù)據(jù)庫,根據(jù)種族和社會經(jīng)濟決定因素,構(gòu)建了 Kaplan-Meier 曲線以比較不同群體之間的生存概率。結(jié)果表明,在擁有其他政府保險的患者、高收入四分位數(shù)患者、大都市地區(qū)患者和學術(shù)/研究中心患者中,生存概率更高。在未投保的患者、農(nóng)村地區(qū)和社區(qū)癌癥計劃中,生存概率較低。
2024年7月美國紐約州西奈山伊坎醫(yī)學院人口健康科學與政策系醫(yī)療保健提供科學研究所學者在《Otolaryngol Head Neck Surg》(一區(qū)Top,IF=2.6)發(fā)表題為:“Machine Learning Methods in Classification of Prolonged Radiation Therapy in Oropharyngeal Cancer: National Cancer Database”的研究論文。文章基于NCDB數(shù)據(jù)庫,研究機器學習 (ML) 算法在對口咽鱗狀細胞癌 (OPSCC) 患者延長放射治療持續(xù)時間(RTD)風險進行分層的準確性。將 8 種不同的 ML 算法與使用各種性能指標的傳統(tǒng)邏輯回歸進行了比較。結(jié)果表明,RF 優(yōu)于傳統(tǒng)的 logistic 回歸。應(yīng)用此類算法可能有助于識別高危患者,并實現(xiàn)早期干預(yù)以提高生存率。
2024年5月,內(nèi)布拉斯加大學醫(yī)學中心學者在《Cancers (Basel)》(一區(qū)Top,IF=4.5)發(fā)表題為:“Overall Survival and Prognostic Factors in Metastatic Triple-Negative Breast Cancer: A National Cancer Database Analysis”的研究論文。文章基于NCDB數(shù)據(jù)庫,采用Kaplan-Meier曲線估計轉(zhuǎn)移性三陰性乳腺癌總生存期 (OS) 結(jié)局,在多變量分析中采用向后消除的Cox比例風險模型來識別影響OS的因素,通過分析,確定了轉(zhuǎn)移性三陰性乳腺癌的預(yù)后因素。這些發(fā)現(xiàn)將有助于在診斷時個體化預(yù)后,優(yōu)化治療策略,并在未來的臨床試驗中促進患者分層。
上一篇:hdWGCNA,為單細胞與機器學習搭起了“友誼”的橋梁