來源:百家號
醫(yī)學(xué)大數(shù)據(jù)的應(yīng)用主要有兩個,一個是發(fā)現(xiàn)新知識、認(rèn)識新規(guī)律。以往受數(shù)據(jù)采集與分析能力的限制,醫(yī)學(xué)主要依靠抽樣研究來發(fā)現(xiàn)新知識、認(rèn)識新規(guī)律,但不同樣本間的差距經(jīng)常導(dǎo)致結(jié)論不致甚至截然相反。隨著大數(shù)據(jù)技術(shù)的發(fā)展,醫(yī)學(xué)研究由抽樣的小樣本研究進(jìn)入到超大樣本、甚至全樣本研究時(shí)代,從嚴(yán)格篩選患者入組進(jìn)行研究到全面觀察各種影響因素的真實(shí)世界研究時(shí)代。例如,美國2015年就啟動了觀察阿司匹林效果與劑量的大規(guī)模觀察性醫(yī)學(xué)研究,多達(dá)30萬人參加。
基于大數(shù)據(jù)的觀察性研究得出的結(jié)論更具現(xiàn)實(shí)指導(dǎo)意義,甚至?xí)品耙恍┙⒃谛颖緮?shù)據(jù)基礎(chǔ)上的“科學(xué)”結(jié)論。斯坦伯格(Steinberg)等人從3萬余人兩年的保險(xiǎn)記錄、化驗(yàn)記錄、用藥記錄、就醫(yī)記錄中挖掘出新的代謝綜合征預(yù)測模型,用80%的人作為訓(xùn)練集,20%的人作為測試集,在貝葉斯框架下依據(jù)**熵原理,對數(shù)據(jù)中未知的參數(shù)進(jìn)行分布邊緣化來計(jì)算模型的結(jié)構(gòu)概率,綜合考慮模型的復(fù)雜性和與數(shù)據(jù)的匹配性建立起新的預(yù)測模型,從4000余個參數(shù)中篩選出腰圍、用藥依從性等與代謝綜合征密切相關(guān)的因素的。
醫(yī)學(xué)大數(shù)據(jù)的另一個應(yīng)用是促進(jìn)精準(zhǔn)適度醫(yī)療,提升醫(yī)療價(jià)值。精準(zhǔn)醫(yī)療,并不是狹隘地特指基于基因組學(xué)的醫(yī)療模式。人體是個復(fù)雜的系統(tǒng),疾病是在生活方式、心理、社會-環(huán)境等因素綜合作用下的結(jié)果,基因在疾病發(fā)生發(fā)展中只起部分作用。
需要長期采集個體與群體的健康數(shù)據(jù),綜合分析,才能把握各種影響因素與健康的關(guān)系。在把握群體規(guī)律的同時(shí),還要把握個體的規(guī)律,才能實(shí)現(xiàn)精準(zhǔn)的預(yù)防與治療。以基因檢測預(yù)測疾病為例,被稱為“乳腺癌1號基因”的BRCA1,突變后使人罹患乳腺癌的風(fēng)險(xiǎn)是65%(以70歲計(jì);置信區(qū)間44%~78%),而不是100%,沒有這個基因突變的人患乳腺癌的概率也不為0。
評估未來患病的概率是預(yù)測的價(jià)值,但是預(yù)測與診斷是截然不同的,預(yù)測具有不確定性,診斷則要求確定性。一個有BRCA1基因突變的人是否都應(yīng)該像影星朱莉一樣預(yù)防性地將乳腺切除?如何確定一個有BRCA基因突變的人是屬于會發(fā)病的一撥,還是不發(fā)病的另一撥呢?再以高血壓為例,判斷所有成年人高血壓的界值都是統(tǒng)一的14090mmHg,而實(shí)際上數(shù)據(jù)分析顯示,血壓高于140/90mmHg的人中有很大比例患心血管風(fēng)險(xiǎn)并不高,而血壓低于12080mmHg的人中有些人患心血管疾病風(fēng)險(xiǎn)也并不低。
研究顯示,同樣是收縮壓為150mmHg的青年人,其患心血管風(fēng)險(xiǎn)的差別卻非常大。無論是基因突變還是高血壓,危險(xiǎn)因素與疾病之間的關(guān)系是復(fù)雜的,不能簡單化、絕對化地理解,需要針對不同的個體具體分析。由個體差異性帶來的不確定性是醫(yī)學(xué)復(fù)雜性的重要體現(xiàn)。隨著醫(yī)學(xué)的進(jìn)步,源于個體的數(shù)據(jù)越來越豐富,包括組學(xué)數(shù)據(jù)、健康監(jiān)護(hù)數(shù)據(jù)、影像數(shù)據(jù)等。計(jì)算機(jī)科學(xué)與醫(yī)學(xué)結(jié)合能夠挖掘出新的知識,開創(chuàng)新的診療模式。例如心理問題一般是通過臨床觀察或自我就醫(yī)的方式被發(fā)現(xiàn)并診斷的,現(xiàn)實(shí)中缺乏客觀有效的診斷方法,而基于說話(復(fù)述一件事情)模式的數(shù)據(jù)挖掘,能夠發(fā)現(xiàn)患者條理表達(dá)能力的下降,進(jìn)而成功預(yù)警心理問題,在小樣本人群實(shí)驗(yàn)中達(dá)到了100%的準(zhǔn)確度。通過機(jī)器學(xué)習(xí)對一些復(fù)雜信息進(jìn)行處理,也能對心臟病、哮喘、癌癥等疾病作診斷和預(yù)測,能夠達(dá)到或超越專家的診斷水平。
|