以下文章來源于:藥明康德
近年來,隨著生活水平的提高,人們對健康愈發(fā)重視,早期癌癥的篩查也在加速普及中。為了提高癌癥篩查的準(zhǔn)確性和效率,人工智能(AI)在癌癥篩查領(lǐng)域已做出了不少嘗試,尤其是在乳腺癌篩查場景中的應(yīng)用。目前,F(xiàn)DA已經(jīng)批準(zhǔn)了至少16款乳房X光篩查算法,用于癌癥檢測、癌癥風(fēng)險預(yù)測和質(zhì)控。但近期的一項(xiàng)薈萃分析顯示,AI似乎還沒能發(fā)揮出其在幫助癌癥篩查方面應(yīng)有的潛力——在乳腺癌篩查方案中使用AI進(jìn)行圖像分析,納入研究的36個AI系統(tǒng)中有34個(94%)的準(zhǔn)確性都低于單位放射科醫(yī)生作出的判斷,而且所有36個AI系統(tǒng)的準(zhǔn)確性都低于2位及2位以上的放射科醫(yī)生作出的共同判斷。
基于這項(xiàng)研究,學(xué)者們對目前輔助乳腺癌篩查的AI算法作出了如下總結(jié):“近期的證據(jù)顯示,現(xiàn)有的AI系統(tǒng)在乳腺癌篩查中無論是從質(zhì)量還是數(shù)量上來說,都遠(yuǎn)未達(dá)到臨床應(yīng)用的要求。”AI算法在乳腺癌篩查中的表現(xiàn)不佳,原因在哪兒?來自華盛頓大學(xué)醫(yī)學(xué)院的放射學(xué)助理教授Aaron Mintz教授指出,盡管可能的原因有很多,但其中最重要的還是由于用于訓(xùn)練AI的數(shù)據(jù)集來源過于單一,缺乏不同種族、不同地域及不同社會經(jīng)濟(jì)地位人群的多樣化的高質(zhì)量數(shù)據(jù)。目前大多數(shù)大型AI培訓(xùn)隊列的數(shù)據(jù)都來源于歐洲,這是因?yàn)闅W洲有國家性的注冊和篩查計劃。而美國用于AI培訓(xùn)的數(shù)據(jù)集往往是單中心的,在數(shù)量和多樣性上存在著嚴(yán)重的不足,這會導(dǎo)致?lián)擞?xùn)練的AI產(chǎn)生系統(tǒng)性的偏倚。2020年,一項(xiàng)調(diào)查了用于深度學(xué)習(xí)算法的美國隊列的地理分布研究顯示,納入的76項(xiàng)用于圖像診斷的深度學(xué)習(xí)算法研究(涉及放射學(xué)、眼科、皮膚病學(xué)、病理學(xué)、胃腸病學(xué)和心臟病學(xué))中,有56項(xiàng)(76%)使用了至少1個地理上可識別的隊列來訓(xùn)練算法。在這56項(xiàng)研究中,來自加利福尼亞州的隊列出現(xiàn)了22次(39%),來自馬薩諸塞州的隊列出現(xiàn)了15次(27%),來自紐約的隊列出現(xiàn)了14次(25%)。56項(xiàng)研究中共計有40項(xiàng)(71%)使用了來自這3個州中至少1個州的患者隊列。在其余47個州中,有34個州沒有貢獻(xiàn)任何患者隊列,其余的13個州分別貢獻(xiàn)了1至5個隊列。
▲用于訓(xùn)練臨床機(jī)器學(xué)習(xí)算法的美國患者隊列表(按州統(tǒng)計)(圖片來源:參考資料[3])也就是說,來自加利福尼亞州,馬薩諸塞州和紐約州的隊列被不成比例地大量用于訓(xùn)練臨床深度學(xué)習(xí)算法,而其余47個州的人群數(shù)據(jù)就像是“數(shù)據(jù)沙漠”地帶,基本上沒有被覆蓋到。隨著越來越多的乳腺癌篩查中開始應(yīng)用這種基于多樣性不足的數(shù)據(jù)集訓(xùn)練而成的AI算法,其在實(shí)際使用時的表現(xiàn)欠佳問題也逐漸被突顯。尤其是乳腺癌的發(fā)病率在不同人種間存在著很大的差異,若用于AI訓(xùn)練的數(shù)據(jù)集缺乏對不同人群足夠的代表性,將會導(dǎo)致大量的漏診和誤診。構(gòu)建大型、多樣化的數(shù)據(jù)集的主要障礙之一是各醫(yī)療保健組織內(nèi)部的數(shù)據(jù)都是孤立的。出于信息安全的考慮,管理患者健康數(shù)據(jù)的機(jī)構(gòu)或管理者不會將這些數(shù)據(jù)分享出去。然而,一種名為聯(lián)邦學(xué)習(xí)(federated learning)的新興AI訓(xùn)練技術(shù)有望突破這個困境。聯(lián)邦學(xué)習(xí)不需要原始數(shù)據(jù)在各個組織間傳送就可以讓研究人員在本地實(shí)現(xiàn)信息共享。這是怎么做到的呢?原來,聯(lián)邦學(xué)習(xí)是讓算法本身在各個數(shù)據(jù)提供點(diǎn)進(jìn)行“旅游”,AI在接觸到用于訓(xùn)練的數(shù)據(jù)后會進(jìn)行加權(quán)評分,將評分結(jié)果而不是原始數(shù)據(jù)本身發(fā)送給研究人員,從而既獲得了想要的數(shù)據(jù)結(jié)果,又保護(hù)了患者原始數(shù)據(jù),這被認(rèn)為是十分安全的。如果所有的機(jī)構(gòu)都愿意敞開他們數(shù)據(jù)庫的大門,通過聯(lián)邦學(xué)習(xí)將建立起一個生物醫(yī)學(xué)數(shù)據(jù)合作研究的新世界——未來我們可以構(gòu)建一個巨大的多站點(diǎn)聯(lián)合乳腺影像學(xué)數(shù)據(jù)網(wǎng)絡(luò),除了標(biāo)準(zhǔn)的數(shù)字乳腺X線攝影和數(shù)字乳房斷層合成信息,同時還囊括了大量的必需參數(shù)例如年齡、種族、性別、社會經(jīng)濟(jì)地位、地理位置、乳腺攝影設(shè)備、乳腺攝影發(fā)現(xiàn)、癌癥診斷和患者結(jié)局等等不同的信息。
圖片來源:123RF
通過來自這個多站點(diǎn)數(shù)據(jù)網(wǎng)絡(luò)的數(shù)據(jù)集,可以確保目前處于邊緣化的群體的數(shù)據(jù)也能被覆蓋到。這種方法將解決“數(shù)據(jù)沙漠”問題,確保開發(fā)出來的AI能夠適應(yīng)多樣的患者數(shù)據(jù)。通過引入聯(lián)邦學(xué)習(xí),AI開發(fā)人員可以在大型真實(shí)數(shù)據(jù)集上驗(yàn)證他們的模型,來檢驗(yàn)算法是否存在偏差或性能上的缺陷。一旦發(fā)現(xiàn)存在此類問題,研究人員可以通過深入訪問該模型應(yīng)用性能較差的隊列對AI繼續(xù)進(jìn)行調(diào)整,最終建立起能在不同患者特征下都表現(xiàn)良好的技術(shù)。聯(lián)邦學(xué)習(xí)構(gòu)建數(shù)據(jù)網(wǎng)絡(luò)的現(xiàn)狀與展望目前,不少開源和商業(yè)數(shù)據(jù)平臺的用戶都參與搭建了這個多站點(diǎn)聯(lián)合網(wǎng)絡(luò)。當(dāng)前的計劃是,在城市和鄉(xiāng)村代表性不足的社區(qū)站點(diǎn)進(jìn)行推廣并招聘相關(guān)人員,然后對其進(jìn)行入職培訓(xùn)。希望在不久的將來,為AI研究人員提供數(shù)據(jù)的機(jī)構(gòu)能夠把他們的數(shù)據(jù)摘要上傳到類似目錄的統(tǒng)一界面,研究人員可以通過瀏覽這種目錄來聯(lián)系想要的數(shù)據(jù)的持有者,最后通過聯(lián)邦學(xué)習(xí)獲取數(shù)據(jù)或是通過其他兼容的數(shù)據(jù)共享協(xié)議獲得數(shù)據(jù)使用許可。這種創(chuàng)新模式可以通過獲取更多樣的數(shù)據(jù)矯正AI對某一類人群的偏向性,加速AI適應(yīng)真實(shí)世界的應(yīng)用場景。在這種新形勢下,醫(yī)院必須認(rèn)識到他們所擁有的多樣化數(shù)據(jù)是一座尚待開發(fā)的寶庫,并利用各種機(jī)會讓這些數(shù)據(jù)發(fā)揮出更大的價值。人們對AI幫助臨床醫(yī)生提高圖像診斷的工作效率和準(zhǔn)確性寄予了厚望,盡管目前還有很長的路要走,但我們相信,只要找到了問題的原因所在,有了明確的改進(jìn)方向,各類機(jī)構(gòu)和研究人員將會不遺余力地去解決,使新的算法更完善。期待AI在醫(yī)療領(lǐng)域中的應(yīng)用和發(fā)展越來越好!