純生栗子 發自 凹非寺
這個星球上的人們,或許還沒有做好迎接人工智慧醫生的準備。不過,加州大學舊金山分校(UCSF) 的研究人員培育的ai,已經在心臟影象的分類比賽上,超過了參賽的人類心血管醫師。
△超聲心動圖
診斷心血管疾病通用的方式是,評估就診者的超聲心動圖——那是心臟的動態影像。科學家們讓人類和AI,同時把12段影像中提取的“縮水”圖片,一張一張張歸入15個類別中。AI的正確率在91.7%-97.8%,而人類的正確率在70.2%-83.5%。
AI:叫我識圖小公主
耀眼的成績背後,是AI夜以繼日的高強度訓練。
UCSF醫學院的助理教授Rima Arnaout (也是一位心血管醫生) 和實驗室的小夥伴們,利用學校醫療中心2000年至2017年之間267位隨機患者 (20-96歲) 的超聲心動圖,建起了卷積神經網路(CNN) ,並按照不同視角把223,000多張影象分成15類。
△用深度學習模型完成的歸類
在那之後,團隊用超過180,000張影象來訓練AI對超聲心動圖中擷取的影象進行分類,每張圖片的大小在60-80畫素。
而這場比賽,自然也是以AI熟悉的訓練方式進行。與之相比,人類醫師日常的診斷過程則有明顯的不同。
人類:AI怎知何為診斷
人類心臟的結構複雜且不對稱,擁有4個腔室 (左右心房+左右心室) 和4片心臟瓣膜,還有負責血液進出的許多血管恣意地排布。正因如此,超聲心動圖的生成需要從多個角度捕捉動態影像。
△畫心需要教程
而當醫師準備分析一段影像的時候,首先要做的就是辨別它是從哪個角度拍攝的。之後,醫師會在高清影像裡,隨著成像工具在患者胸腔附近移動,來觀察心臟的表現。
被AI碾壓,並不代表受試醫師的專業水準、或是人類的診斷能力受到了質疑。他們只是還不習慣這樣的判別方式,一則影象太小,二則沒有視訊作為依託。
△15個類別
另外,AI只在分析影象之後得出粗略的分類結果,並不作出診斷。而人類醫師需要在幾段影像裡,觀察心臟的20多處結構,整合複雜資訊來完成一次具體診斷。而且,AI在診斷後的治療過程中,也不易發揮更大的能量。
AI+醫療的快樂與哀愁
即便這樣,計算機在心血管疾病的診療中依然有它的優勢,其速度或準確度,可能達到人類或傳統醫學方式難以企及的程度。
今年早些時候,谷歌與同屬Alphabet的生物科技公司Verily,一同釋出表了用眼球資料搭建神經網路,來預測心血管疾病風險的深度學習演算法論文。
△眼底(左),演算法視角(右),綠為對血壓預測有用的部分
AI用攝像頭獲取的眼球內膜 (即眼底) 影象,推測人的年齡、性別、血壓,甚至是否吸菸,而後依靠這些重要的引數來預測,此人未來被心臟問題纏身的風險。
把兩個人的眼底影象放在一起,其中一人在影象提取完成的五年後發生了心血管不良事件,另外一人則沒有出現心血管異常。演算法區分兩者的正確率達到70%,與傳統驗血方式的72%相去無幾。不過,AI需要的時間,就不像等待驗血結果那樣漫長了。
“AI在醫學診斷中超越人類”的相關訊息時常讓世界表現出難以抑制的興奮。不過,神經網路自誕生之日起,便有一個難以彌補的弱點——它們做不到有理有據,即能夠得出結論,卻無法解釋自己是怎樣從原始資料的汪洋,游到結論的岸上。
△就算醫生說的聽不太懂,也比沒說強
這或許會是人工智慧在醫療領域實現大規模應用之前,需要跨越的一個障礙。如果不能令人對診斷過程感到信服,患者對醫療機構的信任度便可能遭遇危機。
前路漫漫,好好訓練
不過,這類問題的解決,終究要以成熟的技術為根基。
目前,UCSF團隊的AI勝任的工作,離真正的診斷還有距離。而團隊也正在開發一個進階版本,讓AI在原有分類能力的基礎上,做出心血管具體疾病的診斷。
△如果再披上人類的外殼…
Arnaout希望有一天,AI可以像人類醫師那樣,不管遇到任何心臟的任何狀況,都能清晰地瞭解患者到底存在怎樣的問題。
所以,實驗室的大家,還是回去努力訓練自己的AI吧。白白。