1070825蘋果
劉大維/高醫附醫肝膽胃腸專科主治醫師


近日在報章雜誌上看到多篇針對人工智慧於醫療應用的文章,然其觀點可能出自社會大眾、病人家屬的立場,或以醫療、資訊工程人員的專業角度評論,限於觀點的不同,批判內容易失之偏頗空泛。因筆者大學畢業於資訊工程學系與學士後醫學系,目前為執業消化內科主治醫師,關心兩個領域的發展,希望同時俯瞰兩專業領域,為文討論人工智慧發展的脈絡,以其醫療應用的可能發展,敬祈各界賢達批評指教。

先從人工智慧的歷史談起。「人工智慧」一詞源自於1956年夏天,於新英格蘭地區的達特茅斯大學所舉行為期數周的共識會議,參與者除了達特茅斯大學、哈佛大學的學者,更有來自IBM與貝爾實驗室的研究人員。

其中貝爾實驗室的克勞德.山農(Claude Shannon)曾在二戰期間與英國數學家圖靈一同發展訊號與密碼學,可以看出電腦科學與人工智慧,幾乎是同時源自於戰爭時的通訊與解碼需求。人工智慧當時的假設是:「以理論機轉精確描述關於『學習或智慧』的任一層面或特徵,使之在機器上模擬重現。因此需求而訓練機器使用語言、形成抽象概念,最終處理目前僅限人類才有辦法處理的問題,並自我改進。」

由此假設,我們可以知道人工智慧的定義大概是:訓練機器學習知識,形成抽象概念,處理問題,並在每次執行之後自我檢討、修正。

就學習知識與抽象概念部分,人工智慧的基石之一,專家系統(Expert System),隨之誕生。專家系統在醫界觀之,其實就是醫療手冊裡的治療指引(guideline)流程圖,這些治療指引廣泛用於醫療領域,例如腎衰竭的診斷,可以從腎前、腎本體、腎後性的因素探討,腎前性可能是心血管的問題,腎本體可能是腎絲球發炎、腎後性可能是排尿的輸尿管出了問題,而從各因素往下探討以確立診斷,又例如貧血,必須先考慮是血球/血色素「製造不足」,或「破壞、流失太多」所致,此般流程圖的每個分岔點選擇,就是資訊科學裡最基礎的訓練項目:演算法(algorithm)。

在訓練醫學生分析病情並運用治療指引流程圖時,醫界有個專有名詞:思考流程(thinking process)。當年筆者進入醫學院時,聽著醫學教授慎重其事的說著"thinking process"一詞,心裡總會打個突:如果有一個可靠的thinking process,那透過「專家系統」,一個應用程式(App)就可以執行大部分的醫療診斷,那醫療診斷的模式改變將指日可待了。事實真的如此嗎?

事實上過去半世紀的資訊科技進展,早已有許多技術可以直接運用到醫療診斷上,例如筆者曾學習的語音辨識技術。語音輸入技術的關鍵演算法是由貝爾實驗室的維特比(Andrew Viterbi)所提出,維特比在1967年針對正在研發的CDMA, GSM等行動通訊協定,提出此演算法,試圖過濾掉無線數位訊號中的雜訊,留下必須傳輸的語音訊息。演變至今,早已成熟運用於日常可見的Siri、Alexa等語音助理。

簡單說明維特比演算法如下:當語音辨識機器接收到我們所講出的「蘋果」一詞,「蘋」字會先聽成「平」字的機率可能是6成,四成聽成「蘋」,此「成數」為程式開發時依據使用習慣設定(演算法中稱之為轉移機率),下個音若為「果」,則會回頭找演算法核心資料庫中「蘋」接「果」的機率成數(演算法中稱為放射機率),發現其設定為九成,而「平」接「果」的機率僅設定為1成,於是把「平果」與「蘋果」兩條分析路徑的機率成數分別計算為0.06(6成乘以1成)以及0.36(四成乘以九成),最終機器可以判讀「蘋果」一詞。

維特比演算法已廣泛用於判斷「某軸線上(如時間軸上)的一連串事件」的結果,除了語音、手寫、拼音輸入辨識,也用在市場走勢、天氣預測,醫療上心電圖判讀乃至基因體分析等。倘若演算法核心資料庫寫得夠好,在充分了解病人的性別、年紀、病史與臨床表現後,我們將可以預測一位腸胃道出血患者的出院時間,或是肝衰竭患者恢復肝功能的機率。

近年來人工智慧的突破性發展,除了得力於網路科技帶來的大數據資料庫、更進化的演算法(如打敗韓國圍棋棋王的AlphaGo所使用的蒙地卡羅樹狀搜尋法),最不能忽略的就是英偉達(Nvidia)公司成功開發的圖形處理晶片,讓即時高畫質影像分析成為可能。圖像分析的複雜度遠高於語音分析,而圖像分析的基礎,也就是人工智慧的另一大基石是捲積神經網路(Convolutional Neural Networks, CNN),CNN的後端關鍵技術「Backpropagation」早在1975年就已提出,但高畫質影像本身的檔案龐大,在CNN擷取影像的輪廓、特徵後,將形成下一層數十甚至數千個資料量同樣龐大的新圖形,而影像分析往往必須完成10多層的圖形分析,才能判讀結果。處理器效能的限制,讓高畫質影像分析停滯了30年,直到約莫10年前才逐漸突破,目前已大量應用在路況(如自動駕駛)、社會安全(嫌犯的臉部甚至步態特徵)、甚至醫學影像判讀。

事實上,目前北美的醫學影像判讀技術已經逐漸被接受,或許目前對特定罕見病徵的判讀仍不如專科醫師,但快速、大量、有一定品質的人工智慧影像篩檢,將在抑制醫療費用上漲、加快診療效率的浪潮下快速發展,在不遠的將來協助醫師評估病情。據聞國內的雲象科技,甚至把病理切片也納入影像判讀的內容,目前已取得初步成果。而亞利桑那州大學運用觀察病菌活動的影片,快速判讀抗生素療效的成果,也在今年有文獻發表。依此可見,目前影像判讀的科技正席捲醫療各層面,方興未艾。

筆者所學習資訊工程是門應用科學,資訊工程揮灑的領域是架構在物理學(電子電路、光電學)、數學(機率統計、演算法)等學門之上。進醫學院後發現,醫學更是一門應用科學的極致,醫學領域所運用的診斷治療科技來自於生物(病理、解剖、生理、遺傳)、化學(藥學)、物理(放射、光電)等,因為牽扯到與病人家屬的互動,更會觸及法律、倫理的議題,而醫學的訓練過程也因為涉及技術傳授、醫病信任的課題,較其他領域封閉,於是醫學對科技發展的接受是謹慎而緩慢的,惟若要問「人工智慧是否可以改善醫療實務?」那答案顯然是肯定的,醫療檢查報告的判讀甚至基因分析已經有人工智慧在做,而且已經有一段時日了。

若要問「人工智慧會不會取代醫師?」那我可以說目前某些醫師的工作內容,如前述之檢查報告判讀、疾病觀察後臆測等,可在十年內被逐漸取代,而需要手感回饋的精細動作如外科手術、內視鏡操作等,基於微電機與感應器的技術瓶頸,10年內可以進化、可以協助操作醫師,但不至於取代執行醫師。「那醫師會不會被人工智慧取代?」答案顯然是否定的,除了精細動作的內容不會被取代,更重要的是醫師透過語言、動作、情感再加上專業的理學檢查、檢驗報告判讀,去理解病情,安排治療項目,仍然是非常個人化而無法大量複製的。

另一個機器難以取代醫師的部分,是人與人的「信任感」,畢竟機器是人設計的,如果出了狀況,指責機器無法解決問題,更無法得到心理上的安慰、諒解,所以我們從航空業可以看到,儘管商用飛行絕大部分的時間可以讓人工智慧駕駛飛機,我們還是安排了正副機師,給他們充足的訓練、適當的休息時間與豐厚的工作報酬,讓機師們「負責完成」每一趟飛行。機師們的存在,除了處理起降時容易出現不理想的天候、跑道安排等狀況,很大一部份是讓搭機的乘客能夠「信賴」,因為就3萬呎高空的日常運輸,儘管票價在低,目前應該沒有旅客願意接受無人機飛行。醫療是同樣「攸關生命安全」的工作,醫師身為諮詢、引導、執行醫療行為給病家的「信任感」,將是機器無法取代的。

未來醫師的挑戰,可能是善用人工智慧,讓工作內容可以人工智慧取代的部分,盡快「交接」給人工智慧。身為醫師的我們可以交接些甚麼呢?

門診裡常有上腹痛的患者,討論病情時病人可能會把網路搜尋到的上腹痛可能診斷,如胃腸道潰瘍、膽道疾病、胰臟疾病甚至心臟病、酸中毒、缺血性腸炎等都列舉出來,但是每個疾病可能的「權重」,也就是在這個病人身上的「可能性」,就需要專科醫師判斷了。判斷的準確與否,可以從病史、病癥特色分析,得到最趨近正確診斷的結果。

在人工智慧取代醫療實務的過程,我建議打算再執業20年以上的醫師們,可以對於程式設計有基礎認識,此外,在通過法律與倫理的辯證後,醫界應協同各醫療系統,建立共通的資料庫,讓醫師們在執業過程中彙整疾病診療反應的各種檢驗檢查紀錄,這些紀錄彙整後將成為人工智慧的資料庫,依此資料庫「訓練」出更可靠的人工智慧診斷工具。

人工智慧的介入,將加速醫療技術與效率的進化。台灣有優秀的醫療品質與成熟的電子資訊產業鏈兩大背景,醫療與人工智慧的整合,其實是值得政府與醫療、資訊界共同努力的方向。

為文時回顧求學經歷,特別感謝大學時期的何泰軒學長,國內的語音辨識專家,引領筆者就教於語音辨識的泰斗李琳山老師,而筆者文章一字一句地敲鍵,使用的正是泰軒學長開發的微軟新注音輸入法,文末一併誌念。