
本文將為您導讀此章節的精華,並思考如何將這些知識應用於臨床實踐中。
為何是「增強」而非「人工」智慧?
其價值在於增強 (augment) 醫師既有的感知和診斷能力,同時將我們從耗時費力的瑣碎任務(如文書工作)中解放出來,讓我們能回歸醫療的核心——花更多時間與病人溝通。這描繪的是人機協同的未來,強調醫師在決策過程中的主體性。作者也提醒,許多 AI 研究是在狹隘且脫離臨床情境的任務上進行的,因此,醫師的參與和監督相當重要,因此需要了解其原理,才能更好地設計和評估這些工具。
機器學習的核心概念 (Concepts of Machine Learning)
這部分介紹了機器學習的四種類型:- 監督式學習 (Supervised Learning): 這是目前醫學應用中最常見的類型,就是給機器「帶答案的考題」。我們提供成對的「輸入」(如病人數據) 和「輸出」(如疾病結果),讓模型學習如何預測。常用的 Framingham 風險評分就是一個經典例子,而其它的應用則像是利用大量病理切片影像來訓練 AI 自動偵測乳癌的淋巴結轉移。
- 非監督式學習 (Unsupervised Learning): 這邊提供的是「沒有答案的資料」,目標是讓機器自己從中找出隱藏的結構或規律。臨床應用如透過分析基因表現數據,將氣喘病人分為不同的分子亞型,這有助於個人化醫療。另一個重要的應用是大型語言模型 (LLM) 的預訓練,也就是讓模型閱讀巨量的文本資料庫來學習語言和知識。
- 半監督式學習 (Semi-supervised Learning): 這是上述兩者的混合體。在醫學領域,專家標註的資料(如影像判讀)既昂貴又耗時,此方法特別有價值。例如,利用少量由專家標註的心臟 MRI 影像,搭配大量無標註的影像,來教 AI 更準確地辨識肥厚性心肌症。
- 強化學習 (Reinforcement Learning): 讓 AI 像個實習醫師,透過不斷的「嘗試與回饋」來學習最佳決策。一個極具潛力的臨床場景是訓練 AI 在 ICU 中,根據病人的即時生理反應,學習如何動態調整敗血症病人的升壓藥與輸液劑量,以達到最好的治療效果。
現代醫學機器學習工具箱 (Modern Medical Machine Learning Toolkit)
- 線性/邏輯迴歸 (Linear/Logistic Regression): 這是大家早已熟悉的統計方法,就像一把可靠的尺,用來衡量變數間的線性關係。在面對小型、高品質的臨床資料集時,它們的表現依然穩健且結果容易解釋,因此常被用作評估更複雜模型的「基準線 (baseline)」。任何新模型都應該要能證明自己比這個簡單的工具更有效。
- 梯度提升樹 (Gradient-boosted trees): 如果說單一的決策樹像一個簡單的臨床流程圖,那梯度提升樹就是召集了數百位專家(決策樹)進行會診。這種「集成學習」的方法,對於處理我們臨床上最常見的「表格型數據」(如病人的基本資料、生命徵象、實驗室數據)非常有效,常常能在預測任務中取得頂尖的表現。
- 卷積神經網路 (CNN): 這是醫學影像分析的主力。CNN 模仿人類的視覺皮層,透過多層「濾鏡」來掃描影像,從最初階的邊緣、顏色、紋理,到更深層次的器官輪廓或腫瘤特徵,層層遞進地「看懂」一張影像。知名的 U-Net 架構就常用於醫學影像的「分割」任務,也就是精準地在影像上勾勒出特定組織或病灶的範圍。
- Transformer 模型: 這是處理「序列資料」的王者,其核心是「注意力機制」(Attention Mechanism),讓模型能理解序列中不同元素間的關聯與重要性。這使得它在理解上下文語意方面特別出色,不僅徹底改變了自然語言處理(如我們每天使用的 GPT-4/ChatGPT),也被應用於分析基因序列等其他序列型數據。
- 遷移學習 (Transfer Learning): 這是個非常實用且重要的概念,可謂「站在巨人的肩膀上」。我們不需要每次都從零開始訓練一個模型。例如,一個在數百萬張通用照片(貓、狗、汽車等)上訓練過的影像模型,已經學會了辨識顏色、邊緣、形狀等基礎視覺概念。我們可以借用這個已經「很有知識」的模型,再用我們相對少量的醫療影像數據對其進行「微調」(fine-tune),讓它快速適應新的醫學任務。這大大降低了對海量數據和昂貴運算資源的需求。
AI 模型是如何煉成的?訓練過程速覽
- 損失函數 (Loss function): 這可以想像是 AI 的「評分標準」或老師的「紅筆」。它是一個數學函數,用來精確計算模型預測的答案與「標準答案」之間的差距。模型訓練的整個過程,就是透過演算法(如梯度下降法)不斷地微調內部數百萬個參數,目標只有一個:讓這個「損失分數」降到最低。
- 訓練/測試集分割 (Train-test split): 這是確保模型具備「泛化能力」而非「死背硬記」的關鍵步驟。我們會把資料集切成兩份:較大的一份(如 70-80%)是「訓練集」,用來教導模型;另一份從未給模型看過的「測試集」,則像期末大考,用來公平地評估模型在面對陌生資料時的表現。唯有在測試集上表現良好,我們才能相信這個模型是真正學到了知識,而非僅僅記住了考題。
- 硬體與框架 (GPU & Frameworks): 深度學習涉及海量的矩陣運算,這對傳統的 CPU 來說非常吃力。專門的硬體如 GPU (圖形處理器) 就像是為此而生的「計算工廠」,能以數百倍的速度進行平行運算。而 TensorFlow、PyTorch 這些深度學習框架,則像是「AI開發懶人包」,提供了預先建好的模組和自動化的流程,讓開發者能專注於模型設計,而不用從零開始打造底層的複雜數學工程。
臨床應用亮點 (Applications of Modern Machine Learning)
- 電腦視覺 (Computer Vision): AI 在這個領域的表現已達到了令人信服的專家級水準。例如,Google 的研究團隊 (Gulshan et al., JAMA 2016) 訓練的 CNN 模型,在判讀視網膜眼底照片以偵測糖尿病視網膜病變時,其準確率 (AUC 0.99) 與眼科醫師相當。另一項研究 (Esteva et al., Nature 2017) 中,AI 在區分惡性皮膚癌與良性痣的表現上,也達到了皮膚科專科醫師的水平。這些成果顯示 AI 已成為影像判讀不可忽視的力量。
- 自然語言處理 (Natural Language Processing): 這是與內科醫師日常工作最息息相關的領域。過去,病歷中大量的文字紀錄(如病程紀錄、出院摘要)是難以被電腦有效利用的資訊金礦。現在,透過 NLP 技術,AI 已能「讀懂」這些文字。例如,研究顯示 AI 能從電子病歷中準確預測住院死亡率、30天內非計畫性再入院等重要臨床指標。更令人驚豔的是,如 GPT-4 這類大型語言模型,在 NEJM 極具挑戰性的臨床病理病例討論 (CPC) 中,展現了強大的鑑別診斷能力,這預示著 AI 將成為我們未來進行臨床推理時,一位知識淵博、不知疲倦的虛擬顧問。
總結與行動呼籲
讀完這篇 Harrison's 的新章節,我們應該體認到,AI 不再是遙遠的未來,而是正在發生的現在。身為臨床醫師,我們不必為此感到焦慮,而應將其視為一次專業升級的契機。
您可以採取的下一步:
- 建立正確認知: 將 AI 視為增強您臨床能力的工具,就像更高級的聽診器或影像儀器。
- 培養批判性思維: 了解 AI 的基本原理與限制,能幫助您在未來評估各種新興醫療 AI 產品時,不會被花俏的行銷話術迷惑,能判斷其臨床實用性與潛在風險。
- 成為引導者: 臨床醫師的專業知識與經驗,是確保 AI 技術能安全、有效地應用於病人的關鍵。我們應該積極參與到 AI 工具的驗證與回饋過程中,確保科技真正解決臨床問題。
產文輔助
Gemini CLI with gemini-2.5-pro model
原文連結
Harrison's Principles of Internal Medicine, 22nd Edition: Chapter 501: Machine Learning and Augmented Intelligence in Clinical Medicine LINK