最近,一個名為 OpenEvidence 的 AI 平台應運而生,它號稱是「AI 驅動的臨床實證引擎」,目標是解決醫療領域的「資訊過載」問題。這究竟是一個貨真價實的革命性工具,還只是另一個被過度炒作的 AI 產品?今天,就讓我們一起來深入探討一下。
創辦人的願景
OpenEvidence 的創辦人丹尼爾·納德勒(Daniel Nadler)是一位背景相當特別的人物。他不僅擁有哈佛大學的計量經濟學博士學位,先前更創辦了專注於金融數據分析的 AI 公司 Kensho,該公司在 2018 年被標普全球(S&P Global)以超過 5.5 億美元的價格收購。
有了在金融這個高風險、高複雜性領域成功應用 AI 的經驗,納德勒將目光轉向了醫療。他和他的團隊意識到,臨床醫生在資訊過載的困境中,非常需要一個能快速提供可靠證據的工具。因此,OpenEvidence 在 2021 年成立,其核心使命定為:「組織並擴展全球的集體醫學知識」。
迅速崛起
關鍵發展與策略聯盟
OpenEvidence 的發展軌跡不像傳統醫療科技公司那樣緩慢,反而更像科技界的「閃電式擴張」。
關鍵的轉捩點發生在 2023 年 3 月,當時 OpenEvidence 成功入選了著名的梅奧診所平台加速器計畫(Mayo Clinic Platform Accelerate program)。這次合作不僅為平台帶來了頂級醫療機構的背書,更提供了真實世界的測試場域,大大提升了其信譽與實用性。
在資本方面,平台也獲得了頂級風險投資公司紅杉資本(Sequoia Capital)的支持。在 2025 年初,更宣布籌集了 7500 萬美元,公司估值超過 10 億美元,顯示市場對其潛力充滿信心。
為了確保訓練數據的品質,OpenEvidence 也積極與全球最頂尖的醫學期刊出版商建立策略合作關係,包括:
- ✅ 《新英格蘭醫學雜誌》(NEJM Group)
- ✅ 《美國醫學會雜誌》網絡(JAMA Network)
- ✅ 愛思唯爾(Elsevier)平台(Clinical Key)
發展時間軸
從創立到市場驗證
回顧 OpenEvidence 的發展,可以看到幾個重要的里程碑:
從華爾街的金融分析,到臨床第一線的決策支援,OpenEvidence 的演進故事確實引人注目。它不僅僅是技術的展現,更是一種試圖改變醫師獲取知識方式的策略。
- 🎯 2021年11月:公司正式創立。
- 🎯 2023年3月:入選梅奧診所平台加速器計畫。
- 🎯 2023年7月:成為史上首個在美國醫師執業考試(USMLE)中得分超過 90% 的 AI。
- 🎯 2024年8月:推出 iOS 與 Android 手機應用程式。
- 🎯 2025年初:宣布由紅杉資本領投的 7500 萬美元融資。
- 🎯 2025年2月-6月:陸續宣布與 NEJM 及 JAMA 達成內容合作。
從華爾街的金融分析,到臨床第一線的決策支援,OpenEvidence 的演進故事確實引人注目。它不僅僅是技術的展現,更是一種試圖改變醫師獲取知識方式的策略。
不過,一個平台的好壞,終究還是要看它的核心功能與技術實力。接下來將剖析 OpenEvidence 的核心架構、使用者界面,以及如何有效的提問。
核心架構
通用型大型語言模型(如 ChatGPT)在醫療應用中存在一個致命缺陷:它們有時會產生「幻覺」(Hallucination),也就是捏造不實資訊。在人命關天的臨床環境中,任何錯誤都可能導致嚴重後果,因此這種缺陷是不可接受的。
OpenEvidence 的創辦人明確指出,他們的洞見在於「使用經同儕審查文獻訓練的、更小型的專業化 AI 模型,其表現優於應用於醫療領域的大型通用模型」。平台採用的是「專業模型的組合」(Ensemble of Specialized Models),而非單一的大型模型。
其核心技術基於「檢索增強生成」(Retrieval-Augmented Generation, RAG)系統。運作方式如下:
- 檢索 (Retrieve):當使用者提出問題時,系統首先從其精心策劃的知識庫(超過 3500 萬篇同儕審查文獻、FDA 藥物標籤等)中,透過其「專有的證據檢索演算法」來檢索相關文件。
- 增強 (Augment):系統會將檢索到的文件內容,作為生成答案的上下文(Context)。
- 生成 (Generate):最後模型會「只」根據這些被檢索到的文件內容來生成答案。
簡潔的界面
OpenEvidence 提供了網頁版和手機 App(iOS/Android),介面非常簡潔,以一個中央的查詢框為核心,沒有多餘的複雜操作界面。
使用者需要註冊帳戶,而美國的醫療保健專業人員(HCP)則需驗證其 NPI 號碼以獲得免費使用權限。
使用者需要註冊帳戶,而美國的醫療保健專業人員(HCP)則需驗證其 NPI 號碼以獲得免費使用權限。
非驗證醫療人員(一般公眾)網頁版每週僅限兩題,但目前手機 App 版,帳號驗證機制目前非常寬鬆,請多多把握這段空窗期(?)時間好好玩它。
OpenEvidence 典型的回答包含以下幾個部分:
- 🔹 學術風格文字:直接回應使用者問題的文字與段落,都常會用三至四個段落來回應。
- 🔹 內文引用標記:在摘要內文的關鍵結論旁,會附上引用標記。
- 🔹 參考文獻列表:摘要下方會列出所有參考文獻,每條文獻都直接連結到其在 PubMed 上的摘要頁面,方便使用者快速驗證資訊來源。
初步提問技巧
提問的品質決定了輸出的品質。要有效利用 OpenEvidence,我們需要學會提出「可回答的臨床問題」(Answerable Clinical Question)。實證醫學中的 PICO 架構 正是為此而生。
PICO 架構幫助我們將一個模糊的臨床情境,拆解成一個清晰、可檢索的問題:
一個模糊的問題,如「SGLT2 抑制劑對糖尿病患者好嗎?」,很難得到精確的答案。但若轉換成 PICO 格式的問題:「對於患有第二型糖尿病且已確立心血管疾病的成年患者(P),使用 SGLT2 抑制劑(I)與安慰劑(C)相比,對主要不良心血管事件(O)的影響是什麼?」,AI 就能更精準地去檢索並整合相關的臨床試驗證據。(提問時不需要寫 PICO,但包含這些元素越完整的提問,模型回應越精確)
PICO 架構幫助我們將一個模糊的臨床情境,拆解成一個清晰、可檢索的問題:
- P (Patient/Problem):病人或問題是什麼?(例如:患有第二型糖尿病且已確立心血管疾病的成年患者)
- I (Intervention):考慮採用的介入措施是什麼?(例如:使用 SGLT2 抑制劑)
- C (Comparison):比較的對照措施是什麼?(例如:與安慰劑相比)
- O (Outcome):期望達成的結果是什麼?(例如:對主要不良心血管事件的影響)
一個模糊的問題,如「SGLT2 抑制劑對糖尿病患者好嗎?」,很難得到精確的答案。但若轉換成 PICO 格式的問題:「對於患有第二型糖尿病且已確立心血管疾病的成年患者(P),使用 SGLT2 抑制劑(I)與安慰劑(C)相比,對主要不良心血管事件(O)的影響是什麼?」,AI 就能更精準地去檢索並整合相關的臨床試驗證據。(提問時不需要寫 PICO,但包含這些元素越完整的提問,模型回應越精確)
這種針對特定臨床決策的提問,也稱為「前景問題」(Foreground Question),正是 OpenEvidence 這類工具最擅長處理的。
OpenEvidence 2.0 指定回應任務
圖片來源: OpenEvidence 網站
2024年12月,網站宣告 OpenEvidence 2.0 提供幾種帶有特殊目得的回應格式,好加速幫忙醫療人員在診斷與處理文書作業。
就讓我們來看下一篇 Part 2 - 指定回應任務,繼續介紹下去~