十余個醫療大模型相繼發布，專家提示需注意三類風險

2023-09-01 14:35

導讀

大語言模型對文本數據的解析能力極大方便了知識庫系統的構建，而自然語言檢索和問答則提升了知識庫的應用的便利性。‍

自ChatGPT風靡全球以來，國內各領域也開始積極探索生成式人工智能大語言模型產品的應用。《中國人工智能大模型地圖研究報告》顯示，截至5月底國內10億參數規模以上的大模型已發布79個，醫療領域的大模型產品也已發布十余個，應用場景聚焦在輔助問診、輔助決策、健康咨詢、醫學智慧影像等。

醫療大模型在輔助決策方面能夠發揮哪些作用？其與臨床決策支持系統有哪些區別？CDSreport結合了幾位專家的觀點進行剖析。

大模型或改變知識庫建設和應用方式

在剛結束的2023世界人工智能大會上，中國信通院云大所副所長閔棟在健康高峰論壇列舉了醫療大模型可能的9個應用方向，包括輔助決策、治療方案生成和質量控制等。

在輔助決策、輔助診斷方面，閔棟認為，在傳統臨床決策支持系統（CDSS）的基礎上，大模型的訓練數據來源更為廣泛，自我進化能力更高效，因而能為CDSS帶來較大幅度的提升。實際工作中，醫生經常需要調動大量醫學知識、記憶大量的患者信息，難免會出現記憶疲勞、身體疲憊等問題。而醫療大模型的引入可以幫助醫生記錄信息，大幅減少醫務人員工作量，緩解疲勞。同時，大模型還能通過學習電子病歷、醫學文獻、檢查檢驗結果等數據同醫生進行語言互動，提升診斷的準確性及效率。

2023年以來，已有十幾家公司發布了醫療大模型產品，應用場景多聚焦在輔助問診、健康咨詢、醫學智慧影像等。其中，大模型在輔助決策發揮的作用及對CDSS能力的提升已經成為共識。

有研究顯示，通用大模型已經能夠在診療過程中發揮作用。例如，在信息抽取上，可以將大段臨床文本進行結構化；在數據清洗層面，可以在一定范圍內提供一致性校驗工作。在此基礎上，經過特殊訓練的醫療大模型，通過整合多種來源和格式數據，可以提升醫療效率與質量。

醫療大模型是如何提升CDSS能力的？華東理工大學計算機技術研究所所長、自然語言處理與大數據挖掘實驗室主任阮彤表示，數據庫的建設和應用提升效果最明顯。

傳統的知識庫構建通常采用人工手段，從專業書籍、臨床指南，醫學文獻中抽取知識。這種抽取過程不但需要耗費較大人力，后續更新過程也比較緩慢。同時，知識圖譜等結構化的數據雖然精確，但語義表達能力遠遠弱于自然語言，包括多元關系、條件關系，因果關聯等知識模式定義。建設和使用過程需要較高的專業認知能力和業務建模能力，而模式的理解和正確性驗證也同樣有雙重門檻。此外，經過加工的知識庫，在不同應用場景還需要結合實際情況進行二次加工，進一步局限了使用場景。

以診斷為例，不僅要結合患者主訴，還要根據檢驗檢查結果評估診斷優劣。這個過程取決于對疾病判斷的精準度、檢驗檢查合理性以及信息交互過程方便程度。達到這些目標，信息系統需通過數據抓取和分析來判斷各種疾病的可能性，并且在各信息系統之間以及與醫務人員交互之間具備較好的處理能力，針對不同場景還需要獨特的系統設計和評估方式。

針對這一難點，一些CDSS供應商選擇自然語言處理等人工智能技術來處理海量醫學信息，從而實現結構化數據，建立醫學知識庫和臨床規則庫，并納入臨床真實病歷對知識模型進行持續訓練優化，形成不斷更新的循證醫學知識庫。

阮彤認為，大語言模型對文本數據的解析能力極大方便了知識庫系統的構建，而自然語言檢索和問答則提升了知識庫的應用的便利性。大語言模型體現的推理能力，提供了智能醫學診斷和治療方案推薦的可能性。例如，可以通過ChatGPT的開源框架langchain的一系列工具，以及Zero-Shot抽取能力，將原始文本數據抽取成為合適的形式。而對于臨床決策類的知識庫應用，可綜合患者數據通過大模型進行解析，在知識庫上進行推理。

02‍

醫療大模型不能“胡說”，部署可及性需要考慮

ChatGPT問世后，其語言交互能力令人驚嘆，但“一本正經胡說”的情況也時有發生。在醫療領域，這類可能會誤導診斷，甚至威脅到患者的生命健康。醫療行業的專業性與嚴肅性，對大模型的精準度提出了極端的高要求。

日前，北京市衛生健康委發布《北京市互聯網診療監管實施辦法（試行）》便提出，嚴禁使用人工智能等自動生成處方，嚴禁在處方開具前向患者提供藥品。此舉意在規范互聯網診療活動，亦是在降低大模型等人工智能技術可能帶來的風險。

對于大模型在醫療領域應用的風險，閔棟總結了3方面風險：算法的局限性可能導致內容失真，生成內容可能出現錯誤；醫療數據質量不足，可能導致訓練存在安全和隱私泄露風險；算力不足可能導致成本較高。

惠每科技CTO王實曾表示，對于醫療行業的企業，數據是他們獨有的優勢。這些數據一方面為半公開數據，包括收集了大量的醫學文獻的醫學知識庫、知識圖譜等；另一方面是非公開數據，包括臨床脫敏數據、電子病歷、檢測檢驗報告和RLHF臨床醫生反饋數據。通過使用這些數據訓練大模型，能夠形成有別于通用基座大模型的專業能力。

同時，由于使用場景為醫療機構，為保證數據安全和患者隱私，大模型或需要在本地部署。阮彤指出，醫療行業對患者隱私保護和數據安全的要求較高，滿足醫療機構本地環境部署要求也是大模型落地的重要考量因素。考慮到醫院實際部署環境，動輒上千億參數的通用大模型難以在院內施展拳腳，這就要求醫療大模型不能無限“大”，而要盡可能考慮部署可及性。同時，由于醫療數據不可能外接到ChatGPT或其他外部運營的大模型上，這就意味著醫療機構可控的、較為廉價的模型或是最佳選擇。

資料來源：[1]阮彤：ChatGPT等大語言模型對醫療信息系統的影響與提升——大語言模型在醫療行業應用系列，中國醫院協會信息專業委員會‍‍[2]醫療大模型：轉瞬即逝的曇花還是跨時代的變革，動脈網[3]大模型在臨床輔助診療場景下的問題與探討，CDSreport

【責任編輯：王惠】

原文標題 : 十余個醫療大模型相繼發布，專家提示需注意三類風險