要提升語料庫質(zhì)量 盡可能不讓AI出現(xiàn)幻覺
“AI+醫(yī)療”還有很長(zhǎng)的路要走
2025-04-03 09:44:05 來源:法治日?qǐng)?bào)·法治周末
左三為王杉。
《法治周末》記者 孟偉
從輔助診斷到藥物研發(fā),從健康管理到遠(yuǎn)程醫(yī)療,人工智能正在為醫(yī)療行業(yè)帶來前所未有的變革與機(jī)遇。
然而,隨著技術(shù)的進(jìn)步,人工智能在醫(yī)療領(lǐng)域也引發(fā)了一系列的法治、倫理和社會(huì)問題。如何確保人工智能在醫(yī)療領(lǐng)域的應(yīng)用既安全可靠,又符合法律法規(guī)和倫理道德?如何平衡人工智能與醫(yī)生的角色分工,確?;颊叩睦孀畲蠡??這些問題不僅關(guān)乎技術(shù)的發(fā)展方向,也關(guān)乎每一位患者的切身利益。
《法治周末》記者在參加由北京市人民政府參事室主辦的2025中關(guān)村論壇年會(huì)的“行業(yè)大模型應(yīng)用與發(fā)展論壇”時(shí),采訪了北京市人民政府參事室特邀研究員、北京大學(xué)人民醫(yī)院原院長(zhǎng)王杉,就上述問題進(jìn)行探討。
AI在醫(yī)療領(lǐng)域至少有三方面應(yīng)用
《法治周末》:人工智能在醫(yī)療領(lǐng)域主要有哪些應(yīng)用?
王杉:垂類大模型在醫(yī)療領(lǐng)域至少有三類以上的應(yīng)用。
第一,用于醫(yī)學(xué)本身的發(fā)展,進(jìn)一步了解疾病的發(fā)生發(fā)展規(guī)律,從而推動(dòng)生物技術(shù)發(fā)展以及發(fā)現(xiàn)新的靶點(diǎn)和個(gè)體化的治療方案,使患者得到更有效、精準(zhǔn)、安全的個(gè)體化治療。
第二,垂類大模型會(huì)促進(jìn)醫(yī)療衛(wèi)生健康生態(tài)的重構(gòu),居家診療將成為可能,像呼吸睡眠暫停這類疾病,患者可以在家進(jìn)行疾病的診斷評(píng)估以及治療過程干預(yù)調(diào)整,實(shí)現(xiàn)分級(jí)醫(yī)療。
第三,生成式人工智能的出現(xiàn),使得各級(jí)各類醫(yī)療機(jī)構(gòu)都有可能進(jìn)行精細(xì)化的管理,從醫(yī)療生物技術(shù)和醫(yī)藥創(chuàng)新角度來講,也可以大大縮短新藥的研發(fā)周期。
《法治周末》:現(xiàn)階段,AI問診能夠在哪些疾病類型上發(fā)揮作用?
王杉:目前的AI問診還處于輔助階段,面臨精準(zhǔn)度的問題,需要高質(zhì)量的多模態(tài)動(dòng)態(tài)語料庫供大模型學(xué)習(xí)。
未來,AI有望在精準(zhǔn)導(dǎo)診和分診方面發(fā)揮作用,比如幫助患者判斷癥狀的輕重,以及應(yīng)該去什么樣的機(jī)構(gòu)和科室就診。
但目前AI在醫(yī)療領(lǐng)域的應(yīng)用還有很長(zhǎng)的路要走,因?yàn)獒t(yī)生診斷不僅靠癥狀描述,還需要其他檢查手段。
《法治周末》:人工智能在醫(yī)療領(lǐng)域的應(yīng)用大概多久能看到比較明顯的效果?
王杉:比如說三五年之內(nèi),可能會(huì)出現(xiàn)一批創(chuàng)新藥。在新冠疫情期間,有的藥物研發(fā)周期大大縮短,主要就是因?yàn)槔昧擞?jì)算機(jī)技術(shù)、生物信息學(xué)技術(shù)進(jìn)行分析設(shè)計(jì)和評(píng)價(jià),遴選有希望的藥物再進(jìn)行實(shí)驗(yàn)研究。當(dāng)然,實(shí)踐中需要更精準(zhǔn)、更全面的臨床實(shí)驗(yàn)數(shù)據(jù)來驗(yàn)證新藥的療效和安全性。
AI問診出現(xiàn)誤判的責(zé)任界定
《法治周末》:在您看來,目前人工智能在醫(yī)療領(lǐng)域應(yīng)用,還存在哪些需要改進(jìn)或完善的地方?
王杉:醫(yī)療領(lǐng)域更重視的是垂類大模型的應(yīng)用。首先,要盡可能減少人工智能出現(xiàn)幻覺(人工智能系統(tǒng)在處理信息時(shí),產(chǎn)生與現(xiàn)實(shí)不符的感知或判斷)的情況,避免在臨床醫(yī)療中出現(xiàn)違背事實(shí)邏輯的情況。其次,大模型本身可能面臨技術(shù)限制,需要進(jìn)一步改進(jìn),比如自我糾錯(cuò)等措施。再者,訓(xùn)練大模型的語料必須高質(zhì)量,要全維度、細(xì)顆粒度、真實(shí)可靠。另外,現(xiàn)在醫(yī)療衛(wèi)生領(lǐng)域的大模型開發(fā)路徑多是以專家行為模擬為主,容易出現(xiàn)偏差,導(dǎo)致長(zhǎng)尾效應(yīng),在遇到小概率事件和新發(fā)事件時(shí)診斷結(jié)果不精準(zhǔn)。
《法治周末》:人工智能輔助診斷若出現(xiàn)誤判,責(zé)任如何界定?
王杉:目前,AI只是作為輔助工具,所有的診斷和治療決策最終都應(yīng)由醫(yī)生負(fù)責(zé)。即使在AI助手醫(yī)院,醫(yī)生仍然是最終的責(zé)任承擔(dān)者。傳統(tǒng)醫(yī)院的管理模式?jīng)]有變化,醫(yī)生在醫(yī)院執(zhí)業(yè),就要遵守國家相關(guān)的法律法規(guī)。AI不能直接給出診斷治療方案,因?yàn)樗赡軙?huì)出現(xiàn)幻覺,編出看似合理但實(shí)際違背事實(shí)的東西。
但如果未來AI在某些職能上的精準(zhǔn)度接近臨床醫(yī)生的水平,有可能部分取代一些常規(guī)性輔助性的工作。比如,對(duì)于一些常見病的診斷,如果能給AI提供準(zhǔn)確和高質(zhì)量的訓(xùn)練素材,它的判斷精準(zhǔn)度可能會(huì)高于一般醫(yī)生。在這種情況下,AI可以在基層用于篩查等工作,但前提是其精準(zhǔn)度必須接近于高質(zhì)量醫(yī)生的水平。
提升語料庫的質(zhì)量
《法治周末》:在您看來,人工智能與醫(yī)療結(jié)合的過程中,數(shù)據(jù)安全問題該如何解決?
王杉:今后一定會(huì)出現(xiàn)一類急需的人才,我稱之為manager,他們既能了解醫(yī)生和醫(yī)患的需求,又能將這些需求翻譯給人工智能專業(yè)人員,讓他們理解并積極融合。這種人才是復(fù)合型人才,能夠確保數(shù)據(jù)的安全和有效利用。
《法治周末》:在提升語料庫質(zhì)量方面,有哪些具體的措施可以實(shí)施?
王杉:政府需要制定語料庫建設(shè)的標(biāo)準(zhǔn)和分級(jí)標(biāo)準(zhǔn),明確不同類型數(shù)據(jù)的收集、整理和標(biāo)注要求。語料庫應(yīng)是動(dòng)態(tài)的,能夠?qū)崟r(shí)更新數(shù)據(jù),確保包含最新的醫(yī)療信息和病例。特別是對(duì)于新發(fā)疾病和罕見病,要及時(shí)納入語料庫,避免長(zhǎng)尾效應(yīng)導(dǎo)致的不精準(zhǔn)。
鼓勵(lì)醫(yī)療機(jī)構(gòu)、科研人員、患者以及普通百姓參與語料庫的建設(shè)。例如,醫(yī)療機(jī)構(gòu)可以將日常診療中的數(shù)據(jù)進(jìn)行整理和標(biāo)注后納入語料庫;科研人員可以將研究成果轉(zhuǎn)化為語料;患者和普通百姓可以在保護(hù)隱私的前提下,將自己的健康數(shù)據(jù)貢獻(xiàn)出來。
語料庫應(yīng)包含多模態(tài)數(shù)據(jù),如電子病歷、醫(yī)學(xué)影像、可穿戴設(shè)備數(shù)據(jù)、環(huán)境傳感器數(shù)據(jù)等。這些數(shù)據(jù)從不同角度反映了患者的健康狀況,能夠?yàn)槟P吞峁└娴男畔ⅰ?/p>
還要由專業(yè)的醫(yī)療人員對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,確保標(biāo)注的準(zhǔn)確性和專業(yè)性。例如,對(duì)于疾病診斷數(shù)據(jù),應(yīng)由經(jīng)驗(yàn)豐富的醫(yī)生進(jìn)行標(biāo)注,確保診斷結(jié)果的準(zhǔn)確性。同時(shí),要建立語料庫使用和成果共享機(jī)制,鼓勵(lì)更多的研究人員和醫(yī)療機(jī)構(gòu)使用語料庫進(jìn)行研究和應(yīng)用開發(fā),同時(shí)將研究成果反饋到語料庫中,形成良性循環(huán)。