亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

          首頁 > 新聞 > 大政

          分享到微信

          打開微信,點擊底部的“發(fā)現(xiàn)”,
          使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

          獨家 | 對話協(xié)和:國內(nèi)首款罕見病大模型,如何抑制AI“幻覺”?

          第一財經(jīng) 2025-02-28 17:08:57 聽新聞

          作者:吳斯旻    責(zé)編:胥會云

          避免AI幻覺的核心是:以嚴(yán)格篩選的數(shù)據(jù)和經(jīng)深度治理的知識對模型的推理過程進(jìn)行約束。

          “孩子未滿14歲,此前因扁平足、足踝外翻等結(jié)締組織異常特征在北京看了骨科,醫(yī)生根據(jù)孩子韌帶松弛及外部特征,認(rèn)為疑似馬凡綜合征;回長沙后,先后又去了多家醫(yī)院,心外科等其他科室醫(yī)生們也給出同樣的判斷。然而,基因檢測卻未檢出馬凡,眼睛也沒有出現(xiàn)晶狀體脫落。”

          近日,全國首個罕見病領(lǐng)域人工智能大模型“協(xié)和·太初”面向患者開放。帶著“孩子究竟得了什么病”的困惑,何芳(化名)將其孩子病情輸入在該模型的對話框中。

          與何芳去過的這些醫(yī)院的判斷有所不同的是,“協(xié)和·太初”給出了其他疾病判斷:鑒于患者基因檢測為陰性、眼部未見典型病變,還需重點排查Loeys-Dietz綜合征、先天性結(jié)締組織發(fā)育不全綜合征,建議結(jié)合FBN1/TGFBR1/TGFBR2等多基因Panel復(fù)測。

          在給出疾病判斷的同時,該大模型同時給出醫(yī)學(xué)建議和推薦就診科室,推薦何芳帶孩子做全身磁共振血管成像排查血管病變、皮膚活檢病理檢查等多項補(bǔ)充檢查。

          馬凡綜合征是中國《第一批罕見病目錄》中的疾病,在中國的發(fā)病率約為1/20000-1/10000。在罕見病領(lǐng)域,由于單病種患者稀少,加之其臨床表型可能與其他罕見或常見疾病相混淆,導(dǎo)致像何芳孩子一樣,誤診、反復(fù)求診的患者并不在少數(shù)。

          AI大模型的介入,正給出一種破局的可能。

          在罕見病醫(yī)生欠缺、絕大多數(shù)醫(yī)院缺少罕見病多學(xué)科聯(lián)合診斷能力的背景下,利用AI初篩是否靠譜?大模型給出的診斷推理邏輯鏈,能否比肩經(jīng)驗豐富的罕見病醫(yī)生?罕見病單病種患者稀少,小樣本訓(xùn)練是否會影響模型性能?

          2025年2月28日是第18個國際罕見病日。帶著上述疑問,第一財經(jīng)與“協(xié)和·太初”的研發(fā)團(tuán)隊——北京協(xié)和醫(yī)院與中國科學(xué)院自動化研究所的有關(guān)專家進(jìn)行了一次深度對話。

          國際首個符合中國人群特點的罕見病大模型

          2025年2月16日,北京協(xié)和醫(yī)院與中國科學(xué)院自動化研究所共同研發(fā)的“協(xié)和·太初”罕見病大模型,歷經(jīng)2年技術(shù)攻關(guān),正式進(jìn)入臨床應(yīng)用階段。

          “協(xié)和·太初”是基于協(xié)和百年積累的高質(zhì)量臨床病歷、專家診療邏輯、權(quán)威醫(yī)學(xué)知識庫(教材/指南/罕見病文獻(xiàn))及科研教學(xué)數(shù)據(jù)集,實現(xiàn)從臨床決策到藥物臨床試驗管理的全流程智能輔助。

          第一財經(jīng)了解到,在大模型研發(fā)之前,北京協(xié)和醫(yī)院已經(jīng)有了一個人工智能的表型提示工具phenobrain,應(yīng)用效果和方法已經(jīng)發(fā)表,可以提示副高級以上的醫(yī)生進(jìn)行罕見病診斷,準(zhǔn)確率達(dá)到80%。“協(xié)和·太初”在臨床應(yīng)用之前,在北京協(xié)和醫(yī)院罕見病聯(lián)合門診試點應(yīng)用一年,大模型交互能力可以進(jìn)一步提升這個水平。

          “在進(jìn)入臨床應(yīng)用后,患者的自然語言能夠提供多少有效信息,關(guān)乎診斷準(zhǔn)確率。從近兩周我們收集到的500多條患者使用記錄來看,大模型給出的初篩結(jié)論基本可靠。” 轉(zhuǎn)化醫(yī)學(xué)國家重大科技基礎(chǔ)設(shè)施(北京協(xié)和)虛擬人研究平臺主任金曄告訴第一財經(jīng)。

          罕見病雖然單病種患者稀少,但病種繁多,全球罕見病人群約4億之多。罕見病少,能診斷罕見病的醫(yī)生更少,有調(diào)研顯示,我國罕見病誤診率也在40%以上,平均確診時間超過4年,診療同質(zhì)性差,加之罕見病患者往往疾病進(jìn)展快,更有效的診斷路徑意味著可能為患者帶來顯著的生存受益和生活質(zhì)量提升。

          近年來,AI技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用展現(xiàn)出極大潛力,但在罕見病領(lǐng)域,傳統(tǒng)的AI模型因數(shù)據(jù)匱乏、知識可信度低、決策邏輯不透明等缺陷,因而難以滿足罕見病診療需求。

          “協(xié)和·太初”大模型可以通過交互對話,模擬專業(yè)醫(yī)生的邏輯推理鏈條,為患者提供復(fù)雜表型的初篩,同時依據(jù)對患者基本病程的梳理,給出補(bǔ)充檢查檢驗的建議,患者可以根據(jù)模型建議在本地完善臨床檢查并提示首診醫(yī)生考慮罕見病可能。

          “這意味著,通過大模型支持基于國家直報數(shù)據(jù)推薦不同級別醫(yī)療機(jī)構(gòu)在患者診療中進(jìn)行分層管理和雙向轉(zhuǎn)診,可以優(yōu)化患者就診路徑,減少患者的醫(yī)療負(fù)擔(dān)。”金曄說。

          在她看來,2019年,國家衛(wèi)健委在全國部署罕見病診療協(xié)作網(wǎng)絡(luò)。北京協(xié)和醫(yī)院作為唯一的國家級牽頭單位承擔(dān)協(xié)作網(wǎng)醫(yī)院轉(zhuǎn)診申請、會診教學(xué)和公益性遺傳檢測的任務(wù),目前該網(wǎng)絡(luò)已覆蓋全國400多家醫(yī)院。在此基礎(chǔ)上,大模型能夠優(yōu)化提升醫(yī)療機(jī)構(gòu)間協(xié)作的效率、自由度和合理性。

          與此同時,在罕見病誤診、漏診率高企背后,一個不可忽視的問題就是罕見病醫(yī)生的稀缺。面向醫(yī)生的專業(yè)版能夠展示從癥狀到診斷的關(guān)鍵節(jié)點與分支邏輯,可視的決策過程不僅可以為患者提供科學(xué)有效的診療建議,還能夠幫助醫(yī)生快速掌握診療思路。

          金曄認(rèn)為,任何AI工具均不能替代醫(yī)生在診療中的作用。但與國家和省級牽頭醫(yī)院醫(yī)生相比,大模型對于基層醫(yī)生診療能力的提升幫助更大,通過人機(jī)協(xié)作,基層??漆t(yī)生也可以開展高水平診療。

          如何抑制AI幻覺?

          數(shù)據(jù)是大模型的底座。通常來說,其質(zhì)量和數(shù)量直接影響大模型的性能和準(zhǔn)確性。但第一財經(jīng)了解到,“協(xié)和·太初”用于學(xué)習(xí)的數(shù)據(jù)量并不大。

          金曄解釋說,通用大模型往往需要利用最經(jīng)典的教材和大量的數(shù)據(jù),實現(xiàn)訓(xùn)練和調(diào)優(yōu)。但罕見病領(lǐng)域病種繁多,且有些病種全世界通常只有幾例或者十幾例病例,甚至可以說“擁有幾百例以上病例”就是國際上較大的臨床隊列了。所以,罕見病的學(xué)科特點和數(shù)據(jù)規(guī)模決定了它天生就不是通用大模型優(yōu)先選擇的解決領(lǐng)域。

          “如何在技術(shù)上解決小樣本學(xué)習(xí)的問題?怎樣通過推理并結(jié)合知識的方式,快速綁定疾病特點?采取何種診斷邏輯?能否在罕見病和與其具有相似表型的常見病之間,作出鑒別診斷?這些既是應(yīng)用難點,也是技術(shù)難點。”金曄說。

          為此,協(xié)和跨學(xué)科大模型團(tuán)隊研發(fā)了主動感知交互、鑒別診斷以及“數(shù)據(jù)+知識”混合驅(qū)動等技術(shù),并引入DeepSeek-R1的深度推理能力。

          該團(tuán)隊受訪研發(fā)工程師認(rèn)為,今年,DeepSeek-R1的橫空出世,論證了通過強(qiáng)化學(xué)習(xí)的方法,能夠有效提高大模型的推理能力。“協(xié)和·太初”大模型采取“數(shù)據(jù)+知識”雙輪驅(qū)動的“小樣本學(xué)習(xí)”模式,結(jié)合大模型的強(qiáng)推理能力,最終實現(xiàn)可信的輔助決策。

          據(jù)其介紹,在“協(xié)和·太初”大模型學(xué)習(xí)時,一般只需要采集并標(biāo)注50個以內(nèi)的罕見病病例和類似規(guī)模的常見病病例,就能初步完善一種罕見病專病的“學(xué)習(xí)”。

          除了知識自主迭代,“能有效抑制AI幻覺”亦是該模型的核心優(yōu)勢之一。而避免AI幻覺的核心是:以嚴(yán)格篩選的數(shù)據(jù)和經(jīng)深度治理的知識對模型的推理過程進(jìn)行約束。

          受訪研發(fā)工程師認(rèn)為,如果沒有高質(zhì)量數(shù)據(jù)和高精度知識的約束,AI幻覺將難以避免。罕見病數(shù)據(jù)在互聯(lián)網(wǎng)平臺上非常稀缺。如果讓大模型通過海量公開數(shù)據(jù)去學(xué)習(xí),勢必存在數(shù)據(jù)偏差,大模型的診斷推理過程也會產(chǎn)生知識幻覺——大模型可能利用自身在互聯(lián)網(wǎng)數(shù)據(jù)上學(xué)到有偏的知識,去做推理過程的補(bǔ)全。

          “所以,我們需要讓大模型的診斷決策過程與醫(yī)生的臨床思維高度契合,以規(guī)避幻覺的產(chǎn)生。”該工程師說。

          “協(xié)和·太初”引入了DeepSeek-R1的深度推理能力,并將其與北京協(xié)和醫(yī)院高精度的知識和病例進(jìn)行結(jié)合,實現(xiàn)低幻覺AI推理。

          金曄表示,確保學(xué)習(xí)數(shù)據(jù)來源于協(xié)和,既是出于數(shù)據(jù)質(zhì)控的考量,也是因為這些院內(nèi)數(shù)據(jù)凝結(jié)著大量專家的循證決策依據(jù)和多學(xué)科推理的邏輯。

          罕見病面向特定人群,對診斷治療非常嚴(yán)謹(jǐn),需要有專業(yè)機(jī)構(gòu)和醫(yī)生把關(guān),所以由他們對患者用于公共服務(wù)方式才最能體現(xiàn)價值。

          “醫(yī)療問題比較復(fù)雜、容錯率低,需要謹(jǐn)慎、再謹(jǐn)慎地對待。我們相信通過優(yōu)選知識和病例去訓(xùn)練,比較踏實和穩(wěn)妥。” 金曄說。

          與此同時,大模型應(yīng)用后,需要不斷迭代優(yōu)化。未來,該研發(fā)團(tuán)隊或?qū)①x予“協(xié)和·太初”更多科研用途,那么保障高質(zhì)量的數(shù)據(jù)則更為關(guān)鍵。

          金曄還提到,對于其他常見疾病,AI for Healthcare和AI for Science是相對獨立的,但由于罕見病95%都沒有有效藥物,在罕見病領(lǐng)域需要把醫(yī)療和科學(xué)智能應(yīng)用進(jìn)行結(jié)合。“所以,從‘協(xié)和·太初’大模型設(shè)計的一開始,我們就考慮了今后多個擴(kuò)展性可能,尤其需要更強(qiáng)大的AI for Science能力的支持。”金曄說。

          舉報
          第一財經(jīng)廣告合作,請點擊這里
          此內(nèi)容為第一財經(jīng)原創(chuàng),著作權(quán)歸第一財經(jīng)所有。未經(jīng)第一財經(jīng)書面授權(quán),不得以任何方式加以使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。第一財經(jīng)保留追究侵權(quán)者法律責(zé)任的權(quán)利。
          如需獲得授權(quán)請聯(lián)系第一財經(jīng)版權(quán)部:banquan@yicai.com

          文章作者

          一財最熱
          點擊關(guān)閉