九九九中文无码A∨|亚洲国产成人最新精品|国产AV无码精品色午夜|国产精品久久久久三级无码|日韩欧美一区国产二区在线|欧美另类精品一区二区三区|精品一区二区三区毛片视频网|中文字幕日韩精品一区二区三区

中國企業(yè)報集團(tuán)主管主辦

中國企業(yè)信息交流平臺

微博 微信

網(wǎng)上問醫(yī)斷病,這輪AI行不行?

2023-07-18 10:31 來源:科技日報 次閱讀
 
網(wǎng)上問醫(yī)斷病,這輪AI行不行?

你在網(wǎng)上搜過“我哪哪疼是不是得了啥啥病”嗎?答案可能不盡如人意。但隨著ChatGPT等大型自然語言模型(LLM)風(fēng)生水起,人們開始嘗試用它來回答醫(yī)學(xué)問題或醫(yī)學(xué)知識。

  不過,靠譜嗎?

  就其本身而言,人工智能(AI)給出的答案是準(zhǔn)確的。但英國巴斯大學(xué)教授詹姆斯·達(dá)文波特指出了醫(yī)學(xué)問題和實(shí)際行醫(yī)之間的區(qū)別,他認(rèn)為“行醫(yī)并不只是回答醫(yī)學(xué)問題,如果純粹是回答醫(yī)學(xué)問題,我們就不需要教學(xué)醫(yī)院,醫(yī)生也不需要在學(xué)術(shù)課程之后接受多年的培訓(xùn)了?!?/p>

  鑒于種種疑惑,在《自然》雜志新近發(fā)表的一篇論文中,全球頂尖的人工智能專家們展示了一個基準(zhǔn),用于評估大型自然語言模型能多好地解決人們的醫(yī)學(xué)問題。

  現(xiàn)有的模型尚不完善

  最新的這項(xiàng)評估,來自谷歌研究院和深度思維公司。專家們認(rèn)為,人工智能模型在醫(yī)學(xué)領(lǐng)域有許多潛力,包括知識檢索和支持臨床決策。但現(xiàn)有的模型尚不完善,例如可能會編造令人信服的醫(yī)療錯誤信息,或納入偏見加劇健康不平等。因此才需要對其臨床知識進(jìn)行評估。

  相關(guān)的評估此前并非沒有。然而,過去通常依賴有限基準(zhǔn)的自動化評估,例如個別醫(yī)療測試得分。這轉(zhuǎn)化到真實(shí)世界中,可靠性和價值都有欠缺。

  而且,當(dāng)人們轉(zhuǎn)向互聯(lián)網(wǎng)獲取醫(yī)療信息時,他們會遭遇“信息超載”,然后從10種可能的診斷中選擇出最壞的一種,從而承受很多不必要的壓力。

  研究團(tuán)隊希望語言模型能提供簡短的專家意見,不帶偏見、表明其引用來源,并合理表達(dá)出不確定性。

  5400億參數(shù)的LLM表現(xiàn)如何

  為評估LLM編碼臨床知識的能力,谷歌研究院的專家謝庫菲·阿齊茲及其同事探討了它們回答醫(yī)學(xué)問題的能力。團(tuán)隊提出了一個基準(zhǔn),稱為“MultiMedQA”:它結(jié)合了6個涵蓋專業(yè)醫(yī)療、研究和消費(fèi)者查詢的現(xiàn)有問題回答數(shù)據(jù)集以及“HealthSearchQA”——這是一個新的數(shù)據(jù)集,包含3173個在線搜索的醫(yī)學(xué)問題。

  團(tuán)隊隨后評估了PaLM(一個5400億參數(shù)的LLM)及其變體Flan-PaLM。他們發(fā)現(xiàn),在一些數(shù)據(jù)集中Flan-PaLM達(dá)到了最先進(jìn)水平。在整合美國醫(yī)師執(zhí)照考試類問題的MedQA數(shù)據(jù)集中,Flan-PaLM超過此前最先進(jìn)的LLM達(dá)17%。

  不過,雖然Flan-PaLM的多選題成績優(yōu)良,進(jìn)一步評估顯示,它在回答消費(fèi)者的醫(yī)療問題方面存在差距。

  專精醫(yī)學(xué)的LLM令人鼓舞

  為解決這一問題,人工智能專家們使用一種稱為設(shè)計指令微調(diào)的方式,進(jìn)一步調(diào)試Flan-PaLM適應(yīng)醫(yī)學(xué)領(lǐng)域。同時,研究人員介紹了一個專精醫(yī)學(xué)領(lǐng)域的LLM——Med-PaLM。

  設(shè)計指令微調(diào)是讓通用LLM適用新的專業(yè)領(lǐng)域的一種有效方法。產(chǎn)生的模型Med-PaLM在試行評估中表現(xiàn)令人鼓舞。例如,Flan-PaLM被一組醫(yī)師評分與科學(xué)共識一致程度僅61.9%的長回答,Med-PaLM的回答評分為92.6%,相當(dāng)于醫(yī)師作出的回答(92.9%)。同樣,Flan-PaLM有29.7%的回答被評為可能導(dǎo)致有害結(jié)果,Med-PaLM僅5.8%,相當(dāng)于醫(yī)師所作的回答(6.5%)。

  研究團(tuán)隊提到,結(jié)果雖然很有前景,但有必要作進(jìn)一步評估,特別是在涉及安全性、公平性和偏見方面。

  換句話說,在LLM的臨床應(yīng)用可行之前,還有許多限制要克服。

◎本報記者 張夢然

點(diǎn)贊()
上一條:上海德達(dá)醫(yī)院團(tuán)隊受邀參加美國血管外科協(xié)會年會2023-07-11
下一條:美首例機(jī)器人肝移植手術(shù)成功2023-07-19

相關(guān)稿件

治療帕金森病常備藥多地斷供 網(wǎng)售價高出醫(yī)保價十余倍 2021-10-22
阿里大語言模型“通義千問”亮相 引發(fā)市場關(guān)注 2023-04-12
王毅答記者問 這十五句精彩回應(yīng) 擲地有聲 2021-03-08
關(guān)愛“罕見” 點(diǎn)亮生命之光——我國加速破解罕見病診療和用藥保障之困 2023-03-01
ChatGPT來了 AI企業(yè)如何應(yīng)對 2023-02-14
國務(wù)院國有資產(chǎn)管理委員會 中國企業(yè)聯(lián)合會 中國企業(yè)報 中國社會經(jīng)濟(jì)網(wǎng) 中國國際電子商務(wù)網(wǎng) 新浪財經(jīng) 鳳凰財經(jīng) 中國報告基地 企業(yè)社會責(zé)任中國網(wǎng) 杭州網(wǎng) 中國產(chǎn)經(jīng)新聞網(wǎng) 環(huán)球企業(yè)家 華北新聞網(wǎng) 和諧中國網(wǎng) 天機(jī)網(wǎng) 中貿(mào)網(wǎng) 湖南經(jīng)濟(jì)新聞網(wǎng) 翼牛網(wǎng) 東莞二手房 中國經(jīng)濟(jì)網(wǎng) 中國企業(yè)網(wǎng)黃金展位頻道 硅谷網(wǎng) 東方經(jīng)濟(jì)網(wǎng) 華訊財經(jīng) 網(wǎng)站目錄 全景網(wǎng) 中南網(wǎng) 美通社 大佳網(wǎng) 火爆網(wǎng) 跨考研招網(wǎng) 當(dāng)代金融家雜志 借貸撮合網(wǎng) 大公財經(jīng) 誠搜網(wǎng) 中國鋼鐵現(xiàn)貨網(wǎng) 證券之星 融易在線 2014世界杯 中華魂網(wǎng) 納稅人俱樂部 慧業(yè)網(wǎng) 商界網(wǎng) 品牌家 中國國資報道 金融界 中國農(nóng)業(yè)新聞網(wǎng) 中國招商聯(lián)盟 和訊股票 經(jīng)濟(jì)網(wǎng) 中國數(shù)據(jù)分析行業(yè)網(wǎng) 中國報道網(wǎng) 九州新聞網(wǎng) 投資界 北京科技創(chuàng)新企業(yè)誠信聯(lián)盟網(wǎng) 中國白銀網(wǎng) 炣燃科技 中企媒資網(wǎng) 中國石油化工集團(tuán) 中國保利集團(tuán)公司 東風(fēng)汽車公司 中國化工集團(tuán)公司 中國電信集團(tuán)公司 華為技術(shù)有限公司 廈門銀鷺食品有限公司 中國恒天集團(tuán)有限公司 濱州東方地毯集團(tuán)有限公司 大唐電信科技股份有限公司 中國誠通控股集團(tuán)有限公司 喜來健醫(yī)療器械有限公司 中國能源建設(shè)股份有限公司 內(nèi)蒙古伊利實(shí)業(yè)集團(tuán)股份有限公司 中國移動通信集團(tuán)公司 中國化工集團(tuán)公司 貴州茅臺酒股份有限公司