无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > 人工智能最新資訊  > 正文

    “AI醫(yī)生”可能要來了!報告稱:在疾病診斷方面,AI已超越人類!

    2025-04-09 17:33 · 稿源:站長之家

    AI 醫(yī)療 (2)

    人工智能醫(yī)生” 已經(jīng)近在眼前。

    站長之家(ChinaZ.com)4 月 9 日 消息:一份報告顯示,人工智能(AI)的實力在醫(yī)療診斷領(lǐng)域也超越了人類。據(jù)說,OpenAI 的比較新人工智能模型 GPT-4 比人類醫(yī)生更出色。當(dāng)?shù)貢r間 8 日,美國斯坦福大學(xué)以人為本人工智能研究所(Stanford Institute for Human-Centered AI)發(fā)布了《2025 年人工智能指數(shù)報告(Artificial Intelligence Index Report 2025)》。根據(jù)該報告顯示,在基于臨床案例的診斷測試中,GPT-4 的準(zhǔn)確率比人類醫(yī)生高出了 16%。報告稱:“總體而言,GPT-4 單獨診斷的性能比較高,結(jié)果也很穩(wěn)定。” 接著又指出:“而人類醫(yī)生單獨診斷的性能較低”、“不過,當(dāng)人類醫(yī)生與人工智能協(xié)作時,根據(jù)使用方式的不同,成果差異很大” 。

    《2025 年人工智能指數(shù)報告》中進行的人工智能與人類醫(yī)生的診斷測試實驗,是以向 GPT-4 和美國的 50 名臨床醫(yī)生(??漆t(yī)生 26 名、普通醫(yī)生 24 名)提供 6 名診斷難度較大患者的案例的方式進行的。之后再將 “GPT-4 單獨診斷”、 “GPT-4 協(xié)作的人類醫(yī)生”、以及“人類醫(yī)生單獨診斷” 的診斷結(jié)果進行比較。首先個實驗是 “GPT-4 與人類醫(yī)生對比”,第二個實驗是 “與 GPT-4 協(xié)作的人類醫(yī)生與人類醫(yī)生對比”,以此來考察診斷的準(zhǔn)確性。

    結(jié)果顯示,GPT-4 診斷組的準(zhǔn)確率中位數(shù)(92%)比僅由人類醫(yī)生診斷的組(76%)高出 16 個百分點。中位數(shù)是指將數(shù)據(jù)排列后位于正中間的數(shù)值。此外,與 GPT-4 協(xié)作的醫(yī)生組的中位數(shù)(76%)僅比人類醫(yī)生單獨診斷的組(74%)高出 2 個百分點,這一差異也并不顯著。關(guān)于準(zhǔn)確率,由兩名未直接參與實驗的內(nèi)科??漆t(yī)生按照預(yù)先設(shè)定的標(biāo)準(zhǔn)進行了獨立評估。他們在不知道每個診斷是誰做出的情況下進行了打分。

    AI 醫(yī)療

    這份報告的評估意義在于,它展示了AI在醫(yī)療現(xiàn)場的地位正在發(fā)生變化 —— AI 不僅被廣泛應(yīng)用于機器人手術(shù)、醫(yī)學(xué)數(shù)據(jù)分析,還包括基于人工智能的癌癥篩查解決方案等諸多領(lǐng)域。但此前它一直停留在輔助醫(yī)生判斷的領(lǐng)域。

    作為全球較具公信力的人工智能白皮書之一,《人工智能指數(shù)報告》得出了“像 GPT-4 這樣的生成式 AI 模型比醫(yī)生診斷得更好”的分析結(jié)果,同時也預(yù)測:在不久的將來,在醫(yī)院里看到 AI 醫(yī)生將成為稀松平常之事!

    報告評價道:“這次實驗結(jié)果總體上表明,GPT-4 診斷的性能比較高、且具有一致性”,“即使 AI 與人類醫(yī)生協(xié)作,根據(jù)醫(yī)生個人的判斷方式和運用能力的不同,結(jié)果也會有所不同”。接著還指出:“最近,在癌癥檢測和重癥患者識別等領(lǐng)域,也有研究表明人工智能的表現(xiàn)優(yōu)于醫(yī)療工作者”、“人工智能的應(yīng)用范圍正在從單純的診斷擴展到更復(fù)雜的臨床判斷領(lǐng)域” 。

    與此同時,在衡量 GPT-4 臨床知識性能的代表性標(biāo)準(zhǔn) “MedQA” 基準(zhǔn)測試中,GPT-4 去年的準(zhǔn)確率達(dá)到了 96.0%。與 2022 年的 67.6% 相比,這一數(shù)值大幅提高了 28.4 個百分點。MedQA 是基于美國醫(yī)生國家考試水平的醫(yī)學(xué)問題而構(gòu)建的測試,用于評估人工智能的臨床知識水平。

    報告還補充道:“有研究結(jié)果表明,人工智能與醫(yī)生的協(xié)作能夠產(chǎn)生理想結(jié)果,因此這一領(lǐng)域?qū)⒊蔀槲磥碇匾难芯空n題”、“但人工智能系統(tǒng)本身也具有一定的潛在風(fēng)險,例如產(chǎn)生與事實不符信息的‘AI幻覺’問題、或不可預(yù)測的錯誤等,人們對其可靠性和安全性仍存疑,因此需要制定考慮到這些風(fēng)險因素的政策應(yīng)對措施” 。

    舉報

    • 相關(guān)推薦