AI完败于人类医生！研究发现：大模型临床决策草率且不安全，最低正确率仅13%

阎荟 2024-07-29 00:00:00 399

最近的一项研究表明，在临床决策方面，人类医生的表现优于大型语言模型（LLMs）。

LLMs在四种常见腹部疾病的诊断准确率从73%到低至13%不等。与人类医生相比，LLMs在遵循医疗指南、订购测试和解释结果方面表现更差。LLMs表现出不一致性，并编造了不存在的指南。LLMs需要重大的临床监督。需要进一步的研究和合作，以优化LLMs在临床环境中的应用。尽管人工智能在病理学、个性化健康改善和疾病预防方面具有潜力，但它还不能取代人类医生在临床决策中的作用。这篇内容对于对人工智能和医疗保健交叉领域感兴趣的人来说非常重要，它挑战了AI可以独立处理复杂医疗任务而无需人类干预的观念。- 人类医生在临床决策方面击败了人工智能（AI）模型。 - 最先进的大语言模型（LLM）的诊断正确率仅为73%，而人类医生的正确率为89%。 - LLM在胆囊炎诊断方面的正确率仅为13%。 - LLM在临床决策中表现草率且不安全，容易遗漏重要信息和给出错误的指导。 - LLM需要大量医生临床监督才能正常运行。 - 目前，AI在医疗领域仍不如人类医生。

奇绩创坛

>>>了解更多创新创业资讯

登录后可评论

上一篇：燃爆！奥运8分钟AI影片火了，巴赫主席：感谢中国黑科技

下一篇：罗永浩评董宇辉离职：忍不了烂人只能创业；小鹏飞行汽车曝光，六轮驱动；唐尼回归「复联」新片，钢铁侠变反派

上一篇：燃爆！奥运8分钟AI影片火了，巴赫主席：感谢中国黑科技下一篇：罗永浩评董宇辉离职：忍不了烂人只能创业；小鹏飞行汽车曝光，六轮驱动；唐尼回归「复联」新片，钢铁侠变反派