2024第二届全国数字健康创新应用大赛——赛题5：基于大模型的就医导诊模型评估的详细要求和说明

2024第二届全国数字健康创新应用大赛健康医疗大数据主题赛的赛题详细说明如下，请各位参赛选手认真阅读以下要求和说明。

赛题5：基于大模型的就医导诊模型评估（详细说明）

通过人工智能技术，智能导诊系统能够根据患者主诉自动分析患者的病情，并根据疾病类型和症状推荐合适的科室和医生，为患者提供精准的分诊服务。解决了传统导诊过程中可能出现的“知症不知病”、“知病不知科”以及“挂错号”等问题，大大减少了患者的等待时间和就医难度。本赛题需要在综合医院和专科医院的不同场景下，展示其在导诊应用下，通过输入主诉，得到推荐科室，以评价科室推荐的准确性。

1. 数据说明

评测数据将基于真实临床医生与患者之间关于症状、病史、医疗诉求等内容的对话构建的导诊问答题。模型需要分析对话信息，根据患者的症状和体征，为其推荐给定范围内合适的挂号科室，由于对话信息同时存在多个疑似诊断，因此输出需要覆盖所有诊断的对应科室。

评测数据集来自两类医院类型：综合医院和专科医院，专科医院又将细分为儿童、妇产、口腔、中医四类，综合医院以及每类专科医院所包含的评测数据集均被分为验证集和测试集，数据量分别为1000和1000（见表1），以保证模型在不同数据分布上的泛化能力。其中验证集将会随复赛任务发送至复赛参赛团队，团队可自行测试验证效果。测试集为复赛时进行考核的主要内容。

表1 评测数据概述