MedAlign是一个专门用于帮助临床医师遵循电子病历生成数据集的工具,旨在提升医疗数据的质量和一致性。该项目提供了一个基准数据集,包含983个自然语言指令,由15名临床医生策划,涵盖7个专业领域,并提供303个医生编写的参考响应。此外,它还包含276个纵向电子健康记录(EHR),用于指导指令-响应对,同时也可以用于评估六种常规领域语言模型的性能。