med-flamingo是一个基于OpenFlamingo-9B和LLaMa-7B构建的模型,能够在医学领域执行少样本的视觉问答任务。该项目结合了CLIP ViT/L-14视觉编码器,并使用约4.7K本医学教科书进行训练,包含0.8M张图像和548M个token,支持1.6M个图像字幕对的生物医学数据集。