达摩院开源的视觉-语言预训练的语料库,包含从在线教学视频中提取的多模态数据,支持多种学科的学习和研究。
BRIGHT是一个全球分布式的多模态数据集,旨在支持人工智能在全天候灾害应急中的建筑物损伤评估,提供宝贵的数据资源以助力AI驱动的灾害应对。
一种用于视觉-语言预训练的多模态数据集,通过将图像和文本交错排列,提供丰富的基础知识,帮助模型更好地理解和生成多模态内容
该项目提供了一个面向NLP应用的多模态数据集列表,旨在为研究者和开发者提供丰富的资源,以支持多模态自然语言处理任务的研究和应用。