达摩院开源的视觉-语言预训练的语料库,包含从在线教学视频中提取的多模态数据,支持多种学科的学习和研究。
质衡: 通用基础模型在底层视觉上的基准测试,包含中文版【底层视觉问答】和【底层视觉描述】数据集,以及中文提示下的图片质量评价。
Languify是一个创新的AI学习伴侣,允许学生进行类似于与Siri或Alexa对话的1对1教育互动。通过对话,AI提供量身定制的帮助、解释和资源,以提升学习效果。
一个包含大约4675本中文科幻小说的语料库,可以用于中文科幻小说的人工智能研究。
Super Teacher是一款应用程序,为3到8岁的儿童提供无限的阅读、数学、艺术、诗歌、科学等私人课程。它的设计比私人家教更有效,旨在通过互动的学习形式,让孩子们在积极参与中学习。应用根据孩子的技能和能力进行调整,确保课程的难易程度适中,提供个性化的学习体验,仿佛随时都有私人教师在身边。
WeLoveGPTs是一个精心策划的定制GPT集合,旨在提供ChatGPT的超能力。用户可以添加所需的GPT以获得其强大功能。此外,每周日,用户还可以订阅新闻通讯,接收每周最佳的三个GPT推荐。
终极ChatGPT指南涵盖了ChatGPT的基础知识,包括其架构、能力和局限性。它还教授如何进行提示工程,掌握有效的提示、上下文和控制代码,并探索ChatGPT在写作、支持和翻译等实际应用中的用例。
EducatesAI是一个通过人工智能帮助学生自动生成课程的平台,课程由虚拟教师呈现。同时,EducatesAI还提供实时讲座问答服务,旨在提升学习体验与效率。
Inquistory 是一个旨在支持探究式学习的平台,提供AI工具,帮助教师快速生成课程计划,引导学生进行批判性思维,并评估他们对课程材料的理解。
RL-VLM-F是一个结合视觉和语言的强化学习项目,通过利用基础模型的反馈进行学习,旨在优化多模态任务中的决策过程。
DrivingDojo Dataset旨在通过互动驾驶模拟和知识丰富的模型,推进自动驾驶领域的发展,为AI模型的训练和驾驶行为及场景研究提供支持。
E.T. Bench旨在实现开放事件级的视频语言理解,结合视频和语言数据,推动多模态学习的进展。
Gemini是谷歌最大的AI模型,旨在通过加速人类进步和改善生活给人类和社会带来巨大利益。它在多个领先基准上表现出色,支持不同尺寸的优化:Ultra、Pro和Nano。Gemini从零开始构建为多模态,能够理解、操作和结合文本、代码、音频、图像和视频等不同类型的信息。
关于鸟瞰视图感知的论文资源列表,包括3D目标检测、分割、在线地图和占据预测等,旨在为研究人员和开发者提供全面的工具和文献支持。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型