Mira (Mini-Sora) 是腾讯 PCG ARC 实验室推出的一个高质量长视频生成项目,旨在迈向类似 Sora 的视频生成技术。
文本到视频分数(T2VScore),一个新的评估指标,从文本符合度和视频质量两个维度全面评估视频生成。
Text2Video-Zero是一种基于文本到图像的扩散模型,能够无需预训练实现文本到视频的生成。它结合了文本提示、姿态或边缘指导,支持高质量视频的零样本生成,适用于创作和编辑不同类型的视频内容。
VideoReTalking是一种新系统,能够根据输入的音频编辑现实世界中头部说话视频的脸部,自动生成高质量且口型同步的输出视频。系统使用学习方法处理所有步骤,确保视频中人物的嘴型与音频完美对齐,并根据声音变化表情。
包含10万个压缩驾驶视频的数据集,用于机器学习研究,可用于GPT视频预测模型的实验,还包含编码器/解码器和视频预测模型示例
SORA博物馆是一个集中展示所有OpenAI SORA生成视频的平台,用户可以在这里发现最新和最受欢迎的视频与创意提示,体验Sora带来的创新力量。
E.T. Bench旨在实现开放事件级的视频语言理解,结合视频和语言数据,推动多模态学习的进展。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型