Latte是一种新的潜扩散Transformer模型,用于视频生成,能够从输入视频中提取时空token,并通过Transformer块建模潜空间中的视频分布。该模型在多个标准视频生成数据集上取得了最先进的性能,支持文本到视频生成任务,适用于多种复杂的时空视频生成需求。
包含10万个压缩驾驶视频的数据集,用于机器学习研究,可用于GPT视频预测模型的实验,还包含编码器/解码器和视频预测模型示例
Viddyoze是一个功能强大的AI视频生成和编辑工具,可以在几秒钟内创建令人惊叹的视频内容,用户只需与AI对话即可生成故事板,并在AI驱动的视频编辑器中进行编辑和定制。
Rerender A Video 是视频生成视频的AI工具,能够生成效果好且稳定的视频,适合各种视频处理需求。
Kling Video AI 是一款先进的AI视频生成器,用户只需输入文本描述或上传图片,即可瞬间生成强大的AI视频,帮助用户轻松创建出色的视频内容。
GIMM-VFI是一种新的视频插值方法,它使用运动建模来预测帧之间的运动。该方法通过有效建模真实世界视频中的时空动态,能够生成更高质量的运动视频,并且可以与现有的基于流的VFI工作集成。
Diarupt允许您在产品中构建基于视频的实时AI交互,使用人性化的头像和真实的声音,能够进行长时间的对话,通过易于使用的API和SDK进行暴露。
一个为HunyuanVideo模型开发的ComfyUI封装节点,可在ComfyUI环境中进行视频生成。支持flash_attn和sageattn两种注意力机制,内存占用取决于分辨率和帧数。即使在低分辨率下也能生成质量不错的视频效果。
基于 DeepSeek AI 的数学动画生成器,它使用 Manim 库来自动化地将复杂的数学概念转换为动画,并且支持通过模型优化和训练直接一次性生成高质量的动画。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型