EchoMimicV2是一个数字人项目,支持生成引人注目的半身人体视频,利用音频姿势动态协调策略增强细节表现力,采用阶段特定的去噪损失和无缝整合头像数据,提供新基准用于评估半身人体动画效果。
EchoMimicV2是一个开源的人体动画生成模型,支持通过音频输入生成逼真的半身人物动画,具有引人注目的动作表现力和协调一致的表情与肢体动作,简化了生成流程,适用于多种创作场景。
MusePose是一种用于虚拟人生成的姿势驱动图像到视频框架,其结果质量超越了同一主题中几乎所有当前开源的模型。
Algo是一个专注于视频自动化的数据可视化工作室,能够将数据转化为可扩展的视频内容。用户通过创意和技术两个阶段,进行数据分析、故事板设计、视频制作并最终实现自动化视频创建。
Stable Video是一个最先进的生成AI视频模型,旨在将图像转化为视频或将文本转化为视频,拓展了AI驱动内容创作的边界。
VideoTuna是一个视频生成模型的精细调优工具,集成了多种AI视频生成模型,支持从文本到视频、图像到视频以及文本到图像的生成,提供预训练、持续训练、后训练对齐和微调等全面的视频生成流程。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型