Google Veo 2 是一个前沿的视频生成模型,能够根据文本或图像创建逼真的视频片段。它与改进版的文本到图像模型 Imagen 3 一同推出,提供更高质量的视觉效果。
Latte是一种新的潜扩散Transformer模型,用于视频生成,能够从输入视频中提取时空token,并通过Transformer块建模潜空间中的视频分布。该模型在多个标准视频生成数据集上取得了最先进的性能,支持文本到视频生成任务,适用于多种复杂的时空视频生成需求。
VideoTuna是一个视频生成模型的精细调优工具,集成了多种AI视频生成模型,支持从文本到视频、图像到视频以及文本到图像的生成,提供预训练、持续训练、后训练对齐和微调等全面的视频生成流程。
Make-Your-Anchor 是一个自动生成具有精确躯干和手部动作的视频的项目,只需一个人的一分钟视频剪辑进行训练。
由S-Lab、南洋理工大学和上海人工智能实验室联合发布的文本驱动的人物视频生成技术,能够根据用户输入的文本描述生成高质量的人物视频,支持多种风格和场景,提供用户友好的操作界面。
Shorts Goat是一款革命性的短视频创作工具,利用AI技术简化视频制作,帮助内容创作者和营销人员轻松生成高质量的短视频,提升在线影响力。
SnackContent是一个人工智能驱动的平台,能够在几秒钟内生成和自动化用户的书面和视频内容创作。它自动创建SEO优化的书面内容,并将其转化为从每日网络数据中获取的短小、易于分享的视频。使用SnackContent,用户可以轻松且经济高效地创建引人入胜的内容,无需灵感或技术技能。
AIShader是一个开源项目,它是由ChatGPT驱动的着色器,可用于Unity。该项目允许用户用AI技术来创建更具吸引力的图形效果。使用AIShader,用户可以更容易地实现光线追踪、阴影、反射、抗锯齿等高级功能。此外,AIShader还支持多个平台,包括Windows、Linux和MacOS。
Stable Video Diffusion 是一个可以本地部署的视频生成模型,旨在通过先进的生成技术创建高质量视频内容。该项目基于生成对抗网络(GAN)技术,支持多种输入格式,能够生成多样化的视频内容,并集成了多种预训练模型,便于用户快速上手。
ArtHeart.ai 是一个顶级的AI角色平台,提供引人注目的视觉效果、丰富的声音和栩栩如生的人物个性。用户可以享受娱乐体验,或成为创作者,通过自己的AI作品实现盈利。
Luvvoice 是一个免费的文本转语音工具,提供语音合成服务,支持多种语言和超过200种声音。用户只需输入文本,选择语言和声音,即可直接收听或下载生成的mp3文件。
Sadtalker AI是一种开源技术,旨在根据音频输入为静态图像进行动画处理,使图像生动起来,适用于各种场景,如社交媒体、教育和娱乐。
nannou-rustgpu-raytracer是一个实时光线追踪项目,使用nannou和rust-gpu实现,旨在展示'周末光线追踪'的实时效果,支持动态场景,易于扩展和修改。
TokkingHeads是一个通过AI技术将静态照片转化为动态动画的平台,用户可以在几秒钟内为自己的照片添加生动的动画效果,赋予肖像新的生命。
Pic2Game 是一个应用程序和网页应用,能够将您的照片转换成看起来像视频游戏中的图像。想象一下,您最喜欢的时刻、家人、朋友、宠物、食物和风景,全部重新想象成您喜欢的游戏中的角色、场景和艺术风格。
YTSummary是一个结合ChatGPT的YouTube视频摘要工具,用户可以通过输入视频链接或使用Chrome扩展快速获取视频摘要。
Vmaker AI是一款在线AI视频编辑器,可以在几分钟内将您的原始视频转化为令人惊艳的视频。它自动添加B-roll片段、背景音乐、转场、字幕等,还能帮助您从长视频中创建短视频、预告片和精彩片段。
VideoLingo 是一款基于人工智能的视频翻译工具,能够轻松快速地将视频翻译成任何所需语言。它提供了一个易于使用的在线平台,用户只需上传视频,选择目标语言,即可即时获得翻译后的视频。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型