一个强大的 AI 音频生成模型,专注于文本到音频的生成,解决了高质量文本音频对数据集的缺乏和长连续音频数据建模的复杂性问题。
Make-An-Audio的特点:
1. 支持文本到音频的生成
2. 个性化文本转音频生成,修改原有音频风格并插入新的主题音频
3. 音频修复功能
4. 具备 X-to-Audio 的泛化能力,支持图片转音频和视频转音频
5. 输出高质量、高保真的音频流
Make-An-Audio的功能:
1. 通过输入文本生成对应的音频
2. 上传音频并修改其风格,同时插入新主题
3. 修复损坏或不完整的音频
4. 将图片转化为音频,生成与图片内容相关的声音
5. 给定视频,为其配音生成音频
相关推荐
暂无评论...