MARS5是一个开源的文本转语音(TTS)模型,能够在140多种语言中,根据2-3秒的音频参考,复制出色的语音表现,尤其适用于体育解说、电影、动漫等复杂的语调场景。
Sync Labs是一个API,允许用户将任何视频与任意语言的音频进行实时口型同步,无需训练即可实现视觉配音。
Vaanee AI是一个生成语音的AI工具包,可以在几秒钟内创建逼真的人类语音解说。用户只需在网站上注册账号,上传文本脚本或使用内置文本编辑器撰写内容,选择语音风格和语言,点击'生成'按钮,即可快速获得高质量的语音解说。
text-speech.net 是一个免费的在线文本转语音工具,用户可以将文本转换为声音。使用该工具时,用户需连接互联网,打开网站后输入文本,选择语速、语言或性别,然后点击播放按钮即可听到转换后的声音。
Notevibes是一款先进的文本转语音AI工具,能够将书面文本即时转换为自然的语音,支持多种语言和丰富的声音选择,适用于内容创作者、教育工作者和商业专业人士等多种用户。
一个实时文本到语音转换库,通过识别句子片段来实现即时的听觉反馈,适用于需要即时音频响应的应用程序。
LightGPT是由AWS贡献者开发的语言模型,基于GPT-J 6B,经过OIG-small-chip2指令数据集的微调,旨在生成符合特定指令的文本。该模型支持在Amazon SageMaker上部署,并提供了示例代码。
Speaking AI是一个生成语音的基础模型测试版,用户可以通过仅需3秒的输入捕捉到自己独特的音调,实现自然的声音质量。
一种新型的文本到语音模型,通过文字描述生成高保真的语音,无需提前录制人声样本。
FliFlik Voice Changer是一个革命性的语音转换器,旨在提升您的聊天和游戏体验。这个AI语音转换器可以帮助您将声音转换为您想要的任何声音。
Sage Towers 是一个用户生成的大型多人在线游戏,利用生成性人工智能来提升玩家的互动和游戏体验。玩家可以在游戏中与‘活 NPC’进行实时语音聊天,NPC 能够记住玩家的对话并快速作出回应。
MyVocal Voice Synthesizer 是一个先进的声学技术平台,提供即时声音克隆、情感识别及多种声音应用功能,帮助用户创建个性化的声音体验。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型