kokoroTTS是一个文字生成语音模型,现已推出WASM版本,可以直接在浏览器中运行,支持高质量的语音生成,适配多种硬件,快速生成语音,方便用户在各种场景下使用。
基于ChatTTS的语音合成工具,支持音色抽卡、长音频生成和分角色朗读,简单易用,无需复杂安装。
XTTS是一个强大的声音克隆项目,用户只需提供几秒钟的音频样本,即可创造出高质量的AI语音克隆。该项目具备出色的零样本克隆能力,并且支持多种语言,能够生成更加自然的语调和表达力。
bark.cpp是Suno AI的Bark项目在C/C++中的移植,旨在实现快速的语音合成推理。它支持多种声音模型,具有可扩展的架构,并经优化以适应实时应用场景。
Teameet是一个网页和移动应用程序,允许用户通过人工智能优化音频和视频进行视频会议,提供屏幕共享、转录、翻译和云录制等多种协作工具。
AI实时变声工具
PollySpeak 是一款文本转语音应用,帮助用户克服干扰,提高无障碍性并提升阅读速度。通过逼真的声音,让用户在通勤、锻炼或多任务处理时听书,扫描文件中的文本并转换为音频,同时还能将网页内容转化为语音,是一款极具性价比的应用,且在网络中断时仍能使用。
Neural Speech Synthesis是由Xu Tan和Hung-yi Lee在2022年Interspeech教程中介绍的一种先进的语音合成技术,利用深度学习算法生成自然流畅的语音,支持多种风格和情感,适用于多种应用场景。
Steamship是一个平台,允许用户构建、扩展和监控AI代理,提供无服务器云托管、向量搜索、Webhook、回调等功能。
Talks是一个提供美观优雅的视频会议平台,帮助企业和个人进行工作、创造、销售和谈判。用户可以通过简单的注册和登录创建或加入视频会议,进行有效的沟通和协作。
FolkTalk是一个AI驱动的视频配音平台,旨在帮助视频创作者、品牌和组织以多种语言与受众沟通,扩大影响力。它利用先进的人工智能技术,提供高质量的配音结果,成本效益高且速度快。
Lexi是一个利用AI和语音命令提升文本创作体验的键盘,支持多语言听写和GPT-4编辑功能。
Vaanee AI是一个生成语音的AI工具包,可以在几秒钟内创建逼真的人类语音解说。用户只需在网站上注册账号,上传文本脚本或使用内置文本编辑器撰写内容,选择语音风格和语言,点击'生成'按钮,即可快速获得高质量的语音解说。
Holo AI是一个利用AI技术生成故事和游戏的平台,用户可以轻松写作小说、短篇故事和同人小说,探索不同的粉丝文化、体裁和作者。该平台还提供自定义AI训练功能和文本转语音功能,并确保用户数据的端到端加密。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型