Voice Writer是一个基于AI的语音识别工具,能够实时将语音转录为文本,并自动纠正语法错误。
超简单的类GPT语音助手,采用开源大型语言模型 (LLM) 以响应口头请求,完全在树莓派上本地运行。它不需要互联网连接或云服务支持。
该数据集为SVC/SVS/TTS任务提供高质量的《原神》角色语音数据,支持多种语音风格和角色,包含详细的音频标注和文本转录,适合语音合成、转换及相关研究。
Evai是一款iOS应用,提供私密的AI聊天机器人体验。用户可以随时随地进行安全、智能的对话,所有交互均可离线进行。Evai确保用户的对话完全私密和个性化,帮助用户探索、学习和交流。
ChatTTS Me 是一个将文本转化为自然流畅语音的平台,适用于聊天机器人和虚拟助手,提供优化和富有表现力的对话体验。
ElevenLabs在语音合成领域处于前沿,提供先进的AI语音生成和文本转语音功能,旨在为内容创作者和企业提供简化的自然语言语音转换体验。用户可以创造出极具真实感的配音、有声书及任何形式的口语内容。
一个Demo项目,基于它可以构建自己的React项目,实现与ChatGPT大模型的实时语音交流。
MacGaiver是一个利用计算机视觉技术的macOS助手,能够回答您关于任何应用程序的问题。用户只需按下一个键盘快捷键,即可在当前窗口中询问,获取上下文中的答案,无需离开当前应用。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型