open-tts-tracker是一个专注于收集和比较各类开源文本转语音(TTS)项目的平台,旨在为用户提供最新的TTS模型信息和性能比较,帮助用户选择合适的TTS工具。该项目支持多种语言的文本转语音,拥有用户友好的界面,并且持续更新项目列表,确保信息的时效性。
MyVoice - Speech Assistant 是一款文本转语音工具,旨在帮助失去说话能力或即将失去说话能力的人士,包括失语症患者、肌萎缩侧索硬化症患者和其他语言障碍者。
Typecast AI是一款在线AI语音生成器,能够将文本转换为真实感十足的语音,提供超过400种超现实的声音选择。用户可以为视频、演示、培训材料等创建定制化的生动音频内容。
Cleanvoice AI是一款利用人工智能技术,专门用于清除音频录音中的填充词、口腔声音和口吃的工具。它通过多语言支持、音频改善和时间线导出等功能,提高用户的录音质量,节省编辑时间和精力。用户只需上传音频文件,AI算法便能自动处理,用户可以下载或导出清理后的结果。
整合了Mistral大型语言模型的实时语音转文本系统,基于WhisperLive和WhisperSpeech,提供高性能和低延迟处理。
Fish Speech 1.4 是一个经过 700K 小时语音训练的开源文本转语音模型,支持多种语言,并提供即时语音克隆,具备超低延迟,约1GB的模型重量,模型权重可在Hub上获取。
Speedy Audios是一个便捷的工具,用户可以通过将WhatsApp中收到的音频消息转发给Speedy Audios机器人,快速获取文本版本。该项目旨在帮助用户在几秒钟内处理长时间的音频信息,提升交流效率。
VoiceLingo是一款iOS应用,允许用户将自己的声音转换为多种语言的音频。用户只需录音并选择目标语言,应用便会生成相应的音频输出,方便进行语言学习和交流。
一个综合使用多种技术栈和开发框架的应用,支持高效的音频处理、语音识别、智能交互和数据分析等功能。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型