Spirit LM是一个端到端的语音模型,提供基础版和高表现力版,能够进行高效的语音识别和生成,支持直接使用语音标记等多种特性,适用于复杂任务的处理。
11Cast是一个创新的AI工具,专注于将文本转化为近乎人类的自然语音,适用于各种内容创作和消费场景。它支持多种语言,提供自定义语音选项,适合内容创作者、教育工作者和市场营销人员等多种用户。
Splitter是一个瑞典研究公司,专注于开发基于AI的音频处理技术,服务于全球数百万用户。用户可以通过该平台上传音频文件,利用AI技术从音乐中分离乐器或人声。