Fish Audio Preprocessor 是一组用于音频处理的脚本,功能包括将视频/音频转换为wav格式、音频声音分离、自动音频切片、音频音量匹配、音频数据统计和音频重采样,旨在提升音频处理的效率和便捷性。
Splitter是一个瑞典研究公司,专注于开发基于AI的音频处理技术,服务于全球数百万用户。用户可以通过该平台上传音频文件,利用AI技术从音乐中分离乐器或人声。
Vocal Remover是一个前沿的AI工具,旨在简化音频轨道的人声隔离过程,方便音乐制作人、DJ和卡拉OK爱好者创建伴奏或无伴奏版本。
textlesslib是一个专为无文本口语处理设计的库,集成了多种先进的AI模型,提供高效的音频特征提取,支持多种语言的处理,且开放源代码,易于扩展。
可本地部署的AI语音工具箱,提供语音识别、语音转写、语音转换等功能,支持音频处理、数据集创建和模型训练,适用于音频文件到理想语音模型的转换。
这个开源项目是一个免费的客户端静态网站,使用Open-Unmix的AI模型(UMX-L权重)来进行音乐分离(音源分离)。该项目能够在浏览器中通过WebAssembly运行Open-Unmix模型。
Qwen2-Audio是一个大规模音频语言模型,支持语音聊天和音频分析,能够处理各种音频信号输入并生成文本回应。
DeepSeek-R1-Sistill是量化版本的音频处理工具,旨在适应各种计算环境,能够高效地进行声音处理及分析。
AudioNinja是一个基于AI的平台,提供创新工具用于精确音频分析和处理,能够去除歌曲中的人声,分离单独元素,并找到任何歌曲的调性和BPM,非常适合播客制作人、音乐家和研究人员,凭借其先进技术,提供无与伦比的精度和准确性。
Hance - AI Audio Enhancement利用机器学习算法,能够实时减少噪声、消除回声、增强人声、恢复信号并分离乐器音轨,适用于各种设备,提供API和SDK,方便开发者集成使用。
VirtuozyAI是一个基于AI的音乐创作工具,帮助用户创建专业质量的音乐,提供多种工具和服务。
Stable Audio Open是一个优化的开源模型,旨在使用文本提示生成短音频样本、音效和制作元素,能够从简单的文本输入创建最长47秒的高质量音频数据。
将图像生成、视频生成、音频生成和通用自然语言处理整合到一个界面中,只需一个提示,即可完成所有需求
Cyanite是一个AI驱动的平台,为音乐行业提供音乐标记和相似性搜索解决方案。它利用先进算法自动生成歌曲和目录的全面元数据,为音乐专业人士节省时间和精力。用户可以通过浏览器应用程序或将API集成到现有平台中来使用Cyanite的服务。
AssemblyAI是一个提供AI模型用于语音转录和理解的平台。它提供简单的API,允许用户访问生产就绪的AI模型,能够将音频文件、视频文件和实时语音转化为文本。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型