音源分离训练推理WebUI:一个集成了音源分离训练框架和UVR(终极人声消除器)的Web界面,让你能自定义处理流程,轻松安装模型并进行音乐源分离
音频领域的大型语言模型集合,专注于音频处理、理解和生成,为音频语言模型提供丰富的资源和工具
一个强大的桌面应用程序,用于从音频文件中分离人声和伴奏,支持多种音频格式,使用本地模型,提供高效的音频处理速度和用户友好的图形界面。
whisper-cpp-python是whisper.cpp的Python绑定,提供高效的语音识别功能,支持多种音频格式,具有简单易用的API和多线程处理能力。
Grad-SVC是一个基于Grad-TTS的歌唱声音转换项目,采用HUAWEI Noah's Ark Lab的技术,核心算法为扩散,旨在提供高质量的歌唱声音转换,支持多种风格和情感的声音转换,具有用户友好的界面和详细的文档支持。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型