音频处理 | AI-magic

可本地部署的AI语音工具箱，提供语音识别、语音转写、语音转换等功能，支持音频处理、数据集创建和模型训练，适用于音频文件到理想语音模型的转换。

一个用于人声分离的工具，旨在帮助用户从音乐中去除人声，保留伴奏。

深度学习音频处理技术笔记

这是一个能够将一种歌声转换为另一种歌声的模型，支持任意源歌声到任意目标歌声的转换，基于神经网络实现高效的声线合成，并能处理多种音频格式，提供用户友好的接口和文档。

Diart是一个优化方案的代码实践，构建在pyannote-audio模型之上，旨在实时识别不同的说话人，特别适用于实时音频流（如来自麦克风）的场景。

noScribe是一个结合了OpenAI Whisper和pyannote技术的语音转录及说话人识别界面，旨在提供高效、用户友好的音频处理体验，支持多种音频格式的输入，能够快速准确地转录语音并识别说话人。

Vocal Remover是一个前沿的AI工具，旨在简化音频轨道的人声隔离过程，方便音乐制作人、DJ和卡拉OK爱好者创建伴奏或无伴奏版本。

这是一款AI降噪工具，帮助人们使他们的声音更清晰。只需一键点击，人们就可以为他们的视频获得专业的音效。它还提供了专业的AI音频处理解决方案，允许用户本能地调整声音/噪音比例。