ultimatevocalremovergui官网

这个开源项目是一款免费的全平台本地化 AI 歌曲去伴奏/人声工具。它可以在各种平台上使用，并且能够去除歌曲中的伴奏或人声。根据测试，使用 MacBook Pro M2 Max 对乌兰图雅现场版的《套马杆》进行处理，只需要一分半的时间。

相关推荐

Real-ESRGAN

Real-ESRGAN是一个开源的AI项目，其主要功能是实用的图像/视频修复算法。

SkyPaint-AI-Diffusion

这个开源项目基于Stable Diffusion进行优化，是一个AI绘画模型。它可以输入中英文文本，并生成多种现代艺术风格的高质量图像。

Vicuna-LoRA-RLHF-PyTorch

这个开源项目是为了在普通消费级硬件上进行Vicuna LLM的微调而提供的一个完整的流程。它结合了LoRA和RLHF，并在Vicuna架构的基础上实现了RLHF（强化学习与人类反馈）。它基本上是一个类似于ChatGPT的项目，但具有Vicuna的功能。

CodeFormer

这是一个AI图像处理工具，可以进行图像增强和去马赛克处理。它使用人工智能技术自动识别马赛克并通过算法去除，提高图像清晰度和质量。同时支持增加亮度、对比度和饱和度等增强处理，可用于图像处理、视觉效果和图像分析等领域。

Chinese-Llama-2-7b

这个开源项目的目标是提供一个中文版本的LLaMA2模型，使用户能够下载并在自己的环境中运行。这是开源社区中首个可供下载和运行的中文LLaMA2模型。

TTS

Coqui TTS是一个开源项目，最新发布了0.15版本。这个版本的功能非常丰富，包括对Bark多语言和语气词的支持，以及语音克隆功能。用户可以通过访问地址/releases/tag/v0.15.0来获取该版本的下载链接。

quivr

Quivr是一个开源项目，可以使用AI对话的方式检索多种格式的文档，例如txt、pdf、语音、视频等。该项目的后端AI支持GPT3.5、4和Claude 100k，并需要使用Supabase服务。

muzic

GETMusic是一个音乐生成项目，它不是生成原始声波，而是生成符号音符。这个项目可以将任何乐器的音轨映射到任何其他乐器上。该项目是由微软、北京大学和人民大学联合出品的。代码可以在/tree/main/getmusic中找到，demo地址为ai-muzic.github.io/getmusic/。

ChatRWKV

ChatRWKV 是一个类似于 ChatGPT 的开源工具，使用了基于 100% RNN 的 RWKV 语言模型。该语言模型是作者对 RNN 进行魔改之后得到的，在性能上已经接近了 transformer，且梯度可以无限走且可以并行化，同时具有 RNN 和 transformer 的所有优点。这个开源项目可以在每个人的电脑和手机上直接运行，可以用于聊天等场景。

backgroundremover

Background Remover是一个开源的命令行工具，利用AI技术，可以快速移除图像和视频中的背景。它使用了u2net这个开源的目标检测算法作为底层技术。

free-music-demixer

这个开源项目是一个免费的客户端静态网站，使用Open-Unmix的AI模型(UMX-L权重)来进行音乐分离(音源分离)。该项目能够在浏览器中通过WebAssembly运行Open-Unmix模型。

ChatGLM-LoRA-RLHF-PyTorch

这个开源项目的功能总结如下：它提供了一个完整的流程，可以在消费级硬件上对ChatGLM LLM进行微调，使用了LoRA和RLHF。该项目在ChatGLM架构的基础上实现了RLHF（人类反馈强化学习）。基本上，它是一个使用ChatGLM替代了ChatGPT的工具。

AudioGPT

AudioGPT是一个开源项目，它能够理解和生成语音、音乐、声音以及说话人形象。除此之外，该项目还提供了可视化工具和人工智能产品。

S.A.T.U.R.D.A.Y

这个开源项目的主要功能是构建一个语音计算工具箱，使用了Pion、whisper.cpp和Coqui TTS等技术。它提供了与WebRTC、音频和人工智能相关的工具，可能包括音频处理、实时通信和语音识别等功能。此外，该项目可能还涉及机器学习和人工智能算法的应用。

DDSP-SVC

本文介绍了一个名为DDSP-SVC 3.0的开源项目，它是一个可以替代低配SO-VITS-SVC的工具。使用该工具，可以用更低的显存和更短的时间训练出模型，生成AI音乐。尽管生成的音乐质量相对较低，但可以用于快速生成音乐。

stable-diffusion-webui

SdPaint是一个AI开源项目，可以根据用户的草图实时生成真实的图片。使用该项目需要后台运行Stable Diffusion web UI。

GFPGAN

GFPGAN是腾讯开源的AI模型，旨在恢复老照片。用户可以通过上传老照片到测试地址，并使用GFPGAN进行图像修复和恢复。

Alpaca-LoRA-RLHF-PyTorch

这个开源项目使用LoRA和RLHF技术，在消费级硬件上对Alpaca LLM进行微调。它基于Alpaca架构实现了RLHF，类似于ChatGPT系统但采用了Alpaca技术。

暂无评论

暂无评论...