Real-ESRGAN是一个开源的AI项目,其主要功能是实用的图像/视频修复算法。
本文介绍了一个名为DDSP-SVC 3.0的开源项目,它是一个可以替代低配SO-VITS-SVC的工具。使用该工具,可以用更低的显存和更短的时间训练出模型,生成AI音乐。尽管生成的音乐质量相对较低,但可以用于快速生成音乐。
这个开源项目的目标是提供一个中文版本的LLaMA2模型,使用户能够下载并在自己的环境中运行。这是开源社区中首个可供下载和运行的中文LLaMA2模型。
这个开源项目的功能总结如下:它提供了一个完整的流程,可以在消费级硬件上对ChatGLM LLM进行微调,使用了LoRA和RLHF。该项目在ChatGLM架构的基础上实现了RLHF(人类反馈强化学习)。基本上,它是一个使用ChatGLM替代了ChatGPT的工具。
这个开源项目是为了在普通消费级硬件上进行Vicuna LLM的微调而提供的一个完整的流程。它结合了LoRA和RLHF,并在Vicuna架构的基础上实现了RLHF(强化学习与人类反馈)。它基本上是一个类似于ChatGPT的项目,但具有Vicuna的功能。
这个开源项目是一款免费的全平台本地化 AI 歌曲去伴奏/人声工具。它可以在各种平台上使用,并且能够去除歌曲中的伴奏或人声。根据测试,使用 MacBook Pro M2 Max 对乌兰图雅现场版的《套马杆》进行处理,只需要一分半的时间。
SdPaint是一个AI开源项目,可以根据用户的草图实时生成真实的图片。使用该项目需要后台运行Stable Diffusion web UI。
Coqui TTS是一个开源项目,最新发布了0.15版本。这个版本的功能非常丰富,包括对Bark多语言和语气词的支持,以及语音克隆功能。用户可以通过访问地址/releases/tag/v0.15.0来获取该版本的下载链接。
这个开源项目使用LoRA和RLHF技术,在消费级硬件上对Alpaca LLM进行微调。它基于Alpaca架构实现了RLHF,类似于ChatGPT系统但采用了Alpaca技术。
GFPGAN是腾讯开源的AI模型,旨在恢复老照片。用户可以通过上传老照片到测试地址,并使用GFPGAN进行图像修复和恢复。
DLTA-AI是一个标注工具,整合了先进的计算机视觉模型,旨在使图像数据集的标注更加容易。它提供了无缝的体验和直观的工作流程,能够进行数据标注、追踪和注释,并且利用了人工智能技术。该项目由Usama Ahmed在GitHub上进行维护。
这个开源项目基于Stable Diffusion进行优化,是一个AI绘画模型。它可以输入中英文文本,并生成多种现代艺术风格的高质量图像。
这是一个AI图像处理工具,可以进行图像增强和去马赛克处理。它使用人工智能技术自动识别马赛克并通过算法去除,提高图像清晰度和质量。同时支持增加亮度、对比度和饱和度等增强处理,可用于图像处理、视觉效果和图像分析等领域。
Background Remover是一个开源的命令行工具,利用AI技术,可以快速移除图像和视频中的背景。它使用了u2net这个开源的目标检测算法作为底层技术。
ChatRWKV 是一个类似于 ChatGPT 的开源工具,使用了基于 100% RNN 的 RWKV 语言模型。该语言模型是作者对 RNN 进行魔改之后得到的,在性能上已经接近了 transformer,且梯度可以无限走且可以并行化,同时具有 RNN 和 transformer 的所有优点。这个开源项目可以在每个人的电脑和手机上直接运行,可以用于聊天等场景。
chatgpt-corpus是一个开源项目,用于提供ChatGPT的中文语料库。该语料库包含了对话、小说和客服语料,用于训练大型模型。这个项目在GitHub上有一个plex仓库,并且有开源和机器学习的标签。
chatgpt.js是一个使用JavaScript和网页版ChatGPT界面进行交互的开源项目,它可以在客户端与ChatGPT DOM进行交互。它提供了机器学习的能力,并且可以用于开发浏览器插件。与调用OpenAI API不同,chatgpt.js使用网页版ChatGPT的界面来实现交互。
这个开源项目是一个语音聊天应用,名为SpeechGPT。它是免费和开源的,支持100多种语言,具有优秀的隐私保护和语音识别、语音合成功能。它使用机器学习技术,用户可以通过在网页上输入文字或语音与ChatGPT对话。
Baby AGI 是一款前沿的人工智能工具,旨在推进人工通用智能(AGI)的发展,强调创造能够以类似于人类认知的方式学习和理解的AI系统。它面向研究人员、开发者和AI爱好者,他们对探索人工智能能力的巅峰及其广泛应用感兴趣。