Nexa SDK是一款全面支持ONNX和GGML模型的工具包,具备文本生成、图像生成、视觉-语言模型(VLM)、自动语音识别(ASR)和文本到语音(TTS)功能,提供OpenAI兼容的API服务器,支持JSON模式调用函数和流媒体,配备用户友好的Streamlit UI,方便开发者使用和集成。
一个包含示例应用程序的公共 GitHub 仓库,旨在帮助开发者了解如何使用 OpenAI API 的结构化输出功能来构建更可靠的应用程序。该项目提供了多种编程语言的示例,展示了如何有效地利用 OpenAI 的 API,提升应用程序的可靠性与功能性。
Lemonfox.ai提供了一种简单的API,使用户能够访问开放源代码的AI模型。该项目的LLM聊天AI模型能够节省75%的使用成本,提供与ChatGPT相当的性能,同时还可以使用Stable Diffusion生成高质量的图像。其OpenAI兼容API使得用户轻松切换至该平台。
NExT-GPT 是一个支持多种输入和输出形式的多模态大语言模型,具有灵活的处理能力,可广泛应用于文本、语音、图像和视频等多种场景。
自主管理、社区驱动的本地 OpenAI 兼容 API,能够在消费级硬件上运行 LLM,且无需 GPU。
ChatML是一个聊天标记语言,可以帮助ChatGPT API更好地理解和解析用户的聊天内容。该项目可以让开发者更简单地与ChatGPT API交互,并使聊天内容更易于理解和处理。
这个开源项目提供了一个免费的代理API,可以访问OpenAI的ChatGPT API。这个API可以用于聊天和机器学习等应用。
Cartesia Sonic是一个极其快速的生成语音API,具有135毫秒的模型延迟。它可以帮助用户构建高质量、实时的语音体验,提供多样的声音库、即时语音克隆、语音混合和语音设计,支持速度和情感控制。
在任意应用中用一行代码将商业版LLM(GPT 3.5/4)替换为私有模型(Falcon、GPT4ALL等),旨在提供与OpenAI模型(如GPT 3.5/4)无缝对接的替代方案
InventAI是一个允许用户创建和分享AI生成内容的平台。它拥有创新的网页用户界面,并提供一系列工具和生成器,用于创建令人惊叹的艺术、文本等。用户只需用电子邮件注册并订阅计划,即可访问AI艺术生成器,输入偏好后让AI完成剩下的工作。生成的艺术作品可以分享和下载,供个人使用。
Betalgo OpenAI是一个Dotnet SDK,旨在将OpenAI的各种模型(如ChatGPT、Whisper、GPT-3和DALL·E)轻松集成到.NET应用程序中,支持多种功能,包括文本生成、语音识别和图像生成。
基于 baichuan-7B 进行多任务有监督微调的开源多模态大语言模型,建立在 Pleisto 的以数据为中心(Data-centric AI)的工作上。羽人在多轮对话、开放域问答、角色扮演、文本生成、文本理解、图片理解等多个任务上均拥有优异的表现。
noScribe是一个结合了OpenAI Whisper和pyannote技术的语音转录及说话人识别界面,旨在提供高效、用户友好的音频处理体验,支持多种音频格式的输入,能够快速准确地转录语音并识别说话人。
PatrickStar使得更大、更快、更环保的预训练模型在自然语言处理领域成为可能,推动AI的普及。
Transfusion是一种可以生成文本和图像的训练模型的统一方法,结合了语言建模和扩散的优势。它通过结合下一个Token预测与扩散,在混合模态序列上训练单个Transformer,提供了优于传统方法的扩展性,支持高达7B参数和2T多模态标记。
Producti Ai是一个全面的AI平台,旨在通过AI技术简化和增强内容创作、开发、营销和沟通等任务。它包括AI文本生成器、AI图像生成器、AI代码生成器、AI聊天机器人、AI语音转文本等功能,适用于各种创意和实用应用。
该开源项目是一个名为chatgpt-api的库,最近进行了升级,新版本的官方API已经可以使用。只需要将npm包进行升级即可使用新的功能。这个开源项目的好处在于所有人都可以免费使用和参与开发,推动了开源文明的发展。
Mini-LLaVA是一款轻量级的多模态大语言模型,能够处理图像、文本和视频输入,实现高效且灵活的多模态数据处理。其设计旨在简化多模态应用的开发,提供了简约的实现和灵活的接口,方便用户进行快速开发和实验。