llama.cpp-高性能大语言模型推理库官网

一个开源的高性能大语言模型推理库，旨在通过最小的设置在各种硬件上实现大语言模型的推理，并且提供最先进的性能，支持跨多个设备的分布式推理，兼容多种数据格式。
llama.cpp的特点:
1. 支持多种硬件，包括仅使用 CPU 的设备
2. 提供多种后端支持，如 Vulkan 和 SYCL
3. 支持模型的提前量化，提高推理速度和效率
4. 兼容多种数据格式，包括 float32、float16、bfloat16 以及 1.5-bit 到 8-bit 的量化整数类型
5. 提供一个名为 GGUF 的文件格式，用于高效存储张量和元数据
6. 高性能的推理能力
7. 灵活的模型配置
8. 易于集成和扩展
9. 无外部依赖，支持低配置机器

llama.cpp的功能:
1. 在 CPU 设备上进行大语言模型推理
2. 使用 Vulkan 或 SYCL 后端进行高效推理
3. 通过量化模型提高推理效率
4. 使用 GGUF 格式存储和加载模型数据
5. 在多台计算机上并行运行推理任务
6. 配置模型以适应特定应用场景
7. 在本地运行 LLaMA 模型
8. 在没有显卡的情况下进行模型推理
9. 在高内存机器上实验大模型性能

相关推荐

Hocus-秒级搭建可丢弃的开发环境

Hocus 是一个自托管的应用程序，可以在您的服务器上快速搭建可即刻使用的开发环境，支持多种编程语言与框架，便于与现有工作流程集成，且可自定义环境配置。

EcoAssistant-更经济、准确的LLM助手

EcoAssistant是一个旨在以更经济和准确的方式使用大型语言模型（LLM）的工具，能够提高代码相关问题的回答准确性，提供灵活的接口以支持不同的应用场景，同时优化资源使用，降低计算成本。

NUnitree Go2/G1 Omniverse Integration-机器人数字孪生与模拟测试平台

Unitree Go2/G1机器人数字孪生项目，集成Nvidia Isaac Sim 4.0和Isaac Lab，为机器人研究和开发提供模拟环境测试平台，推动算法创新。

xiaogpt

此开源项目的功能是将ChatGPT集成到小爱音响中。

VideoLingo-一键全自动视频翻译助手

VideoLingo是一款全自动视频翻译的AI工具，能够一键对视频进行字幕切割、翻译、精准对齐和个性化配音，最终生成Netflix级别的字幕和配音。

Build It Figma AI-将设计转化为功能原型的工具

一个Figma和FigJam的widget，支持将绘制或设计的内容转变为功能原型，利用GPT-4V将图像转成代码。

femtoGPT-最小生成预训练 Transformer 的纯 Rust 实现

femtoGPT 是一个使用纯 Rust 编写的最小生成预训练 Transformer 实现，旨在提供轻量级、高效的自然语言生成能力，易于集成和扩展，适合各种机器学习应用。

NAI4Finance-金融领域的强化学习与大语言模型应用

该团队专注于金融领域的强化学习（RL）和大语言模型（LLM）的应用，提供数据收集和量化分析的工具和资源。

NQuantalogic ReAct Agent-智能编程助手，提升开发效率

Quantalogic ReAct Agent是一个智能的编程助手框架，能够像人类一样理解和执行编程任务，帮助开发者更高效地编写代码，支持多种编程语言，并提供用户友好的交互界面。

ModelBox-高效AI推理应用开发框架

适用于端边云场景的AI推理应用开发框架，提供了基于Pipeline的并行执行流程，能帮助AI应用开发者较快的开发出高效、高性能，以及支持软硬协同优化的AI应用。

GPT-4V Web Agent-浏览器上的智能AI助手

GPT-4V浏览器机器人，能够在浏览器中进行视觉识别、控制、导航和执行各种在线任务，提升用户的浏览体验和任务效率。

DB-GPT-智能数据库维护与优化助手

利用LLM的框架，D-Bot能够不断从文本来源中获取数据库维护经验，并为目标数据库提供合理有据的及时诊断和优化建议。

NEscherNet-一种新型视图合成生成模型

EscherNet是一种可扩展的新型视图合成生成模型，无需3D结构，支持任何参考到任何目标新视图。该模型能够在单个消费级GPU上同时生成100多个一致的目标视图，处理任意数量的参考视图和任意相机姿势，建立在现有的2D扩散模型之上，继承强大的网络规模先验，并为每个视图/图像编码相机姿势，提供灵活性和可扩展性。

NAwesome-LLM-RAG-Application-RAG模式的应用与资源汇总

关于使用RAG模式(Retrieval-Augmented Generation)的应用和资源的信息，包括关于RAG技术的综述，以及一些GitHub库和企业级应用的链接，这些应用使用RAG模型来增强自然语言处理和信息检索能力

NOpenGaussian-基于3D高斯的开放词汇理解

OpenGaussian旨在进行点级别的3D高斯基础开放词汇理解，提供先进的3D数据处理能力。

next13-ai-saas

这个平台提供了一个完整的教程，帮助开发者了解如何使用这些技术来构建一个具有人工智能功能的软件应用程序。它的前端使用了Next.js作为框架，React作为UI库，Tailwind作为CSS框架。而后端则使用了Prisma作为数据库工具，Stripe作为支付解决方案。通过这个开源项目，开发者可以学习如何集成这些技术，构建一个功能齐全的SaaS AI平台。

Lace-Rust与Python结合的概率分类引擎

Lace是一个用Rust编写的概率交叉分类引擎，提供可选的Python接口，旨在为科学研究提供高效的机器学习工具。它支持多种概率模型，并具备灵活的可扩展性。

the-art-of-asking-chatgpt

这个开源项目的功能是与ChatGPT交互，通过提出艺术相关的问题来获取回答。

暂无评论

暂无评论...