AirLLM-低内存下运行大型语言模型官网

AirLLM 可以让你的 70B 大型语言模型在单个 4GB GPU 卡上运行推理，或者让 405B Llama3.1 在 8G 的 GPU 卡上运行。
AirLLM的特点:
1. 支持在低内存 GPU 上运行大型语言模型
2. 逐层加载和执行模型，提高内存利用率
3. 支持多种大型模型，如 70B 和 405B Llama3.1
4. 基于 Transformer 架构的高效推理
5. 节省 GPU 内存，仅需存储当前执行层的参数

AirLLM的功能:
1. 在 4GB GPU 上运行 70B 模型的推理
2. 在 8GB GPU 上运行 405B Llama3.1 模型的推理
3. 逐层加载模型以优化内存使用
4. 在推理过程中动态释放内存以适应更多计算

相关推荐

NGPT 计算机助手-跨平台的 GPT 应用助手

一个开源项目，旨在将 GPT macOS 应用功能提供给 Windows 和 Linux 系统使用。该助手集成了多种功能，帮助用户更高效地利用 GPT 技术，无论是在编程、语音输入还是知识管理上，都能提供强有力的支持。

NLlama 2 Everywhere (L2E)-让Llama 2在各种设备上流畅运行

Llama 2 Everywhere (L2E) 是一个友好的llama2.c的分支，旨在使Llama 2 LLM架构能够在各种设备上兼容运行，从Chromebook到企业高密度单核部署。该项目提供了多种构建目标，利用不同的库和工具来提高性能和可移植性，确保用户能够在不同的环境中高效使用Llama 2。

NPydantic AI Agents Tutorial-构建AI Agent的逐步教程

关于如何使用 Pydantic AI 和本地模型（如 Ollama 或其他 OpenAI 兼容模型）构建AI Agent的逐步教程。该教程提供了详细的指导，帮助用户理解如何将 Pydantic 与 AI 模型结合起来，并实现有效的数据验证和模型定义。

ChatGPTify

ChatGPTify是一个开源项目，它结合了ChatGPT和Spotify，用于生成Spotify歌单。通过使用ChatGPT算法，它可以与用户进行聊天，了解他们的音乐偏好和口味。然后，它利用Spotify的音乐数据库，基于用户的喜好和要求，自动生成适合他们的个性化歌单。这个项目使用了机器学习的技术，并且是开放源代码的。

Nfirew0rks-终端里的烟花奇观

一个可以播放文本艺术动画的神奇工具，让你在命令行界面也能享受视觉盛宴，提供动态的烟花效果和多种自定义选项。

NUpscale-A-Video-用 AI 提升视频画质

Upscale-A-Video 是一个利用人工智能技术提升视频画质的工具，支持多种视频格式，提供简单易用的界面，能够处理长时间的视频，优化视频质量，减少噪点与模糊。

chatgpt-telegram-bot

这个开源项目是一个Telegram机器人，它使用Python编写，可以使用OpenAI官方的ChatGPT API提供回答。它的主要功能是与用户聊天，提供智能化的回答。

jupyterlab_tensorboard_pro

JupyterLab-TensorBoard-Pro是一个TensorBoard插件，为JupyterLab提供了更完善的功能。它能将TensorBoard整合到JupyterLab中，使用户能够更方便地在JupyterLab中使用TensorBoard。这是一个开源项目，用户可以自由使用。该插件专为机器学习任务设计，可以在JupyterLab中方便地进行机器学习相关的操作和监控。

NToolBench-评估开源语言模型的工具

一个基准测试工具，用于研究和评估开源大型语言模型在软件工具操作方面的能力，提供了多样化的软件工具和易于使用的基础设施，可以直接评估每个模型的执行成功率。

Nunioffice-高性能的 Office 文档创建库

unioffice 是一个用于创建 Office Open XML 文档（.docx、.xlsx 和 .pptx）的库。它用于创建和编辑 docx/xlsx/pptx 文件，目标是成为最兼容和最高性能的 Go 库。

NRecommendation Systems without Explicit ID Features - A Literature Review-推荐系统基础模型的文献综述

本项目提供了一份关于大型预训练基础推荐模型的文献综述，探讨了推荐系统的基础模型及其演变，包括ID嵌入的必要性、替代方案，以及推荐系统向生成范式转变的可能性。此外，还研究了如何利用大型语言模型增强推荐系统的性能，并论述了多模态推荐系统的未来发展方向。

Nchatglm-openai-api-为ChatGLM提供OpenAI风格的API

为清华的LLM ChatGLM-6B以及中文Embeddings模型提供OpenAI风格的API，支持ngrok以及cloudflared tunnel。可以基于ChatGLM快速接入OpenAI生态的某些应用。

NAwesome-LLM-Long-Context-Modeling-长上下文建模的资源汇总

该项目是一个基于大型语言模型(LLM)的长上下文建模相关论文和博客资源列表，旨在汇集关于长上下文建模的必读论文和博客，提供最新的研究成果和技术动态，方便研究人员和开发者获取相关资料。

Nx-cmd-强大的云端工具和脚本引导系统

一个强大的云端工具和脚本引导系统，支持1000+工具和脚本的一键执行，支持多种POSIX兼容shell，提供编程语言运行时环境管理、shell主题美化、交互式CLI工具等功能。

NVision Agent-用于视觉任务的智能代理库

一个利用代理框架进行视觉任务的库，能够快速生成代码，帮助用户完成图像识别任务，简化视觉问题的解决过程。

Nassistant-ui-为AI聊天设计的React组件库

一个为AI聊天设计的React组件库，能帮助开发者轻松搭建聊天界面，支持多种AI模型，让聊天应用的开发更简单快捷

NAwesome-LLMs-Datasets-代表性LLM数据集的汇总

代表性LLM文本数据集大列表，包括预训练语料库、微调指令数据集、偏好数据集、评估数据集和传统NLP数据集

NWhisperX-用于识别字幕的工具

WhisperX 是一个高效的语音识别工具，专门用于生成精确的字幕，支持多种音频格式，适合处理直播或录制的视频内容。

暂无评论

暂无评论...