fastllm-全平台高性能大模型加速库官网

fastllm是一个纯C++开发的全平台大模型加速库，具有无第三方依赖的特性，当前支持国产大模型如ChatGLM-6B和MOSS。该库在单卡上可实现超过10000个token每秒的处理速度，并且能够在安卓设备上流畅运行ChatGLM-6B，同时支持CUDA进行计算加速。
fastllm的特点:
1. 全平台支持
2. 无第三方依赖
3. 支持国产大模型如ChatGLM-6B和MOSS
4. 单卡可达10000+token/s性能
5. 可在安卓设备上流畅运行
6. 支持CUDA加速计算

fastllm的功能:
1. 在支持CUDA的设备上运行以提高计算速度
2. 在安卓设备上部署和运行ChatGLM-6B模型
3. 使用C++进行大模型推理

相关推荐

AIConfig-配置驱动的AI应用开发系统

AIConfig是一个配置驱动和源码控制友好的AI应用开发系统，旨在将提示、模型和参数以源码管理友好的方式进行保存和管理。它支持与代码版本控制系统的集成，方便用户管理和更新AI模型、提示和参数，同时提供易于使用的API接口，兼容多种AI模型和框架。

LLM-Honesty-Survey-探讨 LLM 诚实性的研究资料

探讨 LLM 诚实性的论文和研究资料列表，旨在深入了解 LLM 的自我认知和自我表达能力，并提出了改进这些能力的方法

awesome-gpt-store-汇聚所有自定义GPT模型

该项目包含所有在OpenAI GPT商店中的自定义GPT模型，旨在提供便捷的访问和搜索功能，让用户能够方便地体验和使用各种定制化的GPT。

NPyper-让Python并发变简单的框架

Pyper是一个让Python并发变简单的框架，能够帮助开发者轻松处理数据，适用于ETL系统开发、数据微服务搭建和数据收集，显著提高工作效率。

Barrier-开源KVM软件

Barrier是一个开源的KVM（键盘、视频和鼠标）软件，允许用户在多台计算机之间无缝共享输入设备，支持多种操作系统和显示器配置，提供加密的网络连接，易于设置和使用。

Nultra-scroll-让Emacs滚动如闪电般流畅的插件

ultra-scroll是一个为Emacs设计的插件，旨在提供流畅的滚动体验。它能够在使用现代触控板和高精度鼠标时，确保页面响应迅速且平滑，尤其在处理高分辨率图片和超长行内容时，表现尤为出色。

OneYOLO-更好用的目标检测框架

OneYOLO是一个易于使用的目标检测框架，提供了从零开始深入学习YOLOv5的教程及源码剖析，帮助用户更好地理解和应用YOLOv5模型。

NSpring-Reading-深入了解 Spring 源码的学习资料

带你深入了解 Spring 源码系列学习资料，涵盖了资源加载与访问、Spring 表达式语言、Bean 定义、Aware 接口、核心注解和 Spring AOP 等核心概念和关键功能介绍。

NWhisperS2T-优化的语音转文本管道

WhisperS2T是一个为Whisper模型优化的语音转文本处理管道，支持多个推理引擎，旨在提供高准确率和灵活配置选项的语音识别解决方案。

EasyPhoto-AI肖像画生成Webui插件

EasyPhoto是一款Webui UI插件，用于生成AI肖像画，该代码可用于训练与您相关的数字分身。

GFPGAN

GFPGAN是腾讯开源的AI模型，旨在恢复老照片。用户可以通过上传老照片到测试地址，并使用GFPGAN进行图像修复和恢复。

Segment Anything Fast-高效的图像分割工具

Segment Anything Fast 是一个面向批量离线推断的高效图像分割工具，基于PyTorch实现，旨在提供快速、便捷的图像分割解决方案，适合在本地环境中使用。

NLeffa-虚拟换衣技术，基于注意力学习

Leffa是Meta公司与同济等学校共同研究的虚拟换衣技术，通过注意力学习流场实现可控的人像生成，提供高质量的换装效果，性能优于之前的换衣技术，并可处理多种风格的服装。

NChatPDF-基于PDF的问答工具

为ChatGLM/LLaMA等多种LLM提供了一个好用的基于PDF问答的图形界面，用户可以通过上传PDF文件与模型进行交互，获取所需的信息，界面友好，操作简单，适合各类用户使用。

DeepSeek-V3-先进的开源深度学习模型

DeepSeek-V3 是一个开源的深度学习模型，具有最先进的性能，能够在编程、复杂数学问题和多任务处理等多项任务中表现出色。

Dinosaur-基于JAX的全球大气建模工具

Dinosaur是一个用于全球大气建模的谱动力学核心，采用JAX编写，旨在提供高效的数值计算和强大的可扩展性，适用于气候与天气模型的研究。

God app-一个整合多种生成AI的应用

将图像生成、视频生成、音频生成和通用自然语言处理整合到一个界面中，只需一个提示，即可完成所有需求

ChatGPT-Plus-全套开源AI助手解决方案

ChatGPT-Plus 是一个集成多个大语言模型的开源AI助手解决方案，提供了完整的运营管理后台，开箱即用，支持多种AI绘画和社交媒体工具的集成。

暂无评论

暂无评论...