一个用Rust语言编写的极简语言模型(LLM)推理工具,能够在没有机器学习库的情况下,在CPU上进行完整的语言模型推理,支持多种大型语言模型并具备多模态功能。
Inferflow是一个高效且高度可配置的大型语言模型推理引擎,旨在优化推理性能,支持多种自定义配置,以满足特定需求。
该项目是一个集成多种遥感数据源的多模态大语言模型,旨在提升视觉与语言的理解能力,支持遥感数据的分析与应用。
高效LLM推理加速助手:通过并行提示技术提升大型语言模型的推理效率,适用于边缘和移动环境,具有正交优化、内存效率和训练效率三大特点,显著提升速度并保持低内存开销
llama-utils是一个便捷高效的工具,旨在支持用户在本地或边缘设备上运行定制和优化的语言模型(LLM)。它提供简单的操作方式,帮助用户快速部署和管理模型,同时确保高效的性能和资源利用。
一个开源扩展,允许用户在本地环境中使用容器与大型语言模型(LLM)进行交互,支持AI模型下载、推理服务器启动、本地实验场以及AI应用开发
FAQx是一个基于AI算法的性能营销SaaS平台,通过分析广告创意和活动数据,提供即时洞察和优化建议,帮助各行业的企业提升数字广告表现。该平台由市场营销专家构建,连接创意、分析和媒体购买,助力企业做出数据驱动的决策。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型