Portal是加载和可视化深度神经网络在图像和视频上的最快方式,基于TypeScript和React构建,并集成了Flask后端,提供高效的深度学习模型操作体验。
LLMPruner是一款专为大语言模型设计的裁剪工具,旨在优化模型性能并减少其参数量。它支持多种模型架构,并提供可视化工具,方便用户了解模型结构和裁剪效果,易于与现有机器学习工作流集成。
Bisheng 是一个开源的大模型运维平台,旨在加速下一代人工智能应用的开发与落地,支持多种大模型的集成,提供高效的开发工具和框架。
大型语言模型(LLM)的chat模板,用于支持transformers的chat_template功能,旨在为不同模型提供一致的输入格式,提供了多个流行模型的示例模板。该项目为开发人员提供了便捷的工具,简化了与不同语言模型的交互流程,确保输入格式的一致性,提高了开发效率。
fragments是一个开源的Next.js模板,旨在通过AI完全生成应用程序,支持多种编程语言和AI模型,由E2B开发。它实现了应用的快速开发,极大地提升了开发效率。
MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的系列端侧大模型,主体语言模型 MiniCPM-2B 仅有 24亿(2.4B)的非词嵌入参数量。经过多种优化与量化,MiniCPM 在多个评测集上表现优秀,适用于移动设备和多模态应用。
RSP项目利用随机帧预测技术进行视觉表示学习,旨在提高学习效率,适用于各种视觉表示任务。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型