openai-forward是一个专为大型语言模型设计的高效转发服务,支持OpenAI API的反向代理功能,旨在提升请求处理效率,简化集成过程。
苏秦(suqin)语言大模型全工具链 WebUI 整合包,旨在实现目前各大语言模型的全流程工具 WebUI 整合包,无需编写代码即可拥有自己的定制模型与专属应用。
一个用于端到端架构和大语言模型(LLM)的项目,旨在简化和优化开发过程。
自主管理、社区驱动的本地 OpenAI 兼容 API,能够在消费级硬件上运行 LLM,且无需 GPU。
开源语言模型集合:汇集了各种开源语言模型的资源,旨在推动自然语言处理技术的发展,强调模型的透明度和可访问性,方便研究人员和开发者使用
高性能生产级API,用于托管MLX模型,包括视觉语言模型(VLM)和语言模型(LM),支持多种模型架构,优化资源管理,提供定制化服务
该项目探讨了五种语言大模型在四种语言的五个任务上的表现差异,通过特定方法优化性能,虽然相较于传统方法仍有不足,尤其在处理敏感问题时需注意偏差。尽管LLM在某些方面表现出优势,仍无法完全取代人类标注。文章还讨论了聚合模型标注与人类标注在速度、准确性、成本和偏见方面的权衡。
QuarkIQL是一款先进的AI工具,旨在简化和优化图像API测试,提供强大的功能和直观的界面,使用户能够轻松生成自定义图像和请求。
vLLM是一个高吞吐量且内存高效的推理和服务引擎,专为大规模语言模型设计,具备优化的模型加载与推理速度,能够与多种硬件加速器兼容。
Dolomite Engine是一款用于预训练和微调大型语言模型的超优化库,集成了多项关键创新,包括模型架构、微调方法和系统优化。它旨在提高大型语言模型的训练效率和效果,支持多种模型架构,优化微调过程,并提供系统性能的显著提升。
YaRN是一个高效的上下文窗口扩展工具,旨在提高大型语言模型的上下文处理能力。
Multipack Sampler是一种专门为大型语言模型设计的分布式采样器,旨在实现快速的无填充训练,提升训练效率同时优化资源使用。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型