CodeTF是Salesforce出品的一站式代码类LLM工具库,提供了一套统一的接口用于Code LLM的训练、推导和微调,支持多种模型,易于扩展和集成。
Dolomite Engine是一款用于预训练和微调大型语言模型的超优化库,集成了多项关键创新,包括模型架构、微调方法和系统优化。它旨在提高大型语言模型的训练效率和效果,支持多种模型架构,优化微调过程,并提供系统性能的显著提升。
MosaicML是一家专注于模型训练和微调的公司,发布了一系列新的大型语言模型(LLM),其中包括专为故事创作设计的模型,旨在支持文学创作和儿童教育。
OpenVLA是一个开源的视觉-语言-动作模型,旨在通过高效微调的方式支持多机器人控制,结合了先进的语言和视觉编码技术,能够在多种任务中表现出色,适用于广泛的机器人应用场景。
是参数高效的语言模型微调中最受欢迎的方法之一。该项目探讨了以参数高效的方式进行语言模型的预训练,并引入了一种名为ReLoRA的方法,利用低秩更新来训练高秩网络。
Megatron-LLM是一个专为大规模分布式训练设计的库,旨在高效支持语言模型的预训练和微调。它提供灵活的模型架构配置,并支持多种优化算法,使得用户可以根据需求进行优化和扩展,同时易于与其他深度学习框架集成。
基于 Ray 的 LLM 全生命周期解决方案,包括预训练、微调、部署和服务,支持 Python/SQL API,基于 Ray,易于扩展
ChatLM-mini-Chinese是一个中文对话0.2B小模型,旨在整理生成式语言模型的训练流程,包括数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等。
Terracotta是一个平台,使用户能够快速直观地实验大型语言模型(LLMs),支持模型管理、微调和评估。用户可以安全存储数据,针对分类和文本生成微调模型,并进行定性与定量比较。
一个轻量级LLM应用开发框架,类似于Python requests库的简洁设计理念,提供了90%必需的LLM开发功能。
LlamaIndex是一个简单灵活的数据框架,用于将自定义数据源连接到大型语言模型(LLMs)。它提供业界领先的文档导入、解析、检索、索引、查询和评估能力。开发者可以使用Python和Typescript快速构建LLM应用程序。
Galactica是一个提供用户友好界面的机器学习模型互动网站,用户可以输入数据或使用平台提供的示例数据,实验不同参数并观察模型的输出或预测。
Token.js是一个集成了200多个大型语言模型(LLM)的TypeScript SDK,采用OpenAI格式,支持在客户端运行,无需代理服务器,且为免费开源项目,得到了社区的广泛支持。
由LLM驱动的自主Agent集合,涵盖任务解决、多智能体协作、社会模拟等项目,提供框架、基准评估和相关资源,推动AI代理技术的发展
AI Docs是一个平台,允许用户塑造和训练多个语言学习模型(LLM),以自动化各种任务。这些模型可以导出为API、Telegram机器人或WhatsApp机器人。用户可以使用提供的工具和资源创建和训练自己的LLM,指定所需功能并相应地训练模型。一旦训练完成,LLM可以被导出并集成到不同的应用程序或平台中。
nat.dev是一个开源的LLM(语言模型)测试平台,提供用户友好的界面,方便用户实验不同的LLM模型并分析其性能。用户可以创建账户,选择不同的模型进行测试,输入文本提示,生成响应,并评估生成的输出。该平台还允许用户自定义模型参数,适合高级用户进行微调。
Featherless是一个平台,提供对Hugging Face最新语言模型的访问,用户可以在无需租用GPU的情况下进行文本生成应用。用户只需订阅该无服务器平台,选择所需的LLM模型,即可开始生成文本,适用于各种应用场景。
AutoGen UI是一个支持使用多个代理来开发大型语言模型(LLM)应用的框架。这些代理能够相互对话,以协同解决复杂任务,极大地简化了LLM应用的开发流程,同时具有强大的可扩展性和用户友好的Web界面。