关于大型语言模型(LLM)定制训练和推理的全面指南,提供策划的教程、最佳实践和现成的代码。
从零开始构建大型语言模型的学习记录,记录了一步步构建语言模型的过程,适合想要深入了解NLP和机器学习的爱好者。
MosaicML 提供的示例项目,旨在帮助用户更好地理解和使用其机器学习工具和框架。该项目包含多种模型训练示例,特别是针对大型语言模型(LLM)的应用。通过高效的资源管理和优化建议,集成了 FSDP(Fully Sharded Data Parallel)以提升训练性能,并提供详细的文档和使用指南,方便开发者快速上手。
CodeGPT 是一个免费的 JetBrains 插件,提供对先进大型语言模型(如 GPT-4、Claude 3、Code Llama 等)的访问,以增强程序员的编程体验和效率。该插件集成在 JetBrains 开发环境中,支持多种编程语言,帮助开发者更轻松地编写和优化代码。
adapt-demos是一个轻量级的工具集,旨在快速和轻松地演示大型语言模型(LLM)的功能,支持多种模型的比较与安全过滤,便于用户保存对话记录,简化AI模型的演示过程。
LangSmith是一个旨在帮助开发者缩小原型与生产之间差距的平台,专为构建和迭代能够利用大型语言模型(LLMs)的产品而设计,既能发挥其强大能力,又能应对其复杂性。
LLMChat是一个全栈Web界面的实现,支持多种大型语言模型,如ChatGPT或LLaMA,旨在提供用户友好的互动体验。它允许用户进行实时对话,并具备可定制的模型参数,方便多种部署选项。
open-llms项目整理了可商用的大语言模型列表,并详细列出了各模型的许可协议,旨在为用户提供最新、全面的信息,方便用户在选择和使用这些模型时进行比较和决策。
一个关于Embedding的详细项目,涵盖了Embedding的概念、应用和实现方法。
该项目总结了大语言模型的微调技术,探讨了指令微调和对齐微调的方法,旨在提升模型在特定任务上的表现。