Nebulgym是一款深度网络训练加速框架,用户只需增加几行代码即可显著提升AI模型的训练速度,且无需对现有训练设置进行修改。它支持多种深度学习框架,便于用户快速集成和使用。
nanotron是一个开源工具,旨在简化大型语言模型的训练过程,提供了一种高效的3D并行训练方法,从而更好地利用计算资源。
DeepSpeed Chat是一个系统框架,可以在模型训练中加入RLHF流程。它支持各种规模的高质量类ChatGPT模型的训练,包括千亿级大模型的一键RLHF训练。
旨在探索一种新的实验性模型训练流程,以训练高性能的特定任务模型,将训练过程的复杂性抽象化,使从想法到性能优越的完全训练模型的过程尽可能简单。用户只需输入任务描述,系统将从头开始生成数据集,将其解析为正确格式,并微调LLaMA 2模型。
ChatGLM_multi_gpu_zero_Tuning是一个结合deepspeed和trainer的框架,旨在高效实现多卡微调大模型,目前支持LoRA、Ptuning-v2和Freeze三种微调方式,能够充分利用多卡资源,简化微调流程,适用于研究和开发.
Teachable Machine是一个创新的AI工具,旨在简化机器学习模型的创建和实现,使任何人都能在没有编码知识的情况下训练模型来识别图像、声音和姿势。该平台致力于让机器学习变得易于理解,适合教育工作者、学生、爱好者和专业人士,简化AI概念的应用。
cl-waffe2是一个基于Common Lisp的图和张量抽象的深度学习框架,具有可扩展性、内联优化、图优化、可视化和调试等特点,旨在为研究和开发提供强大的工具支持。
JupyterLab-TensorBoard-Pro是一个TensorBoard插件,为JupyterLab提供了更完善的功能。它能将TensorBoard整合到JupyterLab中,使用户能够更方便地在JupyterLab中使用TensorBoard。这是一个开源项目,用户可以自由使用。该插件专为机器学习任务设计,可以在JupyterLab中方便地进行机器学习相关的操作和监控。
本项目教你从零开始构建类似 ChatGPT 的大语言模型,涵盖从数据处理到模型微调的各个方面,帮助你深入理解和实现大语言模型。
Einblick AI 是一个AI原生的笔记本,能够自动编写和修复代码,绘制美丽的图表,构建模型等。用户只需提供提示,Einblick的AI代理便能使用Python、SQL和交互组件构建工作流。
Multipack Sampler是一种专门为大型语言模型设计的分布式采样器,旨在实现快速的无填充训练,提升训练效率同时优化资源使用。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型