一个开源的LLM训练与推理一体化平台,让大模型的开发和部署变得简单高效。
Perceiver IO是DeepMind的Perceiver IO的非官方PyTorch实现,支持分布式训练,具有通用输入处理能力,适用于图像、文本和音频等多种任务,设计高效,能够处理大规模数据。
建立在HuggingFace模型和PyTorch Fully Sharded Data Parallelism基础上的训练套件,旨在优化吞吐量,简化在资源受限环境中训练中型模型的分布式方案设置工作流程,尤其适用于学术集群。
一站式AI开发平台,支持机器学习、深度学习和大模型开发。它提供从数据管理到模型部署的全流程支持,涵盖在线开发、分布式训练、推理服务等功能,帮助企业和开发者高效构建AI应用。
一个高效的深度学习训练框架,旨在简化模型训练和优化过程,提供了多种预训练模型和工具,适用于计算机视觉任务。
accelerate是一个工具,可以帮助用户在多种设备上简单地运行PyTorch训练脚本,支持多GPU和TPU训练,并提供了易于集成的解决方案。它使得混合精度训练变得简单,同时支持分布式训练,用户可以通过命令行接口轻松启动训练任务。
Efficient Large LM Trainer 是一款专为大规模语言模型设计的高效训练工具,旨在通过优化的算法和资源管理,提升训练速度并减少内存占用,支持多种硬件设备,便于用户集成和使用。
一个全面的大型语言模型(LLM)教学项目,涵盖LLM基础知识、科学家和工程师的相关内容。课程内容包括数学、Python编程、神经网络基础和自然语言处理技术,旨在深入理解LLM架构、数据准备、分布式训练和超参数调整。该项目专注于运行LLMs、构建向量存储和优化推理,同时提供监控、评估方法和安全性保障。
metaseq是一个用于训练和评估大型序列模型的框架,旨在简化和加速大规模模型的开发过程。
大规模机器学习是一个网站,提供来自顶尖科技公司的机器学习系统的见解,涵盖分布式训练、特征存储、设备模型部署、对抗样本的稳健性、行业角色等主题。
机器学习系统教程:个人学习笔记和代码分享平台,专注于机器学习与系统结合的实践和理论,适合对AI技术有兴趣的初学者和研究者
《2000 Machine Learning Prompts》是一个全面的资源,旨在帮助爱好者学习和实验机器学习,使他们熟悉其功能和在不同上下文中的应用。
Best AI Jobs是一个领先的人工智能职位板,提供超过2000个AI职位列表,涵盖人工智能软件工程师、AI开发者、机器学习工程师等各种角色。
FreeAiKit是由Prgmine提供的一套AI工具,旨在帮助用户完成各种与AI相关的任务,且免费提供。用户可以通过访问网站浏览工具,每个工具都有详细的描述和使用说明,用户可根据指南选择所需工具并应用于AI项目。
这个开源项目的功能是对类似 #ChatGPT# 的模型进行简单、快速且经济实惠的 RLHF 训练。
动手学深度学习的教材和课程
AIJobs.ai是一个全面的平台,彻底改变了AI行业的求职和招聘过程。它为开发者、设计师、营销人员等提供了经过精心策划的最佳AI工作列表。该平台旨在为求职者和公司简化招聘流程,通过连接顶尖人才与AI行业的领先公司,实现高效的招聘体验。