分享一份精选机器学习系统的入门资料集合,收集了一系列有关注意力机制、性能优化、量化、长上下文长度和稀疏性等方面的论文、视频和代码库。
nanoGPT是一个用于训练和微调中型GPT模型的最简单、最快的代码库,是minGPT的改进版,旨在为用户提供高效和灵活的模型训练体验。