从零开始构建大型语言模型的学习记录,记录了一步步构建语言模型的过程,适合想要深入了解NLP和机器学习的爱好者。
关于大型语言模型(LLM)定制训练和推理的全面指南,提供策划的教程、最佳实践和现成的代码。
这是一个关于几何生成模型(GGM)的教程资料,旨在帮助用户理解和实现各种生成模型。它提供了理论背景、实际应用示例,并支持多种模型的实现,同时包含易于使用的代码示例以及最新的研究进展。
nanoGPT是一个从零开始构建的深度学习语言模型,旨在复现Karpathy的GPT-2模型。该项目提供了详细的代码与视频讲解,帮助用户深入理解并实现深度学习语言模型,特别适合初学者学习深度学习与自然语言处理。
手把手带你实战 Huggingface Transformers 课程视频和资料,帮助学习者掌握自然语言处理技术。
一本深入浅出的指南,从基础到在AWS上部署高级LLM和RAG应用程序,使用LLMOps最佳实践
Dataflowr Notebooks是一组用于数据科学和机器学习任务的Jupyter笔记本,旨在提供可重用的代码示例和模板,帮助用户高效进行数据分析和模型开发。
AI Models是一个旨在提升小型到中型免费及开源AI项目的合作平台。通过提供一个精心策划的AI模型汇编,简化探索和比较不同模型的结果,同时强调用户友好的内容,展示演示和插图,而非复杂的技术术语。
该项目提供了在ACL 2022上展示的有限数据学习技术的资源和教程,帮助用户掌握相关方法。
基于FLUX.1的IPAdapter模型的ComfyUI插件实现,支持通过参考图像来控制生成结果。该项目提供了完整的模型权重和工作流程,可在ComfyUI中快速部署使用,同时也支持在线体验版本。
这是一个关于状态空间模型的论文集合,旨在作为Transformer/注意力机制的替代方案。
一个包含双曲嵌入、双曲模型和双曲应用相关论文的综合资源库,旨在提供最新的研究成果和实用工具,帮助研究者和开发者更好地理解和应用双曲表示技术。