一个极简的图像处理和GPT/Diffusion模型训练工具,专注于快速实验和简洁操作,提供从初始化到图像生成的高效路径
整理和提供用于构建通用语音、音频和音乐基础模型的数据集列表,以及相关的元数据和获取途径。该项目旨在帮助研究人员和开发者快速找到所需的音频数据集,以便进行模型训练和分析。
Tiny LLM zh 是一个从零开始的小参数量中文大语言模型,旨在帮助学习者快速掌握大模型相关知识。该项目提供了公开的数据和代码,支持多阶段训练和人类对齐技术,使得用户能够轻松入门并进行相关实验。