Go语言缓存

nanoChatGPT是在nanoGPT基础上，结合了人类反馈的强化学习层，使用Gumbel-Softmax技巧以提高训练效率，适合进行小型模型的快速实验。

这是一个完整的管道，用于在消费硬件上使用LoRA和RLHF微调Alpaca LLM。基于Alpaca架构实现人类反馈的强化学习（RLHF），基本上是ChatGPT的一个变体，但使用的是Alpaca。

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。