Flashbax 是一个专为与 JAX 范例兼容而设计的库,旨在简化强化学习 (RL) 背景下的体验重放缓冲区的使用。它允许在完全编译的函数和训练循环中轻松利用这些缓冲区,从而加速强化学习过程并简化缓冲区管理。