llama2.cpp 是一个高效的推理库,专为 C++ 开发,支持 CPU 计算,并且未来将支持 CUDA 和 AVX512,旨在提供高效的 Llama 2 模型推理体验,方便集成到各种 C++ 项目中。