语言模型 | AI-magic

保持网络提出了一种新的语言大模型架构，相对于输入序列长度具有线性复杂度，支持并行和循环计算，能够在不增加内存成本的情况下扩展上下文长度，适合进行大规模语言建模和高效推断。最大模型参数可达到67亿个。

最新发布的语言模型，包括编程模型和数学模型，性能更强，支持128K上下文，能生成最多8K的内容。

这是一个精心整理的关于自主驾驶领域大语言模型(LLM)的资源列表，持续更新中。

自我反思检索增强生成（SELF-RAG）是一种新框架，通过检索和自我反思来增强语言模型的质量和准确性。

CoPE是一种新的位置编码方法，允许根据上下文来调整位置，以关注更高抽象级别的序列元素。它能够根据需要计算每个注意力机制头的距离，解决标准Transformer无法解决的计数和复制任务，并在语言建模和编码任务上拥有更好的困惑度（PPL）。

OpenAI LLM开源tokeniser语言模型

TheB.AI提供多种前沿模型，包括语言模型和图像模型，通过易于使用的界面和统一的API接口访问，支持个性化定制，提升AI体验。