MisguidedAttention是一个集合,旨在利用误导信息挑战大型语言模型的推理能力,主要通过修改经典思维实验和谜题来检验模型的鲁棒性。
这是2022搜狐校园算法大赛NLP赛道第一名的开源方案,包含实验代码,旨在提供高效的自然语言处理解决方案。该项目经过优化,能够支持多种数据预处理方式,并提供详细的实验结果和分析,帮助用户更好地理解和应用自然语言处理技术。
smoltropix是为xjdr的entropix采样器提供MLX端口的项目,旨在模仿JAX的实现,支持高效的采样,并且易于集成和使用。
这是一个关于出色LLM推理的小集合,包含文献、博客和文档以及代码,支持TensorRT-LLM、流式LLM、SmoothQuant、WINT8/4、连续批处理、FlashAttention、PagedAttention等技术。
FewCLUE是一个专为中文自然语言处理设计的小样本学习测评基准,提供多种评测任务,支持各种模型和算法的评估,易于扩展和定制,旨在推动中文NLP研究的发展。
OneDiff是一个用于加速扩散模型的工具,提供了一种新的免训练、几乎无损的范式,显著提升模型的迭代速度。
SuperCLUE是一个针对中文大模型的综合性基准测试平台,提供标准化的评估指标和多任务测试能力,旨在帮助研究者评估和比较中文大模型的性能。
斯坦福开发的一种遵循指令的 LLaMA 模型,基于 Meta 的 LLaMA 7B 模型进行微调,性能接近 OpenAI 的 text-davinci-003,支持在单个 GPU 或 CPU 上运行。
vizGPT是一个数据可视化平台,通过聊天界面将上下文数据转化为互动式可视化图表,利用先进的模型生成有意义的视觉表现。
该项目研究如何检测、解释和减轻扩散模型中的记忆现象,旨在提升模型的泛化能力和性能。
斯坦福研究人员的研究,创建能够模拟真实人类性格的AI代理,这些代理在模拟环境中建立关系、创造记忆并形成独特个性。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型