这是一个精心策划的阅读列表,专注于机器心智理论的最新进展,基于EMNLP 2023年关于大语言模型中情境心智理论的论文构建。
GPT-3 的最新更新版本,具有近似 9 岁小孩的心智水平,能够解决复杂的心理状态理解任务,表现出显著的性能提升,适用于多种心理和教育研究场景。
FreeWilly1 是一个基于 LLaMA 65B 的自然语言处理模型,在一些评测中表现优异,适合多种语言生成和理解任务。
Sleeper Agents项目旨在训练能够在安全培训中持续学习和适应的欺骗性大语言模型,以测试和研究其在不同环境中的表现和潜在威胁。该项目使用先进的机器学习技术,分析大语言模型的长期潜在威胁,确保其安全性。
One-GLM是基于GLM架构的项目,移植到了使用OneFlow后端进行训练,能够大幅提升性能和显存利用率。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型