FewCLUE是一个专为中文自然语言处理设计的小样本学习测评基准,提供多种评测任务,支持各种模型和算法的评估,易于扩展和定制,旨在推动中文NLP研究的发展。
一个大模型导航资源,里面收集了几乎全部的模型,具有里程碑意义的论文,排行榜,测试集,训练框架,部署,应用,书籍等
对与LLM对齐技术进行全面综述,包括数据收集、训练方法和模型评估。
该项目旨在通过研究自然语言处理中的组合泛化,提供有效的模型和方法,以提升NLP任务的表现。
一个包含1,645个具有不同种类歧义的数据集及对应的评估方法的项目。