基于预训练语言模型的零样本和少样本NLP的教程,提供了一系列的示例和实用工具,用于帮助研究人员和工程师理解和应用这些技术。
EasyNLP是一个功能全面且易于使用的自然语言处理工具包,支持多种NLP任务,提供丰富的预训练模型,并能与多种深度学习框架无缝集成。它拥有良好的文档和社区支持,旨在简化用户的NLP开发流程。
该项目汇集了最新的大型语言模型与自然语言处理(NLP)的研究论文和相关资源,旨在为研究者和开发者提供一个全面的平台,帮助他们了解和应用各种大型语言模型。
ERNIE是百度于2020年开源的生成式模型,旨在通过深度学习技术提高自然语言处理的能力。
开源中英双语对话模型 ChatGLM-6B 的第二代版本,拥有更强大的性能、更长的上下文、更高效的推理和更开放的协议。
LLaMa2Lang是一个用于微调LLaMa2-7b模型的工具,旨在提升其在非英语语言中的对话能力。由于LLaMa2模型主要基于英语数据进行训练,因此在其他语言上的表现较差。本项目旨在改善这一问题,使LLaMa2能够更好地处理各种语言的对话需求。
PAI-RAG是一个基于大语言模型和多向量数据库的知识库问答系统,提供灵活定制的高效信息检索功能,适用于各种自然语言处理任务,具有良好的扩展性。
LLM Playground 是一个让用户可以免费测试多种大型语言模型的在线平台。用户可以在该平台上探索和比较不同的语言模型,进行自然语言处理相关的实验和应用,帮助开发者和研究人员了解和评估各种模型的性能与特点。
OpenLLaMA是LLaMA模型的开源复现,基于RedPajama数据集进行训练,采用与LLaMA一致的预处理步骤、超参数设置、模型结构、上下文长度、训练步骤、学习率调度和优化器,旨在提供一个高效且可访问的语言模型。
Utopia Criativa是一个致力于探索和应用人工智能及其他颠覆性技术的平台,旨在推动创意产业的发展,并帮助人们理解这些技术如何影响我们的未来。用户可以访问Utopia网站,了解各种服务和工具。
Dioptra是一个开源的数据策展和管理平台,旨在支持计算机视觉、自然语言处理和大型语言模型。它帮助用户策划有价值的未标记数据,注册元数据,诊断模型失效模式,并与标注和再训练系统整合。
nlp-uncertainty-zoo是一个专注于自然语言处理中的不确定性量化方法的模型库,基于PyTorch实现,提供多种不确定性量化工具,支持多种NLP任务,具有良好的可扩展性。
该项目提出了一种在不同领域之间自适应的目标检测方法,旨在提高不同数据集上目标检测的准确性。它通过利用无标签数据的特性,帮助模型在缺乏标注数据的情况下进行有效训练。
这是一个针对图形的少样本学习/元学习算法的综合索引,包括各种最新的方法和策略,按不同标准对算法进行分类,并提供相关论文和实现的链接。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型