基于MindSpore的易于使用和高性能的自然语言处理(NLP)和语言模型(LLM)框架,与Huggingface的模型和数据集兼容,支持多种NLP任务。
AntiFraudChatBot是一个基于wechaty框架和微调NLP模型的简单聊天AI,旨在提供防诈骗智能响应。它通过预训练的大模型进行自然语言处理,支持中文,并能够与用户通过微信进行互动,提供有效的防诈骗建议。
SimPO 通过将强化学习转变为有监督的成对损失,提供了一种新的方法来处理序列生成任务。
Orca是一个基于GPT-4复杂解释轨迹的渐进式学习模型,旨在推动自然语言理解与生成的前沿。它设计高效且智能的最先进语言模型,能够与OpenAI的GPT-4和PALM相媲美。
这是一个为机器学习、人工智能和数据科学从业者整理的重要GitHub仓库集合,涵盖了多个主题和技术,提供丰富的资源链接。
面向Stretch 3移动机器人的智能行为开发框架,集成了抓取、操控、导航、LLM代理、语音交互等多项功能。
Gorilla是一个擅长调用各类API的大语言模型,能够通过自然语言查询生成语义和语法正确的API调用。
MobileCPM是一个旨在帮助开发者将大型语言模型无缝集成到移动应用中的工具集,能够实现多种用例的本地模型能力,支持在移动设备上运行并提供多种功能,简化了开发者的集成过程。
BlindChat是一个在浏览器中完全运行的私有对话式AI,旨在保护用户隐私,确保对话内容不被存储,同时提供多种自然语言处理功能,用户可以轻松与AI进行互动。
代表性LLM文本数据集大列表,包括预训练语料库、微调指令数据集、偏好数据集、评估数据集和传统NLP数据集
该项目是一个关于自然语言处理(NLP)数据增强的文献集,收录了多篇相关研究论文和技术资源,旨在为研究人员和开发者提供最新的NLP数据增强方法和应用实例,促进相关领域的研究和开发。
VERSE-65B 是由深圳元象科技自主研发的支持多语言的大语言模型,参数规模为 650 亿,开源的底座模型。
Bilibot是一个基于B站用户评论微调训练的本地聊天机器人,支持文字聊天和通过questions.txt生成针对特定问题的语音对话,旨在提供更加自然的互动体验。
星辰语义大模型TeleChat2是由中国电信人工智能研究院研发训练的大语言模型,是首个完全国产算力训练并开源的千亿参数模型,包含大约1150亿个参数。
nGPT是NVIDIA开发的标准化Transformer模型,基于nanoGPT进行改进,旨在提升训练效率和处理能力。它通过在超球面上的表示学习和标准化过程,实现了对低精度运算的更好鲁棒性,并在不同的上下文长度设置中提供了显著的训练加速。
UFO是由微软开发的专注于Windows操作系统交互的UI代理,能够理解用户的自然语言指令和屏幕的视觉内容,自动执行复杂任务,支持自动化UI操作,易于集成和扩展,提供高度可定制的交互方式。
Aurora是中文版MoE模型,具有强大的自然语言处理能力,基于Mixtral-8x7B的进一步工作,激活了该模型在中文开放域的聊天能力。
DeepSeek LLM是一款拥有670亿个参数的先进语言模型,通过庞大的包含2万亿标记的数据集在英语和中文上进行了从零开始的训练,旨在提供高质量的自然语言处理能力。
Transformers相关文献资源大列表,包含了各种各样的Transformer模型,例如BERT、GPT、Transformer-XL等,这些模型已经在许多自然语言处理任务中得到了广泛应用。此外,该列表还提供了这些模型的相关论文和代码链接,为自然语言处理领域的研究人员和开发者提供了很好的参考资源。
针对特定用例、数据和查询智能适应的 RAG(Retrieval-Augmented Generation)框架,旨在提供可解释、高精度、高效的代理驱动检索工作流程。
手把手带你实战 Huggingface Transformers 课程视频和资料,帮助学习者掌握自然语言处理技术。
nanoRWKV是RWKV语言模型的轻量级实现,专为快速实验与多种语言处理任务设计,兼容RWKV架构,基于nanoGPT优化了性能和效率,易于扩展和自定义。
SimCSE是一个简单的框架,旨在通过无监督和监督的方法进行句子嵌入的对比学习,从而实现高质量的句子表示。
百川智能推出的新一代开源大语言模型,采用 2.6 万亿 Tokens 的高质量语料训练。在多个权威的中文、英文和多语言的通用、领域 benchmark 上取得同尺寸最佳的效果。
哔哩哔哩自研大语言模型,提供多样化的对话和角色扮演功能,支持多种评测基准,具有领先的性能表现
imodelsX是一个专注于自然语言处理的可解释性模型,利用大型语言模型为数据集提供自然语言解释,增强NLP任务的透明度,并支持多种提示和模型选择。
typical-sampling 是一个为 Jax、PyTorch 和 TensorFlow 打造的先进自然语言处理工具,支持典型采样算法,旨在优化模型训练和推理过程,提供易于集成的 API 以提升开发效率。
nlp-notebook 实现了 NLP 领域常见任务,包括新词发现、基于 PyTorch 的词向量、中文文本分类、实体识别、摘要文本生成、句子相似度判断等功能,旨在为用户提供便捷的自然语言处理解决方案。
SmolLM2是一款轻量级语言模型,提供135M、360M和1.7B参数版本,特别适合在各种设备上运行。该模型能够处理多种自然语言处理任务,具有体积小、速度快的特点,非常适合边缘计算和移动设备应用。
Paper QA是一个基于GPT-3的开源项目,旨在通过自然语言处理技术帮助用户解读学术论文。用户可以通过提出具体问题,获取对论文内容的深入解读和分析。该项目具有开放性,用户可以根据需要进行修改和扩展,且每次问答的成本相对较低,适合学术研究和学习使用。