VisualGLM-6B 是一个开源的,支持图像、中文和英文的多模态对话语言模型,基于 ChatGLM-6B,具有 62 亿参数,整体模型共78亿参数。该模型可以在消费级显卡上本地部署,适用于多种视觉任务,具备生成诗歌、评论图像的能力,并且支持低显存需求的量化技术。
这个开源项目是关于Visual ChatGPT研究的,它融合了图像交互功能。通过上传一张图片,用户可以让它帮忙处理成新的图片,并根据用户的提示进行逐步修改。
ApyHub是一个为开发者和团队提供强大实用API的平台。开发者可以从目录中发现、测试和管理API,找到最适合自己应用的API,并将其集成到项目中。
收录各种各样的指令数据集,用于训练 ChatLLM 模型,支持多种自然语言处理任务。
cuanto是一个使用create-react-app构建的网络应用,利用人工智能算法执行各种任务,用户无需安装或设置,简单易用。
GPT-3 是一个具有 1750 亿参数的强大语言模型,展示了更大的模型在多种实际任务中表现更好的现象。它在自然语言处理领域具有显著的优势,能够理解和生成多种形式的文本。
ChatGLM-6B是一个支持图像理解的多模态对话语言模型,旨在提供更好的中英文对话体验。它通过增强的英文指令微调数据,解决英文回答中夹杂中文词语的问题,提升了用户的交互体验。
哔哩哔哩自研大语言模型,提供多样化的对话和角色扮演功能,支持多种评测基准,具有领先的性能表现
LAVIS是一个一站式的语言-视觉智能库,支持多种语言-视觉任务,集成多种预训练模型,提供简单易用的API,以及自定义模型的训练和评估,具备高效的推理速度和性能。
Qwen2.5是由阿里云Qwen团队开发的超大型语言模型系列,专注于提供智能、易用、decoder only的语言模型,支持多语言和长文本生成。
StableVicuna是第一个通过强化学习人类反馈(RHLF)进行训练的大型开源聊天机器人,基于Meta的LLaMA模型,利用从ShareGPT收集的用户共享对话进行训练,旨在提供更自然和人性化的对话体验。
Paper QA是一个基于GPT-3的开源项目,旨在通过自然语言处理技术帮助用户解读学术论文。用户可以通过提出具体问题,获取对论文内容的深入解读和分析。该项目具有开放性,用户可以根据需要进行修改和扩展,且每次问答的成本相对较低,适合学术研究和学习使用。
这个开源项目的功能是利用ChatGPT进行对话,并且可以在聊天过程中发送和接收图像,同时能够将对话指令翻译成Stable Diffusion的prompt,并利用Stable Diffusion和ControlNet生成用户想要的图片。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型