Lumina-mGPT是一个多模态自回归模型家族,专注于从文本描述生成高质量的图像,能够处理多种视觉和语言任务,具备强大的生成能力和灵活的应用场景。
VisualGLM-6B 是一个开源的,支持图像、中文和英文的多模态对话语言模型,基于 ChatGLM-6B,具有 62 亿参数,整体模型共78亿参数。该模型可以在消费级显卡上本地部署,适用于多种视觉任务,具备生成诗歌、评论图像的能力,并且支持低显存需求的量化技术。