VisualGLM-6B-多模态对话语言模型官网

VisualGLM-6B 是一个开源的，支持图像、中文和英文的多模态对话语言模型，基于 ChatGLM-6B，具有 62 亿参数，整体模型共78亿参数。该模型可以在消费级显卡上本地部署，适用于多种视觉任务，具备生成诗歌、评论图像的能力，并且支持低显存需求的量化技术。
VisualGLM-6B的特点:
1. 支持图像、中文和英文的多模态对话
2. 基于 ChatGLM-6B 语言模型
3. 通过训练 BLIP2-Qformer 连接视觉模型与语言模型
4. 开源项目，易于使用和扩展
5. 能够生成诗歌
6. 能够对图像进行评论
7. 使用模型量化技术，显存需求低
8. 预训练基于高质量中文和英文图文对

VisualGLM-6B的功能:
1. 用于多模态对话系统的构建
2. 支持图像与文本的交互式应用
3. 为用户提供自然语言处理和视觉理解的能力
4. 在本地显卡上进行图像生成和处理
5. 进行长视觉问答任务
6. 创作诗歌或艺术性文本
7. 处理和评论各种视觉内容

相关推荐

ExcelGPT

ExcelGPT是一个开源项目，旨在将机器学习技术应用于Excel和WPS。它提供了一个插件，可以让WPS和Excel与ChatGPT进行交互。该项目基于ExcelDNA开发，兼容Office和WPS。通过ExcelGPT，用户能够在Excel和WPS中进行自然语言交互和聊天。

NRevisiting Zeroth-Order Optimization for Memory-Efficient LLM Fine-Tuning: A Benchmark-内存高效的LLM微调基准研究

本项目对零阶优化技术进行了基准研究，重点关注在微调大型语言模型时的内存效率。

NObsidian Ollama-在Obsidian中自动创作笔记

Obsidian插件，可以在Obsidian笔记中直接调用Ollama完成笔记内容的自动创作，提升用户的笔记创作效率，支持多种笔记格式。

Butterfish Shell-为命令行提供AI提示的工具

Butterfish Shell是一个为命令行(bash、zsh)提供AI提示的工具，利用OpenAI的技术为用户提供类似Github Copilot的AI帮助，旨在提高命令行的使用效率，并提供友好的用户交互体验。

NGemini多模态试炼场-构建实时语音与视频代理的工具

Gemini多模态试炼场是一个用于构建实时语音和视频代理的 Python 应用，借助 Google 的新 Gemini 2.0 模型，支持实时语音和视频输入以及音频回应。该应用程序提供两种版本：完整的全栈 web 应用程序和独立的 Python 脚本，方便用户根据需求选择。

AI CLI

“AI CLI”是指一种通过GPT-3这一先进的人工智能模型增强的命令行界面（CLI），由OpenAI开发。这个AI工具旨在理解并执行用自然语言给出的命令，使得传统的CLI体验变得更直观和用户友好。

PDFMathTranslate-PDF文档翻译工具，支持双语对照

一个 PDF 文档翻译及双语对照工具，能够保留文档中的公式、图表、目录和注释等排版，支持多种语言及多种翻译服务。

Lealone-Plugins-丰富的数据库插件和微服务支持

Lealone-Plugins 是一个集合了多种数据库插件和微服务框架多语言支持的项目，旨在为开发者提供丰富的扩展功能，支持 MySQL 和 PostgreSQL 的数据库插件，以及基于 JDK 并发 Skip List 的纯内存存储引擎。该项目提供简化的插件管理和高性能的数据库连接，易于集成和扩展，适合二流产品的收集和管理。

N360LayoutAnalysis-文档版式分析模型与数据集

360LayoutAnalysis是一个专注于自动化文档处理和信息提取的文档版式分析模型及数据集，涵盖多个领域并提供高效的推理能力。

NQlib-人工智能量化投资平台

Qlib是一个专注于量化投资的人工智能平台，支持多种量化策略，提供高效的数据处理和分析工具，具备模型可视化与回测功能，旨在帮助用户进行量化分析与策略优化。

ZodGPT-从OpenAI模型获取结构化JSON输出

ZodGPT是一个工具，利用OpenAI的新0613模型，通过函数调用返回结构化的、全类型化的JSON输出，方便开发者在类型安全的环境中处理数据。

NMangaNinjia-自动为漫画线稿上色的智能工具

MangaNinjia 是一款自动为漫画线稿上色的工具，能够精准地根据参考图进行上色，并且支持通过点控制实现更复杂的上色任务，有望显著加速动漫行业的上色流程。

NJlama-Java实现的LLM推理引擎

Jlama是一个纯Java实现的大规模语言模型推理引擎，支持多种模型格式，能够提供高性能和低内存占用，易于集成到各种应用中。

NHypoGeniC-智能的科学猜想生成工具

一个智能的“科学猜想家”，能借助大型语言模型为开放式研究自动生成猜想，就像给科研人员配备了“思维加速器”，帮助他们在海量数据中快速找到研究方向。