AI开源项目

LISA-语言与视觉模型结合的分割助手

LISA是一个将语言大模型(LLM)与其他视觉模型(如SAM)结合的分割助手,旨在根据复杂和隐含的查询文本输出分割掩码。

LISA是一个将语言大模型(LLM)与其他视觉模型(如SAM)结合的分割助手,旨在根据复杂和隐含的查询文本输出分割掩码。
LISA的特点:
1. 支持复杂的推理任务
2. 融合世界知识进行推理
3. 生成解释性答案
4. 支持多轮对话
5. 具备强大的zero-shot能力

LISA的功能:
1. 根据自然语言指令生成图像分割掩码
2. 进行复杂推理的图像分析
3. 在无推理数据集上进行训练以提取信息
4. 用于评估图像与指令的匹配度

相关推荐

暂无评论

暂无评论...