MUG-U是一个强大的多模态大语言模型(MLLM),支持文本、图像、视频等多种输入,能够帮助用户轻松完成复杂的多模态任务。它在多个基准测试中表现卓越,平均准确率高达71.4%,并提供简单易用的API接口,方便快速上手。