GPT-4V是一个扩展大型语言模型的项目,通过视觉理解等多感官技能,增强其通用智能,支持多模态输入和人机交互,具有强大的应用潜力。
MM-LLM是一个增强现有大型语言模型的框架,支持多模态输入和输出,同时保持其推理和决策能力。该项目提供全面的模型架构和训练管道设计,并回顾了在主流基准上的表现,旨在推动多模态任务的发展。
endoftext是一个AI驱动的提示编辑器,类似于Grammarly,但专注于提示优化。它不仅提供建议编辑,还能自动生成测试数据,帮助用户在几分钟内找到最佳提示。
Re.Art是一个强大的AI图像生成器,能够基于用户输入的提示生成高质量的图像,采用先进的Stable Diffusion技术,确保生成的图像视觉效果出众,满足专业标准。
Lusion AI 是一个免费且强大的AI图像生成工具,用户只需输入提示,它便会根据输入生成高质量的图像。
fullmoon-ios是一个开源的iOS本地LLM项目,支持与本地大模型进行聊天,兼容iPhone、iPad、Mac和Vision设备,旨在提供用户隐私保护的同时,方便用户进行多种文本生成和对话交互。
ThinkForMe! 是一个基于AI的平台,利用GPT-4和DALL-E-3快速生成项目创意和自定义图标。用户可以在几秒钟内提出下一个SaaS产品的创意,并获得吸引眼球的图标。该平台提供快速的响应时间,并允许用户通过自定义提示完全控制图像生成。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型