本地部署全功能版stable diffusion,支持多种配置和功能,适用于深度学习图像生成任务。该项目允许用户在本地环境中生成高质量的图像,支持多种输入方式和参数设置,能够满足不同的生成需求。
Stable Diffusion长文本加权嵌入工具,突破77个token限制,为Stable Diffusion生成长文本加权提示嵌入,支持与Huggingface Diffusers兼容,适用于Stable Diffusion 1.5、SDXL和3版本,支持无限长度提示和权重调整
这个开源项目通过AI技术创造个性化的艺术品,旨在提高消费品质量并创造独特的艺术品。该项目已经在Colab上试玩,并包含各种好玩的AI应用。用户可以在网页链接上尝试应用,并将其上架到应用市场供使用。该项目还支持使用Colab进行试玩,是一个集成了各种好玩的AI应用的平台。
Majesta AI 是一个经过良好训练的生成式 AI 图像生成工具,能够将您的想法转化为照片、图像或设计。无论是艺术创作、产品设计还是个人项目,Majesta AI 都能帮助用户实现他们的创意,提供独特且高质量的视觉作品。
Diffusion AI 是一款基于人工智能的Windows软件,通过简单的文本输入将创意转化为惊艳的视觉图像,帮助用户释放创造力,生成高质量的视觉效果。
Chinese LLaVA是一个支持中英文双语的开源多模态模型,能够进行视觉与文本的结合对话,具备高效的理解能力和灵活的应用场景,适合商用开发。
SegViT是一个基于纯视觉变换器的语义分割项目,旨在提高图像分割任务的效率和性能。它能够处理多种图像分割任务,适应不同的应用场景,为研究人员和开发者提供了强大的工具。
这是一个Stable Diffusion web UI的插件,旨在简化用户在生成图像时的prompt添加和编辑过程,增强用户体验并与Stable Diffusion无缝集成。
OctiAI是一个专门为ChatGPT、Mid Journey及其他内容创作AI模型设计的提示生成器。它的主要目标是通过使用图像和文本提示来增强创造力和改善结果。
Visual Electric是首个为创意专业人士设计的图像生成器,提供无限画布和直观界面,简化了AI驱动视觉创作的过程。
CheXagent是一个基于视觉和语言的基础模型,专注于胸部X光片的解读,旨在解决医学图像领域中大规模视觉-语言数据集的有限性等挑战。该模型利用大规模的指令微调数据集CheXinstruct,设计了一个临床大型语言模型(LLM)和一个用于表示X射线图像的视觉编码器,同时连接视觉和语言模态的网络,提供了新的评估基准CheXbench用于系统评估。
这个开源项目是关于Visual ChatGPT研究的,它融合了图像交互功能。通过上传一张图片,用户可以让它帮忙处理成新的图片,并根据用户的提示进行逐步修改。
Stable-Diffusion-NCNN是一个基于C++版ncnn实现的图像生成项目,采用简化的Stable Diffusion算法,特别适合低配置设备,并且仅使用CPU进行计算,能够在内存为8G的环境下运行。
SurgicalSAM是一个高效的手术工具分割项目,支持类提示,旨在提升手术视频分析和医疗图像处理的效率。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型