RPG是一种新的无需训练的文本到图像生成/编辑框架,利用多模态LLM的强大推理能力来增强文本到图像扩散模型的组合性。该系统将生成复杂图像的过程分解为子区域内的多个简单生成任务,实现区域化的组合式生成,集成文本引导的图像生成和编辑,显著提高了泛化能力。
Clio Image Maker 是一款便捷的工具,用户可以通过 Whatsapp 或 Telegram 直接创建和编辑图像。无论身在何处,用户都能利用文本或草图生成视觉内容,使用高级编辑功能,移除背景,参考素材,制作变体,提升图像质量等,极大地丰富了用户的创作体验。
Canvas是一个开源的本地macOS应用程序,允许用户探索OpenAI的DALL·E功能,包括图像生成、编辑和变体制作。用户可以轻松创建和修改图像,发挥创意。
DiffusionBee是一款突破性的稳定扩散应用程序,旨在转变计算机上的AI艺术创作。它允许用户通过简单的文本提示生成引人注目的图像,提供图像修改、填充、扩展、放大等工具。该应用程序完全免费,离线运行,优化适用于Apple Silicon Mac,确保用户的数据隐私。
Paint By Text是一个照片编辑网站,用户可以通过书面指令使用AI编辑照片。该项目利用InstructPix2Pix、Replicate、Vercel和GitHub提供无缝的编辑体验。用户只需上传要编辑的图片,并提供描述所希望更改的书面指令,AI算法将分析指令并应用所需的编辑,完成后可下载编辑后的图片。
Chromatic Lens是一款AI驱动的应用程序,使用户能够轻松创建专业的产品图像,帮助企业在竞争中脱颖而出,提升销售额。
vv 是一个终端图像查看器,能够在终端中直接查看多种格式的图像,支持HDR图像处理和透明度设置,让用户在命令行环境中轻松查看和管理图像。
Craftura AI是一个先进的图像生成平台,利用尖端人工智能技术,用户可以创建多样化的高质量图像,包括NSFW内容,充分释放创造力。
Phraser是一个利用AI技术的协作创意工具,能够轻松创建各种类型的内容,包括照片、设备、服装、艺术、设计和渲染风格的图像。它运用机器学习和生成性AI算法,为时尚、音乐等创意领域提供解决方案,旨在为用户带来未来的内容创作体验。
StoryDiffusion专注于长程图像和视频生成,通过一致性自注意力机制生成连贯的图像和视频,创造魔法般的故事。项目支持生成复杂细节的图像和流畅的长视频,并引入语义运动预测器以提高生成的稳定性,适用于多种创意内容生成。
该项目探索文本到图像生成的新方法,重点是集成多个LoRA以创建高度定制和详细的图像。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型