自校正 LLM 控制的扩散模型,用于自动编辑任何图像或修复生成模型的文本到图像错位,无需额外训练。
SLD的特点:
1. 自我校正:使用 LLM 集成检测器增强生成模型,以实现精确的文本到图像对齐。
2. 统一生成和编辑:擅长图像生成和细粒度编辑。
3. 通用兼容性:可与任何图像生成器(例如 DALL-E 3)配合使用,无需额外的培训或数据。
SLD的功能:
1. 使用 SLD 进行文本到图像生成,确保生成图像与输入提示的对齐。
2. 通过调整 LLM 的指令,执行图像编辑任务。
3. 与现有的扩散模型(如 DALL-E 3)无缝集成,提升生成性能。
相关推荐
暂无评论...