基于LLM的扩散-提升文本到图像理解

通过大型语言模型增强对文本到图像扩散模型的快速理解，提升text-to-image领域对于Prompt的理解，避免图像和文本要求不一致的情况。
基于LLM的扩散的特点:
1. 增强的推理能力
2. 两阶段生成过程
3. 使用现成的预训练大语言模型
4. 能够处理复杂的语言提示
5. 适用于对话场景的规范

基于LLM的扩散的功能:
1. 根据文本提示生成准确的图像
2. 通过上下文学习生成场景布局
3. 输出图像的边界框和描述
4. 处理与常识推理相关的提示

相关导航

sd-webui-depth-lib-深度图生成库

这是一个用于Automatic1111/stable-diffusion-webui的Control Net扩展的深度图生成库，提供了优化的性能和用户友好的接口。

NRokoko Video-高效易用的AI动作捕捉工具

Rokoko Video是一款创新的数字动画和动作捕捉工具，利用AI技术将视频素材转化为精确的3D动画，适用于游戏开发、电影制作和数字艺术等多个领域，极大地简化了动作捕捉过程，降低了成本，方便用户快速入门。

nextjs-chatgpt-app

这个开源项目是一个响应式聊天应用程序，使用了OpenAI的GPT-4进行动力支持。它具有响应流、代码高亮和各种预设功能，适用于开发人员。这个项目使用了Next.js、React和Joy等技术。

Gptify.io-轻松创建和训练聊天机器人

Gptify.io是一个AI聊天机器人平台，用户可以使用自己的数据（如文档、视频和网站）轻松创建和训练聊天机器人。通过简单的脚本，用户可以将聊天机器人嵌入到他们的网站或应用程序中。

ChatGLM-6B-API-基于ChatGLM-6B的本地对话API

ChatGLM-6B-API是基于清华大学开源的对话语言模型ChatGLM-6B和FastAPI构建的API，能够在本地部署并提供API接口，方便用户进行对话生成和自然语言处理。

Shader-轻松创建自定义AR/AI镜头和效果

Shader是一款可以让用户通过手机快速创建自定义AR/AI滤镜和效果的应用。用户只需通过文本、点击或语音即可生成想要的滤镜。它还提供了一种全新的AI视频创作工具，人人都能轻松使用。

GPT-Prompter-便捷的GPT工具扩展

GPT-Prompter是一款Chrome扩展，用户可以通过它便捷地使用GPT-3、GPT-4和ChatGPT API，无需访问OpenAI网站或依赖中介。它提供了可定制的预制提示、对话和类似游乐场的界面，帮助用户充分发挥GPT的潜力。

landrific.online-你的AI聊天与创作伴侣

Landrific.online是一个多功能的AI平台，旨在通过聊天、艺术、视频、音频和编码等多种方式激发用户的创造力。无论你是想与AI聊天，还是想创作艺术作品，制作视频或音频，Landrific都能提供支持。

Remix-DiT-多专家去噪的扩散变换器

Remix-DiT是一种采用扩散变换器的模型，旨在通过多专家系统提高图像去噪的性能，适用于多种图像处理任务。

NDragon Coloring Pages Genie-AI生成个性化龙主题涂色页

龙彩页精灵是一个由AI驱动的网站，为儿童和成人生成可定制的龙主题涂色页。用户可以创建自己独特的涂色页或选择多种现成的选项进行下载。使用非常简单，注册后选择所需的龙主题，进行必要的自定义，然后下载高清涂色页以供打印。

Cirroe AI-个人化部署聊天机器人

Cirroe AI是一个个人化部署聊天机器人，简化了AWS资源的部署和调试过程。开发者只需简单的提示，就可以在多个区域或区域中快速创建和管理多个资源，采用按需付费的定价模式。

NArcana-AI生成的独特背景素材平台

Arcana是一个提供Midjourney生成的AI背景图的平台，拥有400多种独特的8K背景图，涵盖了从生动的梦境到神秘的风景等多种风格。

Eliza-多功能AI助手，支持多平台交互

Eliza是一款多功能AI Agent，支持连接discord、推特、telegram等社交平台，实现多模态交互、文档交互和业务流程自动化，具有高可扩展性。

Aivatar-AI头像生成器，展现真实自我

Aivatar是一个通过AI技术生成令人惊艳的头像的平台，提供传统摄影的升级体验，以极低的成本帮助用户创造出展现真实自我的肖像。用户可以通过简单的一键操作，生成多种风格、时代、地点和姿势的头像。

ParLlama-为Ollama设计的易用TUI应用

ParLlama是一款为Ollama语言模型设计的文本用户界面（TUI）应用，用户可以轻松管理和使用基于Ollama的大型语言模型（LLMs），同时支持深色和浅色模式以及自定义主题，以满足不同用户的需求。

VideoSage AI-提升观看长视频的体验

VideoSage是一个专门为用户设计的平台，旨在增强观看长视频的体验。它提供了一系列工具和功能，可以自定义和增强您的观影体验。用户可以在观看视频时与AI进行互动，提出问题并请求视频内容的总结、见解和时间戳，AI会根据视频内容提供准确的信息。此外，用户还可以在视频内容旁边做笔记和协作。

Beducated AI Sex Coach-免费的情感与性知识对话助手

Beducated AI Sex Coach是一个对话式聊天机器人，专注于解答与性和人际关系相关的问题。它结合了AI技术与Beducated丰富的专家内容库，提供了一个独特的学习亲密关系的资源，完全免费。

ScantextAI-快速将图像转换为可编辑文本

ScantextAI是一个平台，允许用户即时将图像、照片、截图和扫描文档转换为可编辑的文本。通过OCR技术，ScantextAI能够准确提取各种图像格式中的文本，并将其保存为PDF或Word格式。

暂无评论

暂无评论...