ColorPeel是一个利用扩散模型,通过颜色和形状的分离来进行颜色提示学习的项目,旨在提高图像生成的灵活性与质量。
基于论文知识复现 Pi(Physical Intelligence)智能视觉行动模型的开源项目,主要功能是模拟人类如何通过视觉和语言理解来指导行动。
用于快速拟合神经场(neural fields)到整个数据集的库,为下游任务提供代表性的表示
ID-Blau是一个基于隐式扩散的方法,用于图像去模糊,通过重模糊增强技术来提升图像质量,适用于计算机视觉任务。
分享 GitHub 上一份开源免费的在线教程,涵盖了 PyTorch 基础知识、神经网络、计算机视觉、自定义数据集处理、模块化代码编写以及模型部署等内容。
该项目专注于通过同心因果注意机制减轻模型中的物体幻觉问题,旨在提高模型对物体的识别能力,特别是在复杂的视觉语言任务中。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型