精心整理的视觉自回归建模工作列表,涵盖了图像、视频、3D、多模态生成等领域
一个关于基于扩散模型的图像编辑方法的文献汇总项目,旨在为研究人员和开发者提供全面的参考资料,涵盖各种图像编辑任务,包括生成、修复和转换,同时提供相关论文的链接与总结,确保信息的及时更新和获取最新研究成果。
Forge_VFM4AD是关于自动驾驶视觉基础模型的全面调研,涵盖了相关挑战、方法论和未来研究机会。
科学探索Agent资源列表:汇集了关于大型语言模型和科学研发Agent的精选论文,旨在促进科学研究与人工智能的结合,提供前沿研究动态和资源
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型