FlowSAM是一个用于视频中的运动对象分割的项目,结合了Segment Anything模型(SAM)和光流技术,旨在提高分割精度和效率。它不仅能够处理单一对象,还能在多对象场景中保持对象身份,提升分割性能。
Track Anything 是一个高效的目标跟踪项目,旨在实现视频中物体的准确跟踪与抠图,具有出色的实时性能和用户友好的界面。
Segment Anything是一款图像分割工具,可以实现图像的像素级自动分割,自动识别图像中的实体并进行分割和提取。它由Meta AI发布,支持零样本转移到其他分割任务,包含比现有数据集规模大400倍的SA-1B数据集,并提供丰富的开源资源。
该项目提供了一种视频语义分割的方法,利用帧间特征重建技术,在半监督学习的框架下提升模型性能,适用于缺乏标注数据的场景。
ComfyUI PhotoMaker是ComfyUI的非官方实现,支持本地模型、自定义尺寸、3倍提速以及多图直接输入,旨在提高图像处理的效率和灵活性。
人类眼睛的反射性是了解周围世界的一种尚未被充分开发的来源。通过拍摄运动中的人的眼睛,我们可以通过眼睛的反射收集场景中多个视角的画面,这些画面是通过相机直接拍摄无法得到的。
LightwheelOcc是一个专为自动驾驶领域设计的3D占用合成数据集,提供高质量的3D占用数据,支持多种传感器视角的合成,适用于算法的训练和评估,涵盖多种环境类型和复杂场景。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型