Depth Pro 是一个基础模型,用于零样本度量单目深度估计,能够在不到一秒的时间内生成清晰的深度图。它结合了真实和合成数据,利用高效的多尺度视觉变换器,提供高分辨率和准确的深度测量,适用于各种视觉任务。
Snake-SLAM是一个可扩展的可视化惯性SLAM系统,专为低功耗航空设备设计,能够有效融合视觉和惯性传感器数据,实现实时导航和定位。
GRAM是一个用于3D感知图像生成的生成辐射流形模型,能够从2D输入生成高质量的3D图像,利用先进的生成辐射流形技术,提供了真实感和高保真的图像合成效果。
3D Scan Pro利用激光雷达技术和摄影测量法,将现实中的物体转化为精确的3D模型,简化了日常物品的数字化过程。用户可以轻松捕捉和保存物体的三维信息,便于后续使用。
LucidDreamer是一种新的3D场景生成技术,它不受特定领域的限制,可以生成更接近真实世界的3D场景。该技术通过递归的Dreaming和Alignment步骤,结合细粒度控制,提供了高质量的场景生成体验。
一套开源的环视物体检测方案,实现了在鸟瞰图视角下的特征优化,可应用于汽车自动驾驶场景。
PanoHead是一个AI开源项目,主要用于生成3D立体头像。项目的源码可以在sizhean.github.io/panohead找到。此外,还有一篇相关论文可以在O网页链接中找到。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型