MultiPly是一个通过野外单目视频重建多人3D图像的项目,能够处理人物之间的遮挡和相互作用,使用先进的神经表征技术进行场景建模,并结合自监督的3D分割及可提示的2D分割模块,提供高效的人体姿势和形状优化。
SynCHMR 是一种协同方法,通过结合相机轨迹和人体重建,解决深度、比例和动态模糊性问题。它使用人类感知公制 SLAM 进行重建,并学习场景感知的 SMPL 降噪器,以增强时空一致性和动态场景约束。
Move AI是一种创新的运动捕捉技术,通过将2D视频转化为3D运动数据,利用先进的AI、计算机视觉、生物力学和物理学,简化了动画角色的运动捕捉过程,适用于从独立创作者到大型工作室的广泛用户。
D-ID是一款开创性的AI工具,专注于创建高度逼真的数字人和深度伪造视频。它利用尖端的人工智能和机器学习技术,为企业、教育者、内容创作者和娱乐专业人士提供了一系列创意解决方案,简化了生成栩栩如生的虚拟角色、个性化视频和独特数字体验的过程。
Gradient-SDF是一个半隐式表面表示项目,专注于3D重建,能够从图像中提取结构信息并生成高质量的三维模型。该项目利用先进的算法来实现高效的3D重建,适用于各种计算机视觉应用。
该框架将3D感知集成到预训练的2D扩散模型中,增强了得分蒸馏的鲁棒性和3D一致性,旨在解决2D扩散模型无法捕捉3D一致性的问题。
trulience.com是一个互动数字化身平台,允许用户创建逼真的数字人,能够与用户进行自然对话。该平台可连接到各种对话平台,提供虚拟客户服务、个性化虚拟助手和娱乐行业的虚拟演员等多种应用场景。
ZEPETO是一款允许用户创建个人3D动画形象的应用,用户可以在聊天室中使用这些虚拟形象进行互动,体验更加生动有趣的社交体验。
ChatAvatar是一个创新的平台,允许用户通过文本、照片或艺术作品在几分钟内生成可动画化的、符合生产标准的3D头像。该项目旨在简化3D头像的创建过程,使个人和企业能够快速获取高质量的数字化形象。
GeneOH Diffusion旨在通过去噪扩散技术实现通用的手物交互去噪,提升图像质量。
Deepfakes Web是一个在线应用,利用人工智能技术轻松生成深度伪造视频,通过替换面孔来实现。该应用在云端运行,确保用户数据的隐私。用户只需上传源视频和目标视频,AI将学习并渲染新视频,用户可以下载或观看生成的视频,并可选用训练好的模型以获得更好的效果或制作更多视频。
H2ONet 是一个专注于手部遮挡和方向感知的网络,能够实时进行3D手网格重建,基于深度学习的高效算法,使其在各种应用中表现出色。
一种使用球面高斯约束引导条件扩散过程的方法。该方法旨在通过约束条件扩散过程中的生成能力,以提高生成模型的性能和图像质量。
为3D计算机视觉提供标准化数据加载器的项目,让研究人员能快速获取和使用多视角数据集,加速研究进程。
OpenGaussian旨在进行点级别的3D高斯基础开放词汇理解,提供先进的3D数据处理能力。
Texture Lab 是一个开创性的工具,旨在简化从文本描述生成无缝高质量纹理的过程,专为游戏开发者、平面设计师和数字艺术家设计。无论是创造神话生物的龙鳞,还是设计古埃及的瓷砖,Texture Lab 都提供了一个用户友好的平台,提升了纹理创作的创造力和效率。
PoseTracker API是一个用于实时人体运动分析的前沿解决方案,适用于移动和Web应用。它利用人工智能和计算机视觉提供超稳定的姿态估计和运动追踪,方便开发者集成先进的姿态检测技术。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型