Key2Mesh 仅利用 2D 人体姿势关键点作为输入来进行 3D 人体网格重建。该项目支持大规模运动捕捉数据集的训练,并且不依赖于视觉数据的 3D 标签,通过对抗域适应方法提高在 RGB 图像上的性能。其运行速度比之前最先进的模型快 12 倍,极大提升了重建效率。
DSTA 是一种基于视频的人体姿势估计的新方法,能够将输入直接映射到输出关节坐标。它通过解耦时空聚合网络和联合局部感知注意机制,灵活捕获关节的空间和时间信息,在 PoseTrack2017 数据集上实现了显著的性能提升。
DeepSpeed Chat是一个开源项目,其功能是将完整RLHF流程加入到模型训练中,并提供类ChatGPT模型。该项目适用于各种规模的高质量类ChatGPT模型的训练,并可在微软开源中心中获得资源。
MPS-Net是一个用于从单目视频中捕捉人类运动的模型,专注于时间注意的3D人体姿势和形状估计。该项目通过先进的算法,能够准确地捕捉到人类在运动中的动态变化,为动作分析和交互式应用提供了强有力的支持。
Movenet.Pytorch是Google推出的MoveNet在Pytorch中的实现,包含训练代码和预训练模型,适用于人体关键点检测任务。
ExAvatar 是一种富有表现力的全身 3D 高斯虚拟人,结合了短单目视频学习到的全身参数网格模型和3D高斯溅射,能够呈现新颖的面部表情和姿势。同时,它能够有效处理视频中的模糊性和伪影,利用基于连接的正则化器减少伪影,确保生成的虚拟人更加真实和生动。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型