EdgeVLA是一个开源的边缘视觉-语言-行动模型,旨在增强机器人对视觉信息的理解和执行指令的能力。该项目专为边缘计算环境设计,支持社区贡献和改进。
OpenVLA是一个开源的视觉-语言-动作模型,旨在通过高效微调的方式支持多机器人控制,结合了先进的语言和视觉编码技术,能够在多种任务中表现出色,适用于广泛的机器人应用场景。
RL-VLM-F是一个结合视觉和语言的强化学习项目,通过利用基础模型的反馈进行学习,旨在优化多模态任务中的决策过程。
VL-PET是通过粒度控制实现视觉与语言模型的参数高效调优,旨在提升模型在特定任务上的表现。
Juice是一个软件项目,提供GPU-over-IP解决方案,使用户能够远程访问和共享可负担且易于获取的GPU资源。通过利用未使用的GPU容量(称为'Dark GPU'),Juice可以在不同的部署和提供商之间实现GPU的高效利用。用户只需在工作站或服务器上安装该软件,即可实现对GPU加速工作负载的直接远程访问。
Orca是一个基于GPT-4复杂解释轨迹的渐进式学习模型,旨在推动自然语言理解与生成的前沿。它设计高效且智能的最先进语言模型,能够与OpenAI的GPT-4和PALM相媲美。
以爱丽丝漫游“可微分”仙境为比喻,向读者介绍神经网络领域的入门书,涵盖自动微分优化函数、序列、图、文本和音频处理的设计技术。
这个开源项目的功能是利用ChatGPT进行对话,并且可以在聊天过程中发送和接收图像,同时能够将对话指令翻译成Stable Diffusion的prompt,并利用Stable Diffusion和ControlNet生成用户想要的图片。
这是一个关于人与物体物理交互的数据集,记录了人推、拉、搬不同阻力物体的动作,帮助研究者更好地理解人与物体之间的物理动态
Open_Duck_Mini是一个开源项目,旨在制作一个迪士尼BDX机器人的迷你版,结合了现代机器学习技术与详细的设计和组装指南,让爱好者能够轻松制作并训练自己的机器人。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型