GR-2登场!ByteDance Research提出机器人大模型
Micheli
2024-10-09 00:00:00
197
字节跳动研究团队推出了GR-2,这是一款具有强大泛化能力和世界建模能力的突破性机器人模型。
字节跳动研究团队推出了GR-2,这是一款具有强大泛化能力和世界建模能力的突破性机器人模型。GR-2通过在3800万个互联网视频剪辑上的训练,学习了各种动态和行为模式。该模型能够准确预测动作轨迹并生成视频。GR-2的可扩展性使其能够处理复杂任务并适应新环境,在105个不同的桌面任务中取得了高成功率,展示了其在多任务学习中的多才多艺。此外,GR-2与大型语言模型结合,完成复杂任务并与人类互动的潜力标志着该领域的显著进步。其处理环境干扰和挑战性物体操作的能力,如处理透明或反光物品,进一步突显了其实际应用。尽管经过了广泛的预训练,GR-2的开发人员承认需要更多多样化的真实世界动作数据来提高其性能。该模型仍处于早期开发阶段,但它代表着智能代理在实际应用中迈出的一大步。- ByteDance Research发布了第二代机器人大模型GR-2,具备世界建模和强大泛化能力。
- GR-2通过预训练在互联网视频片段上学习,具备学习多种操作任务和在多种环境中泛化的潜能。
- GR-2通过微调在机器人轨迹数据上预测动作轨迹并生成视频,具备优秀的动作预测能力。
- 扩大模型规模可以解锁机器人更多的潜能,使其在多任务学习和适应新环境方面更加得心应手。
- GR-2能够完成105项不同的桌面任务,平均成功率高达97.7%。
- GR-2能够与大语言模型相结合,完成复杂的长任务,并与人类进行互动。
- GR-2能够鲁棒地处理环境中的干扰,并通过适应变化的环境成功完成任务。
- GR-2能够端到端地完成两个货箱之间的物体拣选,具备在工业领域和仓储场景的潜力。
- GR-2能够准确抓取透明物体、反光物体、柔软物体等具有挑战性的物体。
- GR-2在未曾见过的场景和物体上也有着出色的表现。
- GR-2在互联网视频上接受了大规模的预训练,但仍有进步空间。
版权声明:
创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写
「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。