真机数据采集已完成,银河通用具身VLA大模型已实现泛化,该模型基于仿真合成大数据进行了预训练,这一进展为相关领域的研究和应用提供了有力支持。

银河通用机器人推出了一款全新的端到端具身抓取基础大模型——GraspVLA,这一模型完全依赖于仿真合成大数据进行预训练,与OpenVLA、π0、RT-2、RDT等模型相比,展现了更强的泛化能力和在真实环境中的应用潜力。

数据瓶颈的突破与仿真合成大数据的威力

在具身智能领域,数据瓶颈一直是业界公认的最大挑战,银河通用通过GraspVLA的研发,打破了这一僵局,该模型通过全仿真合成数据进行预训练,不仅极大降低了数据采集的时间、人力和资金成本,还广泛提高了数据对各种场景的覆盖率,这种全新的预训练范式,为具身智能的发展打开了新的可能性。

七大金标准的具身智能泛化能力

GraspVLA团队为了评估模型的泛化能力,提出了七大金标准,包括光照泛化、干扰物泛化、平面位置泛化、高度泛化、背景泛化、物体类别泛化以及闭环能力,通过一系列实验和测试,GraspVLA展示了在各种动态环境下的稳定执行任务的能力,即使是在剧烈的环境变化和干扰下,也能准确执行抓取任务。

快速适应新场景与用户需求

GraspVLA作为基座大模型,还展现了快速适应新场景和用户需求的能力,无论是商业场景中的按序抓取、特殊行业零件的识别,还是家庭场景中的人类偏好对齐,GraspVLA都能通过少量数据快速学习和调整,迅速上岗工作,这一能力使得GraspVLA在各种场景中都能快速部署和适应,为具身智能的商业落地提供了新的可能性。

银河通用具身VLA大模型,基于仿真合成大数据的泛化预训练  第1张

合成大数据驱动的VLA预训练新范式

银河通用团队通过开创性的全仿真合成数据生产管线,极大提高了数据的物理真实性和物理渲染的并行度,这套数据生产管线能在短时间内生成大规模的数据集,为GraspVLA的强大抓取泛化能力提供了前提,这一路线所展现的全方位优越性,可能将一改业界对仿真合成路线的看法,开创合成大数据驱动的VLA预训练新范式。

银河通用具身VLA大模型,基于仿真合成大数据的泛化预训练  第2张

全能大模型的崛起

银河通用表示,他们将不断融合多年积累的技术,推出全面融合各类技能的全能大模型,这些大模型将以仿真合成数据为唯一预训练来源,确保所有大模型能够以最小成本迅速进化,随着技术的不断进步,我们期待看到具身智能领域的新高峰。

银河通用具身VLA大模型,基于仿真合成大数据的泛化预训练  第3张

银河通用的GraspVLA大模型为具身智能的发展带来了革命性的突破,通过仿真合成大数据的预训练,GraspVLA展现了强大的泛化能力和快速适应新场景的能力,这一技术的崛起,可能将引领具身智能领域进入一个新的时代。

银河通用具身VLA大模型,基于仿真合成大数据的泛化预训练  第4张

更多详情请关注电脑知识网的相关文章。

银河通用具身VLA大模型,基于仿真合成大数据的泛化预训练  第5张

编辑手记

随着人工智能技术的不断发展,具身智能已经成为科技领域的研究热点,银河通用的GraspVLA大模型的发布,无疑为这一领域注入了新的活力,我们期待看到更多创新的技术和解决方案在具身智能领域涌现。

银河通用具身VLA大模型,基于仿真合成大数据的泛化预训练  第6张

注:本文所提及的技术和观点仅供参考,不代表本站立场。

银河通用具身VLA大模型,基于仿真合成大数据的泛化预训练  第7张

—— 电脑知识网 编自新智元报道

银河通用具身VLA大模型,基于仿真合成大数据的泛化预训练  第8张