具身智能是人形机器人发展与应用的关键点

2024年8月19日,星动纪元官宣发布新一代人形机器人——星动STAR 1。

与一年前公司成立时发布的首款产品小星和小星MAX不同的是,这次星动纪元发布的星动STAR 1是一款产品级人形机器人。

据星动纪元创始人、清华大学交叉信息研究院助理教授陈建宇透露,“星动纪元团队内部就多项指标对这代人形机器人进行了一系列的测试验证,最终让这代人形机器人达到了产品级标准。”

据悉,星动纪元团队早在2022年完成了第一代人形机器人研发,在这之后不到两年时间里,他们的人形机器人进行了多次迭代,到前不久发布的星动STAR 1,实则已经是星动纪元团队研发的第六代人形机器人。

我们在上周的2024世界机器人大会(WRC 2024)现场,看到了星动纪元这款新产品。

据陈建宇透露,“星动STAR 1不仅各方面性能得到了极大的提升,还将AI与大模型技术应用到了这代人形机器人上,实现了端到端的泛化行走与抓取。”

此外,星动纪元也正在进行人形机器人的商业化探索,开始推动人形机器人在工业领域进行商业化验证。

关于人形机器人的技术卡点和商业难题,我们在WRC 2024期间与陈建宇进行了一场深度对话,在这场对话中,我们了解到了他眼中的人形机器人的现在和未来。

操作大模型,提升泛化性

问:星动STAR 1在哪些方面得到了进一步提升?

陈建宇:去年我们发布的是第三代人形机器人,今年我们发布了第六代(星动STAR 1),和去年的小星相比,今年的星动STAR 1的自由度从20个增加到了55个,关节扭矩从去年的150N·m也提升到了400N·m,关节转速达到了25rad/s,性能达到世界顶尖水平。

实际上,我们这代产品在软硬件方面都得到了很大的提升。

硬件方面,包括灵巧手XHAND在内的所有核心零部件,我们都已经完成了自主研发。

软件方面,去年我们采用的是传统控制方法,只实现了人形机器人慢速行走,现在我们采用端到端纯学习方法,仅仅通过一个神经网络就实现了人形机器人在不同环境中的泛化行走和抓取。

问:星动STAR 1是什么时候立项的,这代产品研发过程中最难的是什么?

陈建宇:我们平均一代人形机器人产品几个月就能迭代完成,而且这个迭代速度还在越来越快。

之所以产品迭代越来越快,是因为我们在人形机器人研发过程中积累了很多通用的技术,而且我们在将这些技术能力逐步进行模块化,我们在研发星动STAR 1这代产品时,很多模块是直接从之前产品中复用而来。

就这代产品的难点而言,一方面是它的腿部性能达到了极致性能,另一方面是我们的灵巧手有了很大的改进。

问:现在人形机器人的标准化做得如何?

陈建宇:现在已经有一些标准化组织在做人形机器人标准化相关工作,包括人形机器人的技术路线,有一些大家也开始达成共识。

就我们自身而言,我们的硬件技术路线,例如我们的关节技术演进路线,早在2022年就已经确定下来,我们的关节这几年一直都在沿着我们最初制定的技术路线演进,如今这条技术路线也已经逐渐成为人形机器人产业的一个主流趋势。

就灵巧手而言,现在很多整机厂商还都是外采,我们这次则设计了一种全新的、可以很方便适用AI算法的硬件架构,基于这一硬件架构,我们自研了灵巧手XHAND,我们这套架构在未来也很可能会成为人形机器人灵巧手新的共识。

问:星动STAR 1在运动控制领域是如何应用大模型的?

陈建宇:我们研究了人形机器人的操作大模型,基于语言和视觉信号的输入,通过操作大模型让人形机器人直接输出动作,相较而言,这是一个端到端的语言-视觉-动作大模型。

通过大量的数据训练,这样的操作大模型具备较好的泛化性,这使得我们的人形机器人有了举一反三的能力——在进入到一个新的任务场景中,我们的人形机器人只需要少量数据就能学会相关技能。这些都是我们在实验中观察到的现象。

例如在一个新的任务场景中,我们只对人形机器人进行了几个简单物品的操作训练,之后我们发现,人形机器人在面对更复杂的环境和物体时,在没有进行针对性训练的情况下就能够准确地进行相应的操作,这就让人形机器人具备了泛化性。

问:操作大模型训练数据是如何收集的?

陈建宇:我们的操作大模型的训练数据可以来自四个方面:基于遥操作方式获取的数据、基于仿真环境生成的数据、高质量的开源数据集和人类的操作数据。

其中,人类的操作数据使用起来很有难度,我们现在也在想办法把这类数据利用起来,这就需要我们在算法底层做创新和改进。

人形机器人的具身智能瓶颈

问:人形机器人应用的瓶颈,是缺少刚需场景,还是技术不够成熟?

陈建宇:两方面其实都有。

人形机器人是一个全新的产品品类,这类产品的应用需求确实需要大家去探索,技术方面的话,也确实需要得到进一步发展。

大家刚开始做这件事没多久,包括我们第一代人形机器人也是一个相对简单的形态,经过这两年六代产品的迭代,我们的人形机器人在行走能力方面走得越来越快、越来越稳,手部的操作也越来越智能,能够做更多事情。

实际上,人形机器人技术发展到现在已经初步具备在一些简单场景中执行任务的能力。

问:人形机器人技术发展瓶颈在哪里?

陈建宇:未来人形机器人的具身智能如何去做,这是最大的不确定性。

就如何实现通用的具身智能,目前最前沿的学术界都还很难回答这一问题。

我们已经看到很多技术路径,这些技术路径都有可能成为未来通用智能的可能性,我们团队现在也在不同路径上做相应的探索,这是我们未来的竞争优势。

问:怎么看现在人形机器人技术发展速度

陈建宇:现在人形机器人技术发展非常快,以往人形机器人的研究方法,是以线性增长的趋势推动整个产业发展,现在在数据驱动的时代,整个产业有了阶跃式发展的可能。

所以,人形机器人完全有可能以超出大家预期的速度发展。

对于人形机器人产业的发展,我会更乐观一些,很多人看到的是人形机器人现在能做什么,这些能力距离他们心中理想的人形机器人形态还有多远,但我看到的是以后人形机器人会发展成什么样。

问:星动STAR 1有怎样的商业计划?

陈建宇:我们会先就我们的灵巧手XHAND进行商业化,我们的灵巧手也会根据市场需求进行后续的产品迭代。

对话星动纪元陈建宇:具身智能是人形机器人发展与应用的关键点

至于星动STAR 1人形机器人,我们是按顶配性能来做的,相当于汽车中的保时捷,但由于我们自下而上进行了全栈的技术自研和供应链把控,因此它的最终售价也不会特别贵(具体价格我们会在后续公布)。为什么我们会强调人形机器人的性能?

这是因为我们希望我们的人形机器人真可以去干活儿,甚至干人干不了的活儿,这就需要人形机器人在力量、效率上都有很好地表现。

工业依然是第一场景

问:人形机器人最早的商业落地场景是什么?

陈建宇:我认为人形机器人最先会落地在工业领域,这是基于以下三个判断:

第一,工业是一个劳动密集型产业,而且正在面临劳动力短缺的问题;

第二,我们做过一个估算,人形机器人在工业领域得到大规模应用后,它的成本能够完全得到覆盖;

第三,对比家用或服务类应用场景,工业场景对人形机器人的应用需求,实现起来的技术难度会相对低一些,相对更容易实现。

基于以上三点判断,我们现在主要也是在工业领域做人形机器人的技术和产品验证。

问:人形机器人已经到了卖货阶段了吗?

陈建宇:目前大家已经在卖货的人形机器人,不会是最终真正大规模应用的人形机器人。

我们看到,马斯克在推动人形机器人进汽车工厂,他对于人形机器人商业化落地的判断,是基于他们真正在汽车工厂中解决了哪些问题、真正做到了哪些工人在做的事情提出的,他们人形机器人量产时间线也是基于在实际工厂场景应用情况制定的。

但是目前大家还没有真正找到一个引爆需求的场景,大家正在卖的人形机器人也并不是为了满足真实市场需求而做的,更多是为一些早期尝鲜者提供,所以由此产生的销量不会很大。

对于我们而言,我们也会为早期尝鲜者提供人形机器人产品,在这方面,我们确实也接收到了一些需求,但要真正推动人形机器人量产,一定要解决诸如工业场景这样足够大的场景中的某些需求。

只有真正满足了这类需求,能够提供一个有价值的解决方案,我们才能将人形机器人顺利部署下去,从而推动人形机器人实现规模化量产。

问:人形机器人什么时候能够规模量产?

陈建宇:我觉得大家现在暂时不用过于重视人形机器人量产这件事,现在人形机器人真正的问题不是量产,而是:

第一,现在生产出的人形机器人是否能够真正被用起来;

第二,这些能够被用起来的人形机器人所需要的技术,是否真能够导入规模化量产的产品中。

也就是说,人形机器人的客户需求在哪里,你的技术是否能够达到客户的需求,这是我们开启人形机器人规模化量产的先决条件。

问:人形机器人要量产,在技术上还有哪些瓶颈?

陈建宇:现在人形机器人最大的技术瓶颈依然在具身智能。

硬件决定了人形机器人应用落地能力的上限,但是目前人形机器人产业拥有的硬件基础支撑起来的应用上限,具身智能算法还暂时没有达到。

也就是说,人形机器人的硬件基础本身能够支撑它完成的一些任务,由于现有AI算法的能力不足,目前的人形机器人还无法真正实现这样的产品力。

具身智能技术的发展不如人形机器人硬件成熟,也就成了现在人形机器人产业最大的卡点。

(文章来源:科技行者techwalker.com)