大模型为人形机器人行动力提供思路
前不久WRC 2023上,在众多人形机器人中,有一台人形机器人在展厅一隅一直忙碌地为驻足围观的观众做着拉花咖啡。
机器人做咖啡,在过去几年里并不少见,但多为基于机械臂形态的机器人来做咖啡,例如猎户星空在2020年推出的智咖大师。
用人形机器人做咖啡实际上并不多见,非设定程序的执行,存在较大挑战是一方面原因,也有人认为这多少有些大材小用。
而这款人形机器人背后,是在扫地机器人领域,乃至整个家庭清洁领域已经位列行业头部的追觅。
做咖啡为什么会成为追觅人形机器人学习的第一个场景化技能?
当我们来到苏州,拜访这家机器人公司的人形机器人团队时,我们从追觅科技人形机器人负责人Albert(化名)那里找到了这个问题的答案。
在追觅内部,人形机器人商业化路径排序是:商用、工厂、家庭。
其中,情绪价值更高的商用场景是追觅人形机器人将最先尝试商业化落地的场景。
正因如此,也就有了追觅人形机器人做咖啡的故事。
不过,追觅做人形机器人还要从三年前说起,那时Albert刚到追觅,开始参与追觅第一个仿生机器人项目。
一代机器狗的台前幕后
2020年,Albert来到追觅,着手负责追觅与小米合作的机器狗项目,这是追觅第一次涉足仿生机器人领域。
不过,这却不是Albert第一次接触仿生机器人。
在此之前,Albert已经从事人形机器人项目研发长达4年之久,在马斯克还没有闯入这一领域,在波士顿动力还是人形机器人领域唯一网红时,Albert就已经在另一个机器人团队从事人形机器人研发工作。
那4年的机器人项目研发经历,让Albert逐渐成长为一位对机器人行业技术趋势有敏锐判断力的江湖老手。
凭借在人形机器人领域多年的研发经验和敏锐嗅觉,Albert发现,仿生机器人的本体和控制方案在2020年开始收敛,整体方案开始走向成熟。
其中,MIT和斯坦福两所全球顶级高校是这样的机器人技术收敛背后的主要推动力。
2018年9月,MIT机器人实验室的Benjamin Katz在他的论文中,开源了MIT Mini Cheetah电机驱动器的代码。10月,他再次将Mini Cheetah上运行的所有代码对外开源。
这让四足机器人,乃至仿生机器人领域有了一个公版硬件方案,而且是一个质量相当不错的公版硬件方案。
和MIT开源经历类似的是,斯坦福大学人工智能实验室孵化了另一个对于机器人行业至关重要的开源项目——ROS,这相当于为机器人领域提供了一个公版的机器人(软件)操作系统。
这两个开源项目奠定了仿生机器人领域的发展基础。在之后几年里,仿生机器人领域涌现出了越来越多的项目和公司。
追觅和小米在这一年着手联合研发的机器狗,同样是一个基于MIT Mini Cheetah+ROS开源项目的方案。不同的是,追觅需要将这样一个学术研究项目产品化,并实现量产。
在第一代机器狗产品化过程中,Albert和他的团队遇到的第一个问题是,MIT Mini Cheetah原有的电机方案提供的动能不够,因而整机负载在真实应用场景中明显不够。
Albert和他的团队通过对这一方案拆解研究发现,之所以动能不够,是因为原有方案霍尔额定值为6,减速比为1:6,Albert告诉我们“按这一参数造出的机器狗,想要进行一个后空翻都有很大难度。”
于是,追觅机器人团队尝试用6个霍尔提供1:9的减速比,将整机动能提升到了一个新的高度。
正是通过诸如此类的方案优化,追觅仅用了4个月,在2021年年初就做出了一代机器狗的工程样机。
接下来则是更富有挑战性的批量化生产。
一款机器人,在真正进入市场之前,批量化是最难的关卡。
Albert解释称,“在考虑批量化时,我们不仅需要考虑霍尔磁铁的距离、强度,以及算法逻辑强度,还需要考虑整体产品的公差。”
很多在实验室表现良好的机器人,正是因为无法克服公差、保证良率,迟迟无法进入商用市场。
为了确保当时需要交付的机器狗产品一致性,Albert亲自下到工厂产线上监控生产工艺、卡工位标准。
也是在解决了这款机器狗的批量化问题,完成了量产交付后,Albert觉得,之前一直有规划、想做却没做的人形机器人,现在是时候提上日程了。
大模型带来第二个技术收敛
2021年7月,在开源MIT Mini Cheetah后,MIT的研究人员又研发了一款酷似Mini Cheetah的人形机器人MIT Humanoid。
这款人形机器人不仅在电机性能上得到了极大的改善,也再次为整个机器人行业,尤其有意研发人形机器人的团队提供了一个思路。
“实际上,在MIT Humanoid面世之前,包括追觅在内的很多机器人公司已经推演出了人形机器人的发展路径,”Albert告诉科技行者。
尤其是机器人技术在硬件本体和控制技术上,已经明显在向高透明度的MPC+WBIC这一方向收敛。
于是,2022年年中,追觅正式立项了人形机器人。
对于同样从机器狗赛道进入人形机器人赛道的追觅来说,首先需要克服的是两个难题:
第一个难题是更复杂的整机系统。
人形机器人无论是在电机数量上,还是整机系统的复杂程度上,都要比机器狗更为复杂,要想研发出具有量产能力的人形机器人,追觅的团队显然需要考虑更多因素。
第二个难题是机器人本体的平衡控制。
人形机器人的平衡控制同样比机器狗更难实现,也是现在人形机器人团队在花大量精力优化、攻克的一项基础能力。
不过,Albert指出,虽然从行业平均水平来看,现在人形机器人的运动能力还没有进化完全,但对于追觅等机器人公司而言,这已经是一个没有阻力、一定能够解决的问题。
之所以有这样的自信,是因为大模型的出现。
2022年11月30日,ChatGPT正式发布,这标志着人工智能进入了一个以大模型为代表的新时期。
大模型的出现,也为人形机器人运动过程中的泛化能力提供了一个很好的解决思路。
Albert指出,人形机器人能够在2023年这么火,有三分之一的原因是大模型的出现,而大模型的出现让仿生机器人在软件技术上得以进一步收敛。
更为重要的是,“未来人形机器人批量落地,特别是在相对复杂场景中落地,将会对强化学习和大模型有强依赖性。”
正因如此,追觅早早就从算法团队中抽调工程师研究强化学习和大模型策略,并尝试将相关算法与追觅仿生机器人研究相结合。
通过与强化学习、大模型结合,Albert认为,经过半年时间打磨,人形机器人整体运动能力可以达到及格水平。
接下来在进入产业化之前,更重要的将会是实际操作能力。
追觅机器人的终局思维
在追觅立项人形机器人这一年,公司内部也在进行着一次架构调整。
2020年,在搭建仿生机器人研发团队时,Albert从追觅原吸尘器和扫地机器人业务线抽调了电机、驱动、结构、算法、工程几个方向的工程师,外加新招聘的工程师,组成了一个二三十人的研发团队。
这样组建起来的研发团队,在追觅内部仍以传统的项目制运作。
2022年5月,也就是在人形机器人立项前,追觅广义机器人战略进一步明晰,于是成立了与以往项目团队风格截然不同的技术研究机构——追觅创新机器人研究院。
“成立创新机器人研究院的另一个原因,是想要通过这一组织实现底层技术能力的复用。”Albert进一步解释称。
以自研伺服电机为例。
追觅早年间以高速电机起家,持续的技术投入让追觅在高速电机领域建立起了领先优势。
然而,高速电机与伺服电机并不相同,例如高速电机只有一对磁极,伺服电机有多对磁极;高速电机更强调动力平衡,伺服电机则对扭矩有较高要求。
不过,Albert解释称:“从高速电机跨到伺服电机,只是电机需要优化的技术指标会有一定差异,对在高速电机领域有深厚技术积累的追觅来说,挑战并不大。”
Albert还特别指出:“对于原来研发高速电机的工程师而言,90%以上技术能力可以拿来复用,其中没有办法直接复用的部分,比如伺服电机相对于高速电机多了一节行星齿,我们也从扫地机器人的一个平衡齿轮技术上找到了相似方案。”
就这样,追觅自研的第一代伺服电机,在最大扭矩、电机重量等参数上已经达到了行业的领先水平。
另一个技术复用体现在追觅今年新一代扫地机器人X20系列上。
2023年4月,追觅对外发布了新一代扫地机器人X20。这代扫地机器人的一大特性是借鉴了机器人的机械臂技术,加入了仿生外扩的机械臂,在沿边清洁时,通过将带有拖布的机械臂外扩,实现了更好的沿边清洁能力。
在Albert看来,这是机器人技术在实用场景的落地,为扫地机器人增加了关节与自由度。未来,追觅扫地机器人会增加更多的自由度,来实现更丰富的功能。
据Albert介绍,追觅一直以来的目标是要成为一家广义机器人公司。
为此,追觅也形成了两条技术路线:
一条是自下而上的技术路线。
基于现在商业化能力较强的扫地机器人、洗地机等产品继续进行技术研发、产品迭代,并逐步渗透到更多机器人产品品类中。
另一条是自上而下的技术路线。
通过对通用人形机器人这一机器人终极品类的整体技术规划,结合当下最先进的技术理念进行研发,并将在这个过程中积累的基础技术成果应用到已有商业化产品中。
Albert表示:“最终我们希望通过两条路线并行,实现双向收敛,成为一家广义机器人公司。”
不过,这是一个以十年为计量单位的企业成长之路。对于追觅而言,更重要的是探索出一条更符合自己的机器人商业化之路。
商业化路线:商用、工业、进家庭
2023年8月,在WRC 2023上,追觅通用人形机器人展示了第一个应用场景——做咖啡。
为什么会先结合灵巧手让人形机器人学咖啡?
这是因为Albert看到了工业机械臂在实际商业化场景中遇到的一个问题。
中国制造业产能分散,中小型工厂众多,在这些工厂中,往往存在潮汐现象,在旺季往往又需要通过机械臂提升产能的需求。但如果购入机械臂改造工厂,在淡季往往又会因产能过剩导致机械臂闲置,这些闲置机械臂又因没有通用性难以转手。
这是Albert看到的现在国内中小型工厂普遍存在的一个问题,也让他意识到了通用人形机器人的实际操作能力的重要性。
追觅人形机器人的“拉花咖啡”想法由此诞生。
不过,Albert告诉我们,后续追觅还会基于灵巧手的两个方向继续深入:
第一,加入感知能力,与人形机器人其他部位的感知进行协同,做联合算法研发;
第二,基于感知能力,在完成“拉花咖啡”的一期项目基础上,二期项目要让它进入更多商用场景,完成更多实际任务。
Albert也指出,由于人形机器人在环境感知和理解上仍有一定难度,追觅会首先选择环境更加结构化,但拥有更高情绪价值的商用场景来落地,之后才是比商用场景落地更简单的工厂场景。
至于人形机器人的终极场景——家庭场景,由于涉及大量交互,以及安全问题,追觅会放到商用、工厂之后去研发。
而要让人形机器人进入家庭场景,Albert认为,至少还需要10年。
不过,关于人形机器人,Albert还有另一个预判:由于人形机器人技术和产品的收敛,明年将会开启人形机器人的商业化元年。
(文章来源:科技行者techwalker)