214|人形机器人哪家强?特斯拉

AIGC最新资讯7个月前发布 AiBots
43 0 0

来源:转载科技参考3日记

读者,你好。

欢迎回到《科技参考》,我是卓克。

今天的《科技参考》,我们讨论一个关于机器人普及的话题。

因为不久前,马斯克曾经在年度股东大会上说,特斯拉公司今后的主力产品是人形机器人Optimus,其次才是纯电动车。未来特斯拉公司的市值会达到25万亿美元,而今天市值最高公司的英伟达也才3.3万亿美元。马斯克的预测还包括,未来会有10亿-30亿台人形机器人的需求,特斯拉会占据其中10%的市场份额,以售价2万美元一台去算,特斯拉每一台还可以赚1万美元。也就是说,每台机器人的成本是1万美元。

今天全球汽车总数大约15亿,所以马斯克设想的那个未来,人形机器人的数量和今天的汽车是类似的,所以很可能对城市居民来说,未来每个家庭也许不止一个机器人。今天一辆车的价格集中在10-30万之间,也和马斯克预估的今后机器人的售价2-3万美元一个差不多。

而今天,一个能力还比较弱的人形机器人成本是多少呢?我们来分析一下。

机器人要模拟人的运动,需要把关节上的直线运动和旋转运动精细地搞定。这不但需要电机、减速器、丝杠,还需要传感器、视觉单元、运算单元、控制单元。今天Optimus机器人全身的旋转关节一共14个(肩部6、肘部2、腰部2、髋部4),线性关节14个(上臂2、下臂4、大腿4、小腿4),手部因为灵巧性要求很高,还有额外的12个关节。

每个旋转关节需要配备1个力矩电机、1个谐波减速器、2个编码器、1个力矩传感器。

每个线性关节需要配备1个力矩电机、1个行星滚珠丝杠、1个编码器、1个力矩传感器。

每个手部关节需要1个空心杯电机、1个行星减速器、1个蜗轮蜗杆和若干个传感器。

再把今天这些零件的大致价格代入,再把视觉上的摄像头、Dojo计算芯片、电池和铝合金骨架算上,今天预估一个Optimus机器人的成本价大约合人民币30万。

价格还要再降低80%左右,才能达到马斯克的目标每台1万美元。而一个完全的新产品,成本下降80%,其实只要量产的规模到位了,并没有什么难度,所以别看马斯克在股东大会描述的机器人世界很科幻,但实际上那个未来并不遥远。

今天做机器人的公司很多,最著名的是最近十几年时不时放出一个视频的波士顿动力,此外还有一些在大语言模型出现后突然亮相的具备高级沟通能力的机器人,比如Figure01。但是如果从所有厂商里挑一个综合实力最强、今后最有发展前景的,那就是特斯拉的Optimus。人形机器人看特斯拉一家就足够了!

这个逻辑有点类似于今天谈论火箭发射,只看SpaceX就足够了。为什么这么说?

首先是技术,其次是成本。

特斯拉在汽车自动驾驶上一开始就另辟蹊径,选择纯视觉。这其中首先就是成本上的考量——那时候,一台多线激光雷达和车是一样贵的。马斯克坚信,只要是人眼可以看清的细节,自动驾驶也应该能反应过来,所以用上6-8个单价是几百块钱的摄像头就足够了。

但后来还铁了心坚持用视觉,就是其他方面的考量导致的。因为2021年特斯拉筹划人形机器人的时候,觉得在特定区域工作的机器人也只会用到视觉,而不会用毫米波雷达,更不会用到激光雷达,于是特斯拉自动驾驶方面的数据和训练模型是可以直接移植给机器人使用的。这时候,自动驾驶再切换到激光雷达就得不偿失了。为了两种产品在视觉方面的研发能统一,这才坚定了马斯克自动驾驶只使用摄像头这条路。

而现在看起来,其他厂商人形机器人的纯视觉功能显著落后于特斯拉。

而且,Optimus人形机器人的性能改进是非常迅速的。

在2022年9月,第一次公开亮相里,那个Optimus是由四个工作人员搀扶着上台的,生怕它哪一步没走好摔倒,把整个发布会搞砸。那时的Optimus,也只是向观众挥了挥手。

一年过后的2023年12月,它已经可以叠衣服了。

又过了半年,在2024年5月,特斯拉又发了一段视频,让我们看到它又一次大提升——

在半年前叠衣服时,Optimus背后还连着各种数据线,Optimus背后还站着工程师,随时调整机器人的动作。而今年5月份的视频里,Optimus展示了分拣电池的动作,这个场景就已经有了实用性。因为真正的特斯拉工厂也有这样的工作,就是要把4680圆柱电池按顺序码放在塑料格子里,并且这次Optimus背后没有任何线缆,也没有工程师在旁边实时调试。

特斯拉的工程师Julian Ibarz在视频里给大家补充道,Optimus现在可以自主完成分拣电池的工作,而且可以几个小时一直干下去,直到我们需要给Optimus充电。视频中还有一个细节是,Optimus有一个电池没拿稳,掉到格子与格子之间,它主动捡起来,重新塞进格子中。

这个视频透露出了很多领先。为什么呢?

首先,这是端到端的任务执行过程。什么意思?

因为除了特斯拉和少数其他几个机器人外,大多数机器人执行任务都是任务端到工程师再到机器人的过程,中间夹了工程师的加工处理的步骤。

比如,从视频里看最惊艳的波士顿动力,你别看那些飞檐走壁、运送工具包的机器人好像忍者一样灵敏,但实际上,任务的执行步骤是这样的——

首先设定任务,让机器人把楼下的一个工具包给楼上的工程师送去。接着由那个工程师编程,让机器人通过视觉搜索工具包的位置,规划从机器人当前位置到工具包的路线,然后捡起工具包,接着再规划一条上楼梯的路线,最后把工具包给主人,自己再返回。

全部动作是需要工程师为它逐条设定的,设定完还不行,还要在电脑里的仿真平台上反复模拟多次,比如轨迹设定合理不合理、有没有碰撞、做路径修正、做速度规划……多次模拟后认为没问题了,再把这些指令输入到动作解码器,解码器再把动作程序转码成液压关节的控制参数,最终机器人完成送货。

这中间可能已经花了十几个小时了,我们看到的那段惊艳的视频是十几个小时后最后20秒的成果展现。所以,只要不是端到端的任务执行,就是不具备实用价值的。

而Optimus是自己识别物体,自己完成动作编码,自己执行任务的,中间不再掺杂工程师的辅助,也不需要联网。

其他的机器人哪怕可以做到端到端,持续性也不行。同样的任务10次里成功3次,失败7次,这已经是不错的了。而Optimus可以站着不动、连续几个小时成功完成手部的任务。尽管任务动作并不复杂,但这个体力动作在特斯拉工厂,今天确实有人在做,它真的可以替人完成一部分真实工作了。

而且在这段展示中,其他Optimus机器人也在做分拣工作,有的是分拣衣服,有的是分拣货物,有的是放在格子里,有的是放在盒子里。也就是说,特斯拉训练的机器人模型,已经有了不错的学习能力。

尽管当前的速度大约只有人类熟练工的1/4,但后续提升空间肯定会很大。而且就算只有1/4,机器人是不需要睡觉、吃饭的。

马斯克说,在今年年底就会部署一些Optimus机器人在特斯拉工厂从事简单的工作。

我觉得,大概率没有他说的那么快。因为马斯克通常都会吹点牛,但是他吹的牛也通常会延迟一些兑现,所以大约在2025年上半年,我们就会看到人形机器人在工厂上班。这个上班并不是Demo演示,而是真的从事工人的劳动,只不过这些机器人进工厂并不是为了直接取代工人,更多是为了更多收集数据,提高训练的性能。

再下一步的规划就是手脚协同完成工作,对应的工作就是搬运货物。

特斯拉在这方面也有得天独厚的优势。因为这也是特斯拉工厂里的真实工作,所有为纯电动汽车生产而设置的厂房、工厂,也天然成了人形机器人的训练场地。环境是真实的,任务也是真实的,机器人是自己家开发的,也为了今后可以做类似的工作,于是在数据的收集和实验的调整上简直太友好了。

而除了特斯拉外,其他任何人形机器人公司都没有这样的条件提升机器人在真实环境中工作的可靠性。毕竟哪家公司会以很高的配合度甘愿当另外一家人形机器人公司的“小白鼠”呢?

今天,虽然业界有很多对人形机器人应用场景的设想,但我想,这些预想出来的技术路径的分岔,在PPT里显现出的优势和劣势,都远比不上特斯拉Optimus对产业界的影响。

产品形态的终局是什么,并不是靠分析得出的,而是一个路径积分的过程,谁在哪种重要零件上削减的成本最狠,谁的技术路径选择就对终局有多一分塑造的作用。而特斯拉无疑是整个人形机器人业界最大的影响因子。它选了哪种电机,哪种减速器,哪种的成本就会下降得最快。

这个规律就有点像几年前Meta喊出的元宇宙,实际上,这个行业就它砸钱最多,那么它定义的产品形态差不多就是元宇宙的核心,它如果不做元宇宙了,元宇宙就没有了。

从这个规律看,创业者也不必绞尽脑汁为人形机器人寻找使用场景,特斯拉的那一套就是今后的未来。

好,这就是今天的内容。我是卓克,我们明天再见。

© 版权声明

相关文章

暂无评论

暂无评论...