从产品角度剖析 Optimus 擎天柱
Vol.20221004 Source:Arseny Togulev,Unsplash; 马斯克在 2022 年 AI Day 上给出的预计是 Optimus 擎天柱机器人将在未来 3~5 年内交付,量产可达数百万台,最终价格将不到 2 万美元,比汽车更便宜。 众所周知,马斯克的大饼一般情况下大概率会迟到,但并不会缺席,我将这篇文章定位为产品设计笔记,也结合一些商业考量,总共五部分来剖析我对 Optimus 的产品理解: 1)划时代的节点 2)产品原型设计 3)硬件设计讲解 4)软件设计讲解 5)量产定价逻辑 01 划时代的节点 汽车公司开发机器人并不是什么新鲜事,索尼与本田早在上世纪 80/90 年代开始研发自家的机器人,比较有代表性的机器人分别是机器狗 aibo 和 Asimo,而韩国的现代汽车在 2021 年 6 月便以 11 亿美元完成了从软银集团对 Boston Dynamic 波士顿机器人的收购。 这些知名的机器人公司起家很早,但都有两个致命的问题:商业价值和量产制造。 1)商业价值 你或许能经常性的在社交网络上刷到波士顿动力机器人 Atlas 和机器狗 Spot 的视频,它们能歌善舞,甚至 Atlas 被江湖尊称为跑酷机器人,但那又如何? 如果将 Atlas 比作为“人类”,那么简单理解它由机器人的腿部、手部和大脑组成。 腿部 Atlas 最擅长的是腿部?更适合它的场景或许是人型机器人百米田径比赛,而不是任何的 B 端场景还是 C 端场景,你很难指望一台跑酷机器人在商场、工厂、办公室、住宅等不同场景跑酷。 手部 许多人或许没注意到,Atlas 虽然有手臂,但其手掌的自由度为 0,可以理解成它没有手指,因此并不具备人类生活环境中拿、捏、搬、举和拉等动作,无法在实际生活中替代人的行为,或者说是简单但重复性的劳动需求,我在下一节描述 Optimus 擎天柱设计部分会进一步说明。 大脑 研究人员通过算法模型来训练优化 Atlas 的行动,背后需要依靠丰富的算法和真实场景数据,如果只是在固定场景和行动场景下,那么 Atlas 足够丰富,但是要泛化到其它不同的工业、商业和家庭场景,就目前来说还是停留在实验室研发展示阶段。 2)量产制造 Source:Maximalfocus,Unsplash; 以本田的类人机器人 Asimo 为例,该项目从 1986 年开始企划,直到 2000 年才发布第一代类人机器人,但由于技术复杂和造价成本高,至今没有量产和对外销售的计划,直到 2011 年 Asimo 机器人更新到第 7 代后,本田宣布停止该项目的研发,相关研发团队也已经解散或重新整合。 Source:中信建投; Asimo 机器人虽然没有对外正式销售,但本田此前推出过租赁服务,需要的费用大概在 200万日元/天,当时的汇率计算租赁一年需要花费 120 万人民币。根据中信建投统计,在 2016 年要量产一台发布于 2011 年的 7 代 Asimo 机器人成本也要 250 万美元,在今天需要约 1750 万人民币。 3)道、术、器 因此,从商业价值与量产制造两方面去比对传统人型机器人与特斯拉的原型机,两者在初始的理念上就有很大的不同。 道 美国的机器人公司则偏向于对 “道”的追求,即机器人的智能化信息化,无论是前几年的 Apple Siri 还是 Amazon Alexa,还是在近期发布的 Optimus 原型机身上,我们能看到智能与业务场景落地的一面,前者强调生活助理的角色,后者则强调从工业应用的场景开始。 术 日本韩国的主流机器人公司在产品设计理念上多停留在类人的机械模拟上,即如何侧重机器人如何步行矫健与自然,可以把这理解成是对 “术” 的追求,就如同这些跨国公司过去在手机和其他数码产品的设计理念一样,如同 iPhone 1 代发布以前,日韩手机厂商更多追求工艺、造型和尺寸,或许称之为“匠人”精神。 器 最后是在 “器” 上,我将它理解为机器人满足智能和应用的前提下,厂商是否有能力规模制造以及社会不同部门能够负担的起,Atlas 无论是在 Google 还是在 Softbank,母公司其实都没有很强的硬件规模化制造能力,即使现在卖给了现代,也可能会再次遇到本田 Asimo 的问题。 如果无法控制成本与批量制造,人型机器人则谈不上普及,更谈不上完成算法训练与数据收集的闭环,进一步推动机器人的智能化和商业场景的泛化,而同时在道术器三个维度都有基因优势的公司,或许能够加速人型机器人的到来。 Source:《Build》,Tony Fadell; 特斯拉近期发布的 Optimus 作为机器人业务的原型机也好,作为初代产品也罢,肯定面临大大小小的问题和社会争议,就好比站在今天的视角去审视 iPhone 1 代和 iPhone 4 代,甚至是更早之前的 iPhone 原型机,毕竟好的产品也不是一蹴而就的,可能黑得越多,优化的 Bug 也越多,最后达到市场需求与产品的平衡。 02 产品原型设计 Source:2022 Tesla AI Day; 首先,让我们来回顾下特斯拉 Bot 的发展时间线: 2021 年 8 月, 特斯拉在 AI Day 上宣布了擎天柱 Optimus 概念设计; 2022 年 2 月,特斯拉搭建了擎天柱 Optimus 的研发平台,用以对人型机器人的研究、设计、构建、验证,以及对成本和效率的优化; 2022 年 4月,Optimus 原型机完成初次步行任务; 2022 年 6 月,马斯克宣布今年的 AI Day 延期,可能会有原型产品,此时 Optimus 原型机还在优化骨盆结构; Source:Twitter; 2022 年 8月,Optimus 实现手臂摇摆动作; 2022年 9 月,特斯拉如期发布了擎天柱 Optimus 的原型,Optimus 实现趾间离地动作; Source:2022 Tesla AI Day; 如果对比这个领域的老玩家们,波士顿动力的双足机器人 Atlas 从 2009 年发布至今,迭代了 n 个版本才达到如今的程度,而 Optimus 擎天柱花费 6 个月的时间完成原型机的成绩已经足够快了,毕竟马斯克 6 月份就说了发布会展示的是原型,而不是量产机器人。 Optimus 擎天柱的原型设计沿袭了此前自动驾驶的仿生设计理念,从基于人的纯视觉路线自动驾驶方案,到基于人的机器人设计,即如果要让机器人替代我们生活与工作中的机械式劳动场景,那么需要机器人这款工具能够适用人类的工作环境,是对“以人为本”的最好诠释。 Source:2022 Tesla AI Day; 特斯拉列举了一个普通成年人的全身拥有 200 + DOF(Degree of Freedom, 自由度 ),人的手部拥有 27 个 DOF 。根据特斯拉官方介绍,擎天柱原型机的手部已经达到 11 个 DOF。 Source:《A comprehensive survey on humanoid robot development》; 手部 11 个 DOF 是什么概念?根据《A comprehensive survey on humanoid robot development》,目前市场中人型机器人全身 DOF的数量一般在 20~50 个,如本田的 Asimo 拥有 全身 57 个 DOF & 手部 26 个 DOF,波士顿动力 Atlas 拥有全身 28 个 DOF & 手部 DOF 为 0。 数据好坏其实并不能商业化能够成功划等号,如上节提到的那样——本田的 Asimo 手部 DOF 媲美一个成年人,但是成本摆在那里,波士顿动力的 Atlas 虽然江湖尊称是跑酷机器人,但是手部没有 DOF,跑酷再牛也只是花瓶展示,你不能指望它做什么,抛开人型机器人,隔壁的工业机器人常见的机械臂,单臂一般为 3~6 个 DOF。 Source:2022 Tesla AI Day; 与这些工业机器人——机械臂相比,Optimus 擎天柱原型机已经具备了更加丰富的操控性,可以在特斯拉的制造车间实现简单的搬运货物,或者在办公室里帮同事们浇花拿快递。 Source:2022 Tesla AI Day; 03 硬件设计讲解 Source:2022 Tesla AI Day; 上图橙色部分为汽车和机器人身上的执行器,执行器就是机器的物理驱动装置,在左侧一辆特斯拉中包含前后 2 个执行器,而右边的 Optimus 包含 28 个执行器,最大的不同是汽车的执行器用于加速,例如从 0 加速到 60 英里/每小时、城市驾驶以及高速驾驶等场景。 相反, Optimus 可能并不知道当前的目的是什么,而它可能应用的场景会更多和碎片化,例如先前走、上楼梯、下蹲和回避障碍等,甚至是让 Optimus 拧螺丝。 研发人员以 Model 3 模拟碰撞测试举例,基于生产制造能力与模拟能力,涉及到复杂的模型概念,涉及 3500 万个 DOF ,特斯拉希望将汽车制造上的这些能力迁移到 Optimus 撞击实验上,确保机器人在摔跤的时候不会受到过度损伤,至少是表面的磨损而不是对于 Optimus 大脑的伤害,因为机器人的大脑成本也非常高昂。 Source:2022 Tesla AI Day; 在动作设计上, Optimus 集成了丰富的执行器来完成不同场景的动作,例如下蹲、上楼和拿东西。特斯拉为 Optimus 设计了不同的动作模态来满足不同场景的行为需求,可以理解成是手部、腿部以及躯干之间执行器的组合搭配,为了确保 Optimus 容易行走,因此对足部的稳定性要求比较多。 Source:2022 Tesla AI Day; 为了让机器人完成良好的行走动作,这就需要相关的指标来约束机器人,特斯拉分别在软件和硬件两部分都做了相关控制,这是基于上述不同模态的行走数据来对核心的算法模型进行学习、激励和强化。 此外,Optimus 的设计还借鉴了人类膝关节骨骼和五指的设计结构。例如,人手每秒可以移动 300 次,手掌上有数以万计的传感器,特斯拉也希望在 Optimus 身上也有这么多传感器,能够像人手一样灵活,抓住并操作一些装置;在手部设计上,特斯拉参考了生物学上手部的结构来设计机器人手指的排布、柔韧性程度以及强度。 Source:2022 Tesla AI Day; 在实际的工作场景中包含许多的人体工学设计,因此机器人的设计需要适应人类的工作环境,这里就涉及到了机器人手部驱动装置、执行器以及 DOF 的设计。 04 软件设计讲解 说完硬件,来说说软件。研发人员列举了生活当中通过汽车搬东西以及机器人搬东西两个场景,说明两者的共性以及在软件技术上的可复制性,例如训练机器人在室内办公环境下行走所需的神经网络来自特斯拉 Autopilot 技术。 Source:2022 Tesla AI Day; 此外,还通过计算机视觉和传感器感知物件的造型和室内三维导航。 Source:2022 Tesla AI Day; 那么 Optimus 是如何实现对物理世界物体的控制呢?研发人员将问题分为两部分进行解答,第一步是构建一个自然动作库,来参考真实人类动作;第二步是通过在线对 Optimus 的动作进行适配。 Source:2022 Tesla AI Day; 下图通过动捕装置获取人类小哥的一组动作向量,可视化的关键帧,融合了手部、肘部和部分躯干的数据,然后这组数据被映射到 Optimus 身上,下一步再进行线上适配 Optimus 的动作,以及根据不同真实世界的场景来调整动作库中的一些运动轨迹。 Source:2022 Tesla AI Day; 此外,还包括来自特斯的 FSD(全自动驾驶)和 DOJO 项目(超级计算机)的支持,后者能够将海量的视频数据通过“无人监管”的标注和训练,来把全球特斯拉车型所记录的海量数据进行整合分析,对于 Optimus 来说,一旦在硬件和软件设计达到一定成熟,那么此前特斯拉积累的 30 PB 海量行车数据和算法决策将为 Optimus 擎天柱注入记忆与灵魂。 Source:2022 Tesla AI Day; 现场,特斯拉的首席工程师 Rajiv Kurian 分享了在 Dojo 系统上运行 Stable Diffusion,根据“火星上Cybertruck”的提示创建由 AI 生成的图像。 Source:2022 Tesla AI Day; 有趣的是,Dojo 在日语中表示“训练方法的地方”,指代用于练习冥想或武术的道场,对特斯拉来说是训练其 AI 模型与计算的地方,它能够实现每秒千万亿次浮点运算;特斯拉计划在 2023 年前,在加州的Palo Alto 建造第一台 Dojo ExaPod——即通过 D1 芯片打造的超级计算机集群,该系统构建成功后将成为世界上最强大的超级计算机之一。 05 量产定价逻辑 那么问题来了,Optimus 擎天柱那么华丽丽的项目,马斯克为何要将机器人的价格定在 2 万美元呢? 个人看法:作为一款定位于替代简单机械劳动应用场景的人型机器人,2 万美元也是一个工业制造能力发达的发展中国家人均 GDP 的水平,对于一些知名的跨国企业来说,这也是一个可接受的价位;此外,若早期的产品能够满足社会生产的基本工作,对于正为不断攀升的通胀与人工的企业主来说可谓是解了燃眉之急,机器人的需求强度将会随着产品力的提升而进一步增强,最终大规模普及。 那么如何做到量产?在发布会上官方已经做出回答,一方面如同此前生产 Model Y 一般减少机器人量产所需的零部件数量;另一方面,特斯拉会优化减少每个元件生产所需的能耗,甚至也会减少传感器和布线。 生产制造与成本控制这块可以说是特斯拉的强项,也是已经记录在企业基因里的产品哲学。以 Optimus 擎天柱原型机的电池包为例,2.3 kWh 的电池容量适合机器人一整天的工作,也意味着擎天柱和手机一样要一天一充。 在电池的设计上,与前特斯拉在 CTC 电池地盘一体化的设计相似,电池包中不仅包含电池,也集成了其它的电子元器件,也参考了特斯拉在汽车和能源业务中的生产设计方案,以及现有的基础设施与供应链,所以电池包的量产将会顺利高效。 Source:2022 Tesla AI Day; 根据中信建投,人型机器人的成本构成中,机器人的关节占比 50%,其次是控制器和电池占比 20%,结构件占比 20%,传感器占比 10%,因此对于特斯拉来说如何设计 Optimus 的关节和结构件以及生活工艺+材料成本的控制如同先前控制电动汽车电池成本的挑战一样。 Source:中信建投; 当然,按照目前的形势却是远水解不了近火。虽然马斯克表示在未来 3~5 年内交付,最早会在 2023 年量产,但并不意味着在这个时间区间内 Optimus 就能达到年产量百万台,当然也不意味着期间价格就马上能下探到 2 万美元。 参考此前特斯拉汽车的产能爬坡,目前工厂的生产力可能更多的是让渡给汽车产品的生产制造,而不是市场尚不明确,且产品和市场都还处在探索中,即使造出来短期内这个利润也不会有汽车业务丰厚。 当然,作为后面几年战略性的产品线,人型机器人无疑是一个亮眼的领域,但相关的投入并不会马上体现在公司的业绩与经营效果上。 Reference: [1] 2022 Tesla AI Day; [2] 《特斯拉人形机器人产业链投资机会分析》,中信建投; 封面来源:John Carlo Tubelleza,Unsplash; 免责声明:在任何情况下,本文信息或表述,不构成任何投资建议;若有侵权,请后台联系删除。