1. 首页 > 知识问答

英伟达股票分析(为什么特斯拉超算Dojo却失声)

2024年,英伟达的股票一飞冲天,成功出圈,成为茶余饭后谈资。截止2024年5月31日,市值达2.7万亿美元,而特斯拉的市值只有5580亿。英伟达的市值是特斯拉的4.8倍。

这么紧要的关头,特斯拉的超算Dojo(计算芯片为D1)却没有声音了,且特斯拉首席执行官马斯克(Elon Musk)频频示好英伟达,那么,是因为特斯拉的超算Dojo没戏了吗?

图1 2024年英伟达股价一飞冲天,市值超2万亿美元

特斯拉Dojo曾是英伟达的有力竞争者

在AI芯片的角逐中,英伟达一览群雄,凭借强大的软件生态,全世界最顶尖且人数最多的科学家、算法工程师、软件工程师群体,喜滋滋的在英伟达芯片上开发算法,互相分享“开源代码”,自愿充当英伟达的销售,帮助英伟达做大市场。

不光国产替代举步维艰,国外的友商也一筹莫展,英特尔、AMD和谷歌觊觎已久,但是,也挡不住英伟达一路高歌。特斯拉的超级计算机Dojo和芯片D1也是众多挑战者之一,马斯克贵为谷歌明星,也没有主角光环。

图2 特斯拉也是英伟达的众多挑战者之一,没有主角光环

2022年9月30日,特斯拉AI Day上,Dojo 直接拉出了英伟达 A100 来对标。与英伟达的 A100 GPU 相比,每一颗 D1 芯片(配合特斯拉自研的编译器)在自动标注(auto-labeling)任务中最高能够实现 3.2 倍的计算性能,而在占用网络(occupancy network)任务中最高能够实现 4.4 倍的计算性能。如果从总体目标来看,根据特斯拉官方的数据显示,在同样的成本之下,它所构建的 Dojo 超级计算机能够实现 4 倍的性能,能耗比提升 1.3 倍,计算系统的占地面积也会缩小为以往的 5 倍。

图3 一个 Dojo 训练模块,相当于 6 个通用 GPU 性能,而能耗和成本仅相当于 1 个 GPU

马斯克频频示好英伟达,Dojo失声

2023年7月,马斯克表示,“老实说,若英伟达交出足够GPU,我们也许不需要Dojo。”

2023年8月29日,特斯拉 10,000 块 H100 GPU 集群上线,加速自动驾驶 FSD V12 落地。

2024年1月,特斯拉投资 5 亿美元在纽约州的布法罗市(Buffalo)建造一台Dojo超级计算机。马斯克表示,5 亿美元虽然显然是一大笔钱,但只相当于 Nvidia 的 1万块H100 系统。特斯拉今年在英伟达硬件上的支出将超过这一数字。目前,在人工智能领域保持竞争力每年至少需要数十亿美元。

2024年4月10日的采访中,马斯克透露,他的人工智能初创公司xAI (注:5月26日官宣融资60亿美元)目前正在训练其 Grok 大型语言模式的第二版,训练Grok 2模型需要大约两万个英伟达H100 GPU,而Grok 3以上的版本将需要10万片H100。分析指出,xAI的消息让投资者相信,英伟达芯片仍存在一些潜在的大顾客,将继续增加对英伟达芯片的需求。

特斯拉频频向英伟达示好,是因为自家的Dojo超算没戏了吗?准备放弃自家的Dojo超算吗?

特斯拉没有放弃Dojo,但是要保持低调

因为特斯拉的Dojo研发进展延期,导致特斯拉极度依赖英伟达的H100芯片,所以,2023年7月后,Dojo芯片的宣传大大减少,保持低调,避免英伟达提防,不卖给特斯拉GPU,妨碍特斯拉自动驾驶FSD的开发。

当然,还有另外一种说法,2024年6月13日,股东们将对马斯克创纪录的薪酬方案进行第二次投票,按目前的股价计算,马斯克的薪酬价值约为 550 亿美元。由于 Glass Lewis 等代理顾问现在建议投资者投票反对批准马斯克的薪酬,6月13日年度会议的结果比预期的要紧张。

在这种情况下,马斯克对于做高创新业务(Dojo超算,机器人)的声量,拉高公司的股价动力不足,假如投票没有通过,马斯克可能会把Dojo和机器人业务剥离出特斯拉。

同时,英伟达股价近期急速拉升,会提高股东对于特斯拉超算Dojo的未来前景预期,增加马斯克的谈判筹码。

图4 如果25%投票权获得通过,AI和机器人业务会保留在特斯拉

而且,马斯克和特斯拉以创纪录的速度采购英伟达的人工智能芯片,黄仁勋和马斯克的关系非常好,对马斯克提供了支持。当地时间5月27日消息,马斯克创纪录报酬的关键投票前几周,英伟达(Nvidia)的明星创始人黄仁勋(Jensen Huang)在上周末上传到 YouTube 的雅虎财经采访中,支持特斯拉的人工智能自动驾驶汽车战略。“特斯拉在自动驾驶汽车领域遥遥领先”,"这项技术确实具有革命性,他们所做的工作令人难以置信”。黄仁勋等人对他的新人工智能战略投下的信任票可能会增加马斯克“讨薪”成功的机会。

图5 2015 加州圣GPU技术大会,黄仁勋采访马斯克,谈论自动驾驶、人工智能和汽车技术的未来

为什么说特斯拉不会放弃Dojo

第一,台积电确认Dojo芯片已经量产。在2024年4月底的台积电北美技术研讨会上透露,特斯拉用于人工智能训练的 Dojo 晶圆系统处理器现已投入量产。芯片量产是非常重要的里程碑,这说明特斯拉的Dojo芯片并没有黄。2023年9月摩根士丹利表示,其半导体团队调查显示,特斯拉在2023年订购了大约在4万到5万片D1芯片。

图6 台积电确认特斯拉Dojo的D1芯片已投入量产

第二,从2023年底的宣传开始,特斯拉开始使用“H100 GPU等效单位”(H100 GPU equivalents),而以前说的是“H100”。推测原因是,部分算力是D1芯片折算的。
如果特斯拉非常实在,3颗D1芯片可折算为1颗“H100 GPU等效单位”,非常扎实。
如果特斯拉愿意像英伟达一样虚标算力,1颗D1芯片折算为1颗“H100 GPU等效单位”,也证据充分。

第三,特斯拉自产自销。而特斯拉的智驾FSD V12.3反响良好,智驾训练需求强烈。第一代Dojo芯片即使不完美,只要持续投入,总会能用。只要应用在自己的智驾系统中,就能实现价值,获得迭代机会。

  1. 2023年7月财报电话会议中,马斯克表示并不会对 Dojo 项目的支出进行公开,但表示2024年会投入 10 亿美元在 Dojo 项目上
  2. 2024年1月26日,纽约州州长凯西·霍楚(Kathy Hochul)称,特斯拉将投资5亿美元(相当于约 1 万颗 H100 GPU),在该州的布法罗市(Buffalo)建造一台Dojo超级计算机。马斯克很快证实了这一消息。

第三,特斯拉D1芯片的成本优势仍然值得期待。特斯拉D1芯片的物理算力和英伟达A100几乎相同(116%,362/312 TPOS),从实际智驾任务来说,实际算力和H100差不多(A100的3~4倍左右)。考虑到英伟达的高毛利(超76%),特斯拉D1芯片的成本优势仍然值得期待。

  • Nvidia 对其芯片的收费如此之高(一块H100的售价为35,000美金,超过1辆小米汽车SU7 Pro;公司整体毛利率超76%),如果 Dojo 的功能只有 20%,而成本却只有 10%,那也是值得的。
图7 1块英伟达H100卡的价格超过1辆小米汽车SU7 Pro

第四,特斯拉的AI算法软件能力特别强。AMD和英特尔挑战英伟达一直失败,软件能力太差是重要原因。而特斯拉的智能驾驶FSD和AI Day一直以来引领全球自动驾驶AI算法趋势,可以说,特斯拉在AI Day上面公开什么算法,其他智驾公司就做什么算法,这是特斯拉做AI芯片的巨大优势。

  • 2021年,特斯拉在第一届AI DAY上推出了基于Transformer的BEV(鸟瞰图),全球自动驾驶行业马上跟随,在2023年部分国产算法商实现了量产落地。
  • 在2022年特斯拉AI DAY上,特斯拉分享了Occupancy Network(占用网络),全球自动驾驶行业马上跟随。
  • 到2024年又率先实现了端到端的自动驾驶技术量产落地,把论文变成了能落地的工程实现,极大的激发了全球自动驾驶行业对于端到端的研发热情。

第五,特斯拉的D1芯片试图打造AI计算专用芯片。比如,比特大陆自研虚拟货币矿机专用芯片,挖矿场景成功取代了英伟达的GPU。

  • 特斯拉的训练场景专注于图像网络。因此,他们的架构和推荐网络和基于 Transformer 的语言模型需要非常不同的架构。图像/视频识别网络对计算、芯片间通信、芯片内部内存和芯片外部内存储的要求截然不同。
  • 特斯拉是全球首次采用台积电晶圆级互连 (InFO_SoW) 技术的客户,InFO_SoW 旨在实现高性能连接,使得 Tesla Dojo 的 25 个芯片可以像单个处理器一样工作。晶圆级处理器,例如 Tesla 的 Dojo 和 Cerebras 的晶圆级引擎 (WSE),比多处理器机器的性能效率要高得多。它们的主要优点包括内核之间的高带宽和低延迟通信、降低的电力传输网络阻抗以及卓越的能源效率。
  • 更重要的是,台积电下一代晶圆上系统平台CoW_SoW 支持在处理器块上进行 3D 堆叠 和 HBM4 内存安装,解决特斯拉D1芯片必须专门使用片上存储器,不灵活的问题,从而满足所有类型的AI应用。
图8 特斯拉Dojo的“晶圆上的系统”(system-on-wafer)

为什么说Dojo的确遇到了困难

第一,特斯拉超算Dojo的研发进展的确滞后了。2022年 AI Day 上的说法,Dojo 的量产原本预计在2023年第一季度进行;但很明显,Dojo 一直到2023年 7 月份才开始量产,出现了明显的延迟,据报道,原因是其降本不及预期

第二,2023年底,在自研的重要节点上,多名Dojo研发负责人离职。

  • 2023年11月,负责Dojo超算项目的负责人、同时也是特斯拉自动驾驶硬件高级总监加内什·文卡塔拉马南(Ganesh Venkataramanan)离职,职位由前苹果高管彼得·班农(Peter Bannon)负责。彼时有消息称,很可能是因为Dojo第二代芯片未达标,加内什遭到解雇。加内什此前负责特斯拉Dojo超算项目已达5年,在进入特斯拉之前,他曾在美国知名半导体公司AMD任职近15年。加内什的离职,被认为是特斯拉自研芯片不力,或者没有设想中那么顺利。
  • 2023年12月,特斯拉AI基础设施负责人Tim Zaman离职前往谷歌DeepMind
图9 2021年特斯拉AI Day,Ganesh展示Dojo的D1芯片,2024年底Ganesh离开特斯拉

第三,特斯拉位于德克萨斯州奥斯汀的数据中心的进度落后于计划。2024年4 月中旬,马斯克参观了占地 1000 万平方英尺(93 万平方米)的特斯拉工厂南侧的工地。在那里,他发现一处设施由于交付问题、恶劣天气和其他施工问题而失去了大部分屋顶和底层。计划中的 Dojo 超级计算机站点受到了问题的困扰,首席执行官埃隆·马斯克 (Elon Musk) 对这些延误感到“愤怒”,马斯克解雇了施工经理。

第四,特斯拉遇到了现金流问题。作为2024 年第一季度财报的一部分,这家电动汽车巨头透露,"受第一季度库存增加 27 亿美元和人工智能基础设施资本支出 10 亿美元的影响(买H100的卡),该季度自由现金流为-25 亿美元。"

为了负担得起人工智能的巨额投资,马斯克几乎愿意不惜一切代价削减其他方面的成本。4月15日,马斯克在致员工的内部电子邮件中表示,该公司将裁减超过10%的全球员工,“为下一个增长阶段周期做好准备”。根据特斯拉全球员工数量计算,此次裁员影响的员工超过1.4万人。马斯克已经解雇了数千名员工,解雇了行业领先的超级充电站网络背后的团队,并取消了为即将推出的 2.5 万美元入门车型投资全新装配线的计划。

第五,Dojo面临迅速淘汰的风险。英伟达支撑人工智能行业突飞猛进,让D1芯片面临被迅速淘汰的风险。英伟达狂轰乱炸的芯片性能迭代宣传,可能导致投资人信心不足,导致Dojo的研发经费投入不足。

5月23日英伟达Q1财报电话会议上,黄仁勋透露,英伟达下一代“最强”AI芯片B100,生产性发货将在2024年第二季度开始并在第三季度逐步增加,客户的数据中心应该可以在第四季度起使用上Blackwell平台。B100将采用新一代Blackwell,算力、能效相比采用Hopper架构的H100、H200提升幅度可达一倍。

2024年3月20日,英伟达投下了Blackwell B200 炸弹,这是下一代数据中心和 AI GPU。训练一个 1.8 万亿个参数的模型以前需要 8000 个 Hopper GPU 和 15 兆瓦的电力,如今,2000 个 Blackwell GPU 就能完成这项工作,耗电量仅为 4 兆瓦。在具有 1750 亿个参数的 GPT-3 LLM 基准测试中,GB200 的性能是 H100 的 7 倍,英伟达称其训练速度是 H100 的 4 倍。信心不足可能会导致Dojo的研发经费投入不足。

总结

在英伟达的众多挑战者中,特斯拉的Dojo有两大优势:

第一,特斯拉只服务于特定应用场景(自动驾驶、机器人)。其他想做通用AI训练芯片的公司,需要满足各种不同场景,芯片和软件的灵活性要求高、成本上挑战大;另外,开发者生态建设上壁垒很高,新工具链难以面面俱到,难以吸引全球的开发者。但是,特斯拉在自动驾驶场景是王者,有能力定义行业算法方向,芯片和软件工具链只需要做好这个场景就能切入,完全有可能做到,挟“软件”以令“芯片”。

第二,特斯拉自动驾驶FSD训练数据量巨大,对训练服务器的算力需求量巨大。特斯拉规划,在2024年10月,算力达到100Exa-Flops,大约需要30万颗D1芯片。如果有3家车厂部署了特斯拉的Dojo服务器,则出货量接近100万颗,销售额达到100亿美金级别。

所以,特斯拉不会放弃自研超算Dojo,困难是暂时的,失声也是暂时的。

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站不拥有所有权,不承担相关法律责任。如发现有侵权/违规的内容, 联系QQ15101117,本站将立刻清除。

联系我们

在线咨询:点击这里给我发消息

微信号:666666