文 | 硅兔赛跑 Xuushan
编辑 | 蔓蔓周
特斯拉创始人兼CEO埃隆·马斯克(Elon Musk)连续五年都在强调特斯拉超级计算机Dojo的重要性!
从2019年到2024年,五年时间里,马斯克曾在公共场合23次提及Dojo对特斯拉自动驾驶的作用。作为特斯拉定制的超级计算机Dojo,主要用于训练特斯拉的全自动驾驶 (FSD)神经网络。
特斯拉认为只要有足够的数据,足够的计算能力以及更强的训练能力,FSD的自动驾驶场景就可以从辅助驾驶转向全自动驾驶。
调查显示,特斯拉在2024年第二季度全球市场共交付了44.3万辆汽车,同比下降4.8%,这是特斯拉首次连续两个季度出现销量同比下滑。
面临着电动汽车销量下滑,投资者希望特斯拉接下来能够带来一些“惊喜”,比如说能够实现真正的无人驾驶。而在这其中,Dojo或许成为打开技术大门的关键钥匙。
外媒Techcrunch整理了五年以来,马斯克对Dojo发表的言论。马斯克为什么觉得凭借Dojo可以从英伟达手里“抢生意”?超级计算机又将会如何加强特斯拉的AI能力?特斯拉的自动驾驶布局是怎样的?我们可以尝试从这些言论中找到答案。
01 Dojo的产生:特斯拉自动驾驶技术的底座支柱
在Dojo横空出世之际,市场就对其抱有较高期待。摩根士丹利分析师Adam Jonas认为Dojo可能为特斯拉市值增加高达5000亿美元,因为它在自动驾驶领域带来“不对称优势”。
在他看来,Dojo可以为特斯拉节省高达65亿美元的成本,并加速自动驾驶技术和人形机器人的研发进程。那么在5年前,Dojo是因何产生的?
1、2019年4月22日:特斯拉首次提及Dojo
在特斯拉的自动驾驶日上,特斯拉AI团队首次登台讲述自动驾驶设备以及全自动驾驶背后所支撑的AI技术。特斯拉分享了自己专为神经网络和自动驾驶汽车设计的定制芯片信息。
在活动期间,马斯克透露Dojo是一台用于训练AI的超级计算机。他还指出,未来特斯拉所有汽车都将配有自动驾驶所必备的硬件,用户只需要软件更新就可以升级系统,拥有自动驾驶功能。
2、2020年2月2日:特斯拉宣传Dojo功能
在社交媒体X上,马斯克表示特斯拉将会拥有超过一百万辆联网汽车,这些汽车均配备了实现全自动驾驶所需的传感器和计算能力,并大力宣传Dojo的功能。
“我们的训练超级计算机Dojo能够处理大量视频训练数据,并高效运行超空间阵列,该阵列拥有大容量、高参数以及超高宽带的特性。稍后将详细介绍。”
3、2020年8月14日:马斯克预告Dojo发布时间
马斯克在其社交媒体强调,特斯拉正在开发一款名为Dojo的神经网络超级计算机,该设备可以处理大量真实视频数据,甚至比喻这台超算设备为“野兽”。他预测Dojo距离初代产品发布至少还需要1年时间。
4、2020年12月31日:Dojo不是必需品,但重要
马斯克表示Dojo不是必需品,但它能够优化自动驾驶功能。“比人类驾驶员更可靠是不够的,Autopilot 的安全性要高于人类驾驶员10 倍以上。”
可以看到,在Dojo还尚未正式发布时,特斯拉对Dojo就持有较高期待,将其视为自动驾驶技术的重要支柱。
02 正式推出Dojo演示其AI能力
尽管Dojo的发布时间比预期更长,但超级计算机Dojo正式发布时还是受到了马斯克和市场的高度重视。马斯克视其为特斯拉AI业务体系的算力基础设施,以及实现自动驾驶的关键技术支撑。
5、2021年8月19日:特斯拉首次发布Dojo
特斯拉团队在其首个AI Day上宣布正式推出Dojo,并且推出了D1芯片。该芯片将和英伟达的GPU一起为超算Dojo提供计算能力。在活动上,特斯拉还指出Dojo的AI集群可以容纳3000个D1芯片。
6、2021年10月12日:公布Dojo技术白皮书,特斯拉采用深度学习新算法
特斯拉发布了一份Dojo技术白皮书,里面涉及算法指南,并且支持可配置浮点格式。白皮书内提及了一种新型二进制浮点算法的技术标准,可以用于深度学习神经网络。通过该算法,Dojo能够仅靠软件、或者仅靠硬件,以及软硬件结合的方式实现各类控制组合。
7、2022年8月12日:特斯拉将逐步采用Dojo,减少GPU采购
马斯克表示特斯拉将“逐步”采用Dojo,并表示明年公司将不需要购买那么多GPU。
8、2022年9月30日:实物演示Dojo能力,特斯拉已安装首个机柜
在特斯拉的第二个AI Day上,特斯拉透露他们已安装第一个Dojo机柜,并进行了2.2兆瓦的负载测试。特斯拉表示每一个Dojo将会有25个D1芯片组成。
特斯拉还上台演示了Dojo的能力,它可以通过稳定扩散模型来利用AI生成“火星上的Cybertruck”图像。
特斯拉立下了将在2023年第一季度完成Dojo Exapod集群搭建的目标,计划在帕洛阿尔托建造七台Exapod。
相较于其他的超级计算机,Dojo的上线节奏较快,并且很快对特斯拉的实际业务产生使用价值。但我们也能看到,早期,马斯克对Dojo的预期过高,比如说减少GPU采购等方面。
03 高风险、高回报,马斯克重金押向Dojo
相较于前两年,从2023年开始,Dojo逐渐向人们展示作为一台超级计算机能够切实给企业带来哪些效益,以及告知人们投入研发一台超级计算机是一件“高风险、高回报”的投资。
9、2023年4月19日:Dojo被视为不可能成功的赌注
马斯克在特斯拉第一季度财报发布会上告诉投资者,Dojo“有可能将培训成本提高至十倍以上”,并且“Dojo有可能成为一种可商业化的业务,我们会像亚马逊提供网络服务一样向其他公司提供这种服务”。
马斯克还指出,他将 Dojo视为一种不太可能成功的赌注,但“值得一试”。
10、2023年6月21日:Dojo上线特斯拉数据中心
特斯拉AI官方账号在社交媒体上表示自己的神经网络训练已经应用于用户的车辆,贴文中列出了特斯拉当前所需的计算能力和预计能够提供计算能力的时间表。图标上透露出,Dojo将于2023 年7月开始投入运用。马斯克当天表示,Dojo已经上线并在特斯拉数据中心运行任务。
该公司还预测,到2024年2月左右,特斯拉的计算能力将跻身全球前五。到2024年10月,特斯拉的计算能力将支持100百亿亿次浮点运算。
11、2023年7月19日:计划投入10亿美元建设Dojo
特斯拉在第二季度财报中指出,该公司已开始建设Dojo。马斯克还表示,2024年特斯拉将会在Dojo上投入超过10亿美元。
12、2023年9月6日:联手英伟达,解决AI计算难题
马斯克在X上发帖称,由于AI训练计算比较有限,现有的软件系统管理特斯拉每天从汽车获得1600亿帧视频数据极其困难,现阶段英伟达和Dojo将联手解决这个问题。
Dojo的出现,正好赶上了AI热潮。Dojo的超算能力为处理和分析海量自动驾驶数据提供了可能,也证明了特斯拉在自动驾驶领域构建软硬一体化的技术能力。
04 扩大Dojo规模,将在AI领域投入百亿美元
Dojo的推出反映了特斯拉在AI算力竞赛中战略布局的先手能力,为公司在全球自动驾驶技术竞争中赢得了先机。
13、2024年1月24日:Dojo系列路线图披露
在特斯拉第四季度和全年财报电话会议上,马斯克再次承认Dojo是一个高风险、高回报的项目。他还表示,特斯拉正在寻求“英伟达和Dojo双管齐下”。“Dojo 正在发挥作用”,并且“正在开展培训工作”。他指出,特斯拉正扩大规模,并制定了“Dojo 1.5、Dojo 2、Dojo 3 等计划”。
14、2024年1月26日:投资5亿美元组建Dojo
两天后,特斯拉宣布计划斥资5亿美元在布法罗打造一台Dojo超级计算机。马斯克在X上发帖称,虽然 5 亿美元是一笔大数目,但“仅相当于英伟达10k H100 系统。特斯拉今年将在英伟达硬件上投入更多资金。目前,(特斯拉)在AI领域保持竞争力的底线至少是每年数十亿美元。”
15、2024年4月30日:训练模块D2已投入生产
据IEEE Spectrum报道,在台积电的北美技术研讨会上,该公司表示Dojo的下一代训练模块 — — D2 已经投入生产。D2将所有的Dojo模块放在一块硅晶圆上,而不是连接25个芯片连在一起,制作一块模块。
16、2024年5月20日:Giga Texas工厂扩建超算集群
马斯克指出,Giga Texas工厂扩建的后部将包括建设“超密集超级计算机集群”。Giga Texas,也就是特斯拉位于德克萨斯州奥斯汀的超级工厂,是特斯拉在美国的一个重要制造基地。
17、2024年6月:将在AI方面投入百亿美元
马斯克在X上发帖称,由于超级工厂Giga Texas的南部扩建工程尚未完成,所以没有地方做AI训练,英伟达GPU芯片也就还放在仓库里。据介绍,等到此次扩建工程完成,该工厂将“容纳5万台H100用于FSD训练”。
“特斯拉今年AI方向的投入约为100亿美元,其中约一半用于内部支出,主要是特斯拉设计的AI推理计算机和传感器,这些设备都和我们所有的汽车上,此外还有Dojo。”
据马斯克介绍,在构建人工智能训练超级集群方面,英伟达硬件约占成本的2/3。他目前对特斯拉今年将有大约30亿至40亿美元的费用付给英伟达,以采购相关硬件。
18、2024年7月:没有适合特斯拉的新AI硬件
马斯克今年7月在X上透露,目前的特斯拉汽车可能没有适合该公司下一代AI模型的硬件。他说,如果不升级汽车推理计算机,“下一代 AI 的参数数量增加约 倍是很难实现的”。
总体看来,想要打造一台用于垂直领域的超级计算设备并非一件易事,时间、资金、成本等等一些问题导致Dojo的发展较为曲折。
05 合作与竞争共存,特斯拉或凭借Dojo与英伟达“掰手腕”?
如今,马斯克想要借助Dojo的超算能力进一步拉开特斯拉与其他企业在自动驾驶领域的差距,甚至还想和英伟达“争一争”计算资源业务。
19、2024年7月23日:或通过Dojo与英伟达展开竞争
特斯拉第二季度财报电话会议上,马斯克表示市场对英伟达的硬件需求非常大,不少客户很难获得 GPU。
“在此需求之下,我认为我们需要在Dojo上投入更多精力,以确保我们拥有所需的训练能力,”马斯克说。“我们确实看到了通过Dojo与英伟达展开竞争的途径。”
特斯拉投资者资料中曾有一张图表,到2024年底,特斯拉AI训练能力大约和9万台H100 GPU所提供的效果相等。
当天晚些时候,马斯克在X上发帖称,Dojo 1到年底,将会与约8000台H100 GPU提供等效的在线训练能力。他还展示了这台超级计算机的照片,看上去,它似乎使用了与特斯拉Cyber trucks相同的类似不锈钢外壳。
20、2024年7月30日:下一代车载计算平台AI5 18个月后发布
马斯克在回复某人的帖子时表示,下一代车载计算平台AI5距离大批量生产还有约18个月的时间,该帖子声称要成立一个名为“特斯拉 HW4/AI4车主对AI5发布时落后感到愤怒”的俱乐部。
21、2024年8月3日:拥有10万+英伟达GPU,特斯拉大力投入AI
马斯克在X上发帖称,他参观了“Giga Texas(又名 Cortex)的特斯拉超级计算集群”。他指出,该集群将由大约 100000 个 H100/H200 Nvidia GPU 组成,并配备“用于 FSD 和 Optimus 视频训练的海量存储空间”。
可以看出,Dojo不但为自动驾驶算法的训练和优化提供了强大的计算支持,加速了从L2到L5级别自动驾驶的演进,而且也为特斯拉提供新的AI竞争优势。
特斯拉重金押注Dojo
通过历年以来马斯克发表关于Dojo的言论可以很清晰的看出,Dojo是马斯克AI帝国的关键“基石”,其出现的过程也体现了马斯克在自动驾驶技术上的前瞻性和敏锐程度。
然而,特斯拉在Dojo上的发展并不太顺,Dojo的后续发展并没有达到特斯拉的预期,这也意味着特斯拉的自动驾驶布局尚未完全成型。
但Dojo的量产和应用,也将会推动自动驾驶技术将更快地从概念走向现实,引入其他同赛道竞争者在AI领域的的投入,也为未来智能交通变革奠定了基础。
评论