编辑|乌鸦智能说
在本期CadenceLIVE访谈中,来自Cadence的Anirudh Devgan与黄仁勋展开了对话。Nvidia创始人兼首席执行官黄仁勋在对话中表示,在AI发展过程中,底层计算将发生转型,加速计算将有效提升计算性能,加速计算和人工智能将彻底改变所有行业,从设计电子产品和软件到开发新材料和药物。他认为,加速计算将使人工智能模型更加高效,并帮助我们节省能源。
他还分享了自己最感兴趣的三个行业:数据中心及计算、机器人和自动系统、生物领域。他非常热衷于全新的自主系统领域,还将着手打造下一代人形机器人。制造一个人形机器人的成本可能会低于人们预期,可能只需1万到2万美元,而汽车的售价就在这个区间。人形机器人在为人类设计的环境中可能比人类更加灵活、高效,比如制造车间、仓库等都是为人类设计的。生物学作为一个非常复杂的领域,还有很多创新空间,面对这样一个大规模且高度混沌的系统,他相信通过计算及将数据驱动与模拟方法相结合,可以有效解决很多存在的问题。
他还在访谈中谈到了Nvidia的管理秘诀,强调授权员工、公开透明以及跨团队协作的重要性。在英伟达,所有决策都是公开透明的。黄仁勋也喜欢当着大家的面,合理地阐述思路,这种工作方式也深深影响了英伟达的员工。他强调,英伟达是一家全栈公司,做联合设计,因此在组织架构和运营上特别重视跨团队同步。以下为本期内容目录:
01 加速计算势在必行
02 黄仁勋最期待的三个行业
03 AI和数据中心的功耗问题
04 英伟达的管理秘诀
/ 01 / 加速计算势在必行
Anirudh Devgan:非常感谢,Jensen。看到我们的这种伙伴关系令人难以置信。你现在确实是教父了,大家都这样称呼你。作为倾注全部心血推动行业创新的人,当"教父"说了什么,事情就会发生,当"教父"想要什么,就一定会得到,虽然对你来说显然不是这样。
但就AI而言,你占据了最佳位置,成为了推动大部分创新的引领者。在未来5年,你觉得会发生什么变化?比如模型会变得越来越大、越来越专门化,数据中心的架构会有何变化?当然,这是一个长期的过程,但特别是在未来5年里,你认为AI会沿着何种方向发展?
Jensen Huang:让我们先退一步看看大局。确实,Anirudh,你的主题演讲很可能是对底层计算转型最集中、最生动的体现和例证。原因很简单,我们都知道,没有计算,就没有Cadence;同样,没有Cadence,也就没有计算。所以,底层计算平台的根本转变和转型,对Cadence来说是最基础的,也是对于每个依赖Cadence的行业来说是最基础的,而几乎所有行业都依赖Cadence。
回顾你的主题演讲,仅仅是Millennium项目一个就足以突出加速计算带来的巨大好处。一旦进入加速计算时代,就能实现生成式AI,而没有向加速计算的这一转型,生成式AI将非常难以实现。加速计算的好处是,过去用CPU算力扩展很难扩展的任务,突然之间就能获得1000倍的加速;在此基础上再叠加生成式AI,又能获得30倍的性能提升;把生成式AI和加速计算结合使用,能获得10万倍的性能放大。
你一开始也说得非常好,设计师希望探索多模态、多维的设计空间,其中没有一个正确答案,只有一个最佳答案。我们需要探索成千上万种不同的可能性,但用遍历的方式来穷举所有设计可能性显然是不可能的,即使有无限计算能力也无法完成。所以我们需要AI来帮助我们跳到特定的探索和优化区域,然后来精确定位。
因此,我们可以在多个方面开展密切合作。加速计算首先将改变Cadence开发软件的方式,也将改变我们使用软件的方式。除此之外,我们设计电路、芯片、印制板、系统,现在甚至包括数据中心,都在Cadence内完成。我们从头到尾,从电路设计、逻辑设计、系统设计,到仿真、验证、形式化验证,以及其他各个环节,都是使用的你们的工具。现在,设计空间不再局限于芯片或系统,而是横跨整个领域的联合设计。计算机科学行业称之为全栈,而在工程领域,我们称之为联合设计。无论叫法如何,关键是要在整个系统上进行创新。
你还触及了一个非常深刻的观点,通过投资加速计算、AI和数据中心,我们能够设计出更高效、更节能的产品。要知道,我们只需要设计一次芯片,但它会被运行数万亿次;我们只需建设一次数据中心,但你展示的6%能效优化,将为全球数十亿人持续带来节能收益。所以,虽然我们会在AI数据中心上消耗更多电力,但另一方面,对于剩余98%的社会能源消耗,我们将通过设计更好的软件、芯片、系统、电脑、汽车、手机、材料等来节省能源。我认为,现在确实是一个被人们称为"转折点"或"过渡期"的时代,而你的主题演讲正是对此最好的诠释,这也是令人非常振奋的时代。
Anirudh Devgan:Nvidia所做的转型非常了不起。你们不仅在制造最佳芯片,更是在构建整个数据中心、整个系统和整个软件栈。你在GTC的主题演讲中展示了机架、液冷数据中心等,涵盖了整个系统架构。对于一家典型的芯片公司来说,这样的转型并不容易。Nvidia已经成为一家完整的软件系统公司。我很好奇,你是如何做到这一转型的?一开始你就有这样的想法,还是渐渐展开的?因为对一些公司来说,即使只是尝试从系统公司转型为芯片公司都很困难,但Nvidia已经完美地实现了从芯片到系统、软件、数据等全方位转型,我很想知道你是如何完成这一过程的。
Jensen Huang:我们当初做出了一些正确的判断,这也经过了我们的长期观察检验。
第一,我们观察到,在一个程序中,很小一部分代码占用了绝大部分运行时间。比如对于CFD(计算流体动力学),可能只有3%的代码占用了99.9999%的运行时间。如果是这样,为什么要对所有100%的代码使用完全相同的工具、仪器和处理器呢?不如针对97%的代码采用一种方式,针对3%的代码采用另一种特殊方式,这样就可以将应用程序加速10万倍。这是我们当初的观察结果。
当然,能从这种方式中获益的应用程序种类很小,我们选择计算机图形学作为加速计算的第一个应用领域是很明智的,因为它需要大量并行计算,而且是一个创新迭代很快的大市场,非常适合尝试加速计算。
但我们一直设想,除了计算机图形学之外,还会有许多其他应用程序加入加速计算的行列。加速计算与通用计算是不同的,通用计算可以创建一种处理器来运行所有代码,但加速计算则不是这样,因为它是专门加速特定应用的计算平台,必须知道加速的是什么应用。
在Nvidia,我们从计算机图形学开始,然后扩展到影像处理、分子动力学等领域。顺便说一句,我很高兴看到你们在数字生物学领域所做的工作。如今我们把它称为"药物发现",之所以这样称呼,有点像蘑菇发现,你进入森林就会发现蘑菇。你能想象,如果把芯片设计行业称为"芯片发现"行业吗?那是因为我的工程团队会过来说:“嘿,看看我们发现了什么,是Blackwell!”但第二年可能就一无所获了。这在我们芯片设计行业是无法想象的,因为我们不会做出没有目标和计划的事情。
之所以会这样,是因为生物学比我们想象的要复杂得多。我们可以调整晶体管,使用设计工具,但无法对生物做同样的事情,设计工具需要追上生物学的步伐。所以我认为,生物学将成为Cadence的一个巨大产业,你之前提到的1%机会,对生物学来说将是一个巨大的机遇。
生物学、交通运输等,每个行业的应用都不尽相同,或涉及成像、粒子物理、流体、有限元等,算法也不同。Cadence和Nvidia都是数学和计算公司,这就是我们合作如此紧密的原因。当我和Anirudh一起时,我们都能很快理解对方,点头便是明白,摇头便是不理解。如果我们同时摇头,那就说明我们遇到了麻烦。无论如何,我们始终专注于特定领域的加速计算。在过去30年里,我们在CUDA架构之上积累了大量特定领域的库,涉及粒子、成像、人工智能等方方面面。
/ 02 / 黄仁勋最期待的三个行业
Anirudh Devgan:你在GTC上的主题演讲非常精彩,以至于我建议你下次租用更大的体育馆场地。你强调了几乎所有行业的横向赋能,但也提到了一些潜力巨大的行业,比如你谈到的生命科学、机器人和自动驾驶等。在短期或中期内,你最期待哪一两个行业的发展?
Jensen Huang:你提到的数据中心和计算、汽车(我把它概括为机器人和自动系统)、生物领域,正是我最感兴趣的三个行业。
对于自动系统这一大类,无论是汽车、卡车、外卖机器人还是人形机器人,都有很多共同点。它们都需要多传感器输入、极其重视功能安全性,所以计算机的设计、验证、认证非常重要。它们使用的不是普通的操作系统,而是无故障安全操作系统,系统设计要非常谨慎、专门化。当然,人工智能的使用也极为广泛。而且这些系统都将与云和数据中心实时连接,以便更新新体验、上报故障异常情况,并下载新模型。
我非常热衷于这个全新的自主系统领域,我们将着手打造下一代人形机器人。制造一个人形机器人的成本可能会低于人们预期,可能只需1万到2万美元,而汽车的售价就在这个区间。人形机器人在为人类设计的环境中可能比人类更加灵活、高效,比如制造车间、仓库等都是为人类设计的。所以我对这一领域很感兴趣。
我也很期待我们能将生物学转变为一个工程领域。科学发现的过程固然重要,但往往是零散和偶然的,这就是摩尔定律存在的原因。如果我们不转向加速计算和AI,计算机行业也将受到摩尔定律的影响。这是因为我们所做的计算工作持续增长,但CPU的扩展能力已经放缓,因此我们将面临计算成本上涨而非下降。所以我们必须转向加速计算,以节省能源、时间和成本。我认为数字生物学将经历一个整体复兴,科学和工程将更加融合。生物学是一个非常复杂的领域,在这个领域还有很多创新空间。不过有一点是确定的,我们现在拥有了必要的工具,计算系统、算法能够帮助我们处理大规模的、高度混沌的系统。正如你之前所说,将数据驱动方法与严谨的模拟方法融合,可能给了我们一线生机。
/ 03 / AI和数据中心的功耗问题
Anirudh Devgan:您对AI和数据中心的功耗问题有何看法?当然,我们可以进行优化,一种方式是,加速计算实际上可以降低功耗,人们可能没有意识到这一点。不知您对AI的功耗问题及其他可能的应对措施有何看法?
Jensen Huang:正如Anirudh在演讲中所示,加速计算将成千上万台通用服务器(会消耗10-20倍的能源和成本)压缩到非常密集的形态。人们之所以认为加速计算功耗很高、成本很大,正是由于加速计算的高密度造成的。但是,如果从完成的工作量或吞吐量角度看,加速计算实际上节省了大量资金。随着CPU扩展能力放缓,转向加速计算变得必不可少,因为传统方式已无法继续扩展。
其次,您在主题演讲中非常精辟地指出,AI实际上有助于节能。如果不是您创建的AI模型,我们如何能找到6%或10倍的节能潜力?这是没有AI无法实现的。你只需投资一次模型训练,就能让数百万工程师获益,数十亿人在几十年里从中获得节能收益。所以我们不能只考虑单次的投资和成本,而要纵向地考虑医疗、气候变化、资金和能源节约等长期影响。从这个角度看,AI在帮助我们应对气候变化、节约能源等方面将产生深远的变革作用。
/ 04 / 英伟达的管理秘诀
Anirudh Devgan:Jensen,你有着非常独特的管理风格和领导力,组织机动性强、决策高效,这一点确实令人难以置信。现场有很多工程师、经理和领导人,不知您是否能分享一些建议,如何将想法转化为行动?
Jensen Huang:Nvidia管理体系和领导理念的核心,是为出色的员工创造条件,让他们能够做自己毕生的事业。要做到这一点,最重要的一点是授权他们获取信息。我基本上所有决策都是公开透明的,而不是只对某个人密授,因为每个人都应该了解公司的信息和挑战。
我也喜欢当着大家的面,合理地阐述思路。这迫使我们提出方向建议时植根于良好的推理,在影响他人的同时也在教导如何合理思考。能够将一个复杂抽象的想法合理地阐释到我们现在应该做什么或不做什么,这个过程极富启发性,这也是Nvidia虽然只有2.8万员工但实力超群的原因。几乎每个人都有权基于推理做出合理决策。
最后,你的组织结构应该反映你打造的产品特性。Nvidia是一家全栈公司,我们做联合设计,这就意味着不应该只用硬件团队或软件团队单独工作,而是要跨团队同步,因为我们在做联合设计。所以我努力营造一个环境,让公司各层级的专家和贡献者都能参与解决同一个问题。这就是我们的一些原则。
评论