文|IT时报记者 范昕茹
编辑|王昕 孙妍
3月23日,在英伟达的GTC大会上,英伟达CEO黄仁勋借由ChatGPT的成功向世界展示了一个无限宽广的AI未来图景。在这个宏大场景之下,AI不再是虚幻不可见的东西。它在芯片生产、医疗、文化创作等各个领域发挥着巨大的作用,给世界带来天翻地覆的变化。
AI终于从幻影中走出,迎来了清晰的商业化之路,黄仁勋将之称为“AI的iPhone时刻”。
2022年,在新一代显卡的发布会上,黄仁勋直言“摩尔定律已死”,往后的芯片性能不会再遵循这个定律。而借由“AI的iPhone时刻来临”的口号,黄仁勋向世界宣告了“黄仁勋定律”的到来。
“黄仁勋定律”诞生
CuLitho计算光刻技术软件库是英伟达与全球最大晶圆代工厂台积电、全球最大光刻机巨头阿斯麦、全球最大EDA巨头新思科技合作,秘密研发近四年的“核弹”。
根据黄仁勋的表述,CuLitho在GPU上运行时,可以将计算光刻加速40倍以上,为2nm及更先进的工艺奠定基础。他举例,NVIDIA H100生产需要89块掩膜板,在CPU上运行时,处理单个掩膜板需要4万个CPU系统才能完成工作,如果在GPU上运行CuLitho,这个过程只需要8小时。与此同时,CuLitho还能助力降低耗电以及对环境的影响,将功率从35MW降至5MW。
在短期内,使用CuLitho的晶圆厂每天的光掩模产量可增加3~5倍,而耗电量可以比当前配置降低9倍。原本需要两周时间才能完成的光掩模现在可以在一夜之间完成。
随着光刻技术临近物理极限,这项技术通过加速计算光刻流程,将有助于晶圆厂缩短原型周期时间、提高产量、减少碳排放,为2nm及更先进的工艺奠定基础,并使得曲线掩模、high NA EUV、亚原子级光刻胶模型等新技术节点所需的新型解决方案和创新技术成为可能。
对英伟达而言,CuLitho展示了英伟达进入芯片制造生产销售全链路的野心。黄仁勋定律的核心在于利用GPU芯片算力大幅度提升芯片制造效率,以此来加速摩尔定律削减带来的生产瓶颈。
对英伟达而言,当它同时介入芯片的生产和销售环节,成为其中的一部分,CuLitho将给芯片产业带来巨大的变化:AI芯片的生产环节本身也成为AI芯片消费的一部分。GPU芯片将成为芯片行业主要的流通货币。
当然,这一切发生的前提是“AI的iPhone时刻”真的已经到来。
算力卡了大模型脖子
在GTC大会上,黄仁勋对软硬件市场空间做过一个回应。在他看来,人工智能软件是一个比硬件大得多的市场,而硬件的销售机会主要来自基础设施服务市场。也就是说,GPU芯片的市场多大,取决于AI软件的商用程度。
如今,AI大模型公司不得不面临的一个主要困境——算力。每一个AI大模型背后,都需要巨量算力的支撑。为了支撑OpenAI训练出ChatGPT,微软专门为OpenAI打造了一台由数万个A100 GPU组成的AI超级计算机。TrendForce研究推测,以A100的算力为基础,GPT-3.5大模型需要高达2万枚GPU,未来商业化后可能需要超过3万枚。
集之互动CEO陆文斌告诉《IT时报》记者,1年半前,其所在公司采购了50多块A100芯片,用于高精度数字人的研发。在数字孪生的应用场景中,一位医生可以只需录制20分钟左右的视频,便可以“孪生”为一个数字人。之后,只要输入相应的数据,便可以由“孪生人”自己演讲、互动或者授课,期间,无论是文字转换为语音,还是互动式的NLP(自然语言处理),亦或是数字人逼真的面部拟人化,每个环节都需要消耗巨量的算力,“精度越高,需要投入的算力越多,需要的资金也越多”。
陆文斌以最简单的“数字人说话”场景举例,通常而言,人类的唇部大约有近千个神经元,这些神经元相互连接作用,当人开口讲话时,每个字形成的唇形都不相同。他们公司制作的数字人,在其唇部部署了300个神经元,这在国内已经是相当高水平的精度,但要想做得更逼真,唯有投入更多的算力渲染。
这还只是在研发端的算力消耗,商用化的道路上,终端成了落地的绊脚石。在强大算力的支撑下,高精度数字人可以进行流畅的表情演示,但目前市面上高性能的笔记本电脑却难以支撑超高模数字人的流畅演示,更不用说手机。
更让陆文斌担心的是,此前购置第一批英伟达A100芯片时,限售令还没颁布。第二批入手在限令之后,价钱已上涨了50%。从公司的业务发展速度来看,加上芯片损耗,他担心,可能2~3年后便买不起芯片了,也无更多算力可用。
但ChatGPT的成功,正吸引一批企业投身AI大模型市场。百度的“文心一言”已经上线;腾讯总裁刘炽平表示会持续优化混元AI大模型;字节跳动则传出了前达摩院大模型M6带头人入职,并参与语言生成大模型研发的消息。创新工场CEO李开复、前搜狗CEO王小川、原美团联合创始人王慧文、前京东AI掌门人周伯文、出门问问创始人李志飞、阿里技术副总裁贾扬清,这些声名赫赫的业界大佬,都纷纷入局大模型市场。
当大厂入局,企业对算力的争夺将更加激烈。而目前在AI芯片领域,英伟达举着望远镜也看不到敌人。对国内企业来说,如果一直无法找到合适的替代方案,未来算力从何而来?
最近,陆文斌的数字人公司正在与国内GPGPU芯片厂商合作调试,以便当更大的“黑天鹅”来临时,可以提前防范部分风险,“我们也在提前做一些研发布局,包括是否可以在低配置的硬件设备上,利用软件跑出更好的效果。也很希望能和更多国内芯片、智能硬件厂商合作,尽量降低算力‘卡脖子’对国产人工智能产业的影响”。
算力跨境,数据落地
针对中小企业算力缺失的问题,英伟达也给出了自己的答案——DGX Cloud算力平台。DGX Cloud背后是DGX(AI超级计算机)的算力能力。通过这个平台,企业无须购买硬件,可以通过网页浏览的方式获取高性能算力,享受到和Open AI同样的算力引擎,扩展多节点AI训练。企业可以通过月租的方式获取算力,每月租金36999美元。可以说,DGX Cloud云平台降低了用户使用算力的门槛。
然而,跨过了使用门槛,即便云能力可以跨境,但数据不行。随着各个国家对数据管控的加强,跨境数据传输也成为云平台跨境运营的壁垒。美国《国家安全战略报告》将数据安全作为维护国家安全的核心战略要素,强调要保持美国在网络空间和数据资源上的优势。欧盟的《数字化单一市场战略》中也指出,欧盟将采取“内松外紧”的数据跨境流动管理思路。2022年9月1日,我国《数据出境安全评估办法》正式施行,对涉及个人信息的跨境数据传输进行管控。
互联网企业跨境运营面临的数据安全压力也日渐凸显。在数据安全的压力下,苹果将数据中心交由“云上贵州”托管,将国内数据存放在我国本土。字节跳动旗下的TikTok则不断面临着来自美国的政策压力。3月23日,字节跳动海外短视频平台TikTok CEO周受资参加主题为“TikTok:国会如何保护美国数据隐私,保护儿童免受网络伤害”的美国众议院能源与商务委员会听证会。
这意味着,DGX Cloud想要商用,势必要将数据中心本土化。目前,英伟达对此采取的策略是与云厂商合作,采用托管的形式进行。黄仁勋表示,未来中国也可以采用这项服务,中国创业公司可以期待阿里、百度、腾讯提供的底层算力服务,但在算力需求急速增长的现在,服务得以开展的时间和定价都还很难判断。
作为软件端的ChatGPT其实也面临着同样的数据风险。即便如今ChatGPT被接入微软Office全家桶,其能力也让C端用户大为震惊,但对企业用户而言,由于其生产力的获取需要通过数据的投喂进行,腾讯、阿里等企业已经明令禁止员工向其投喂数据,ChatGPT的商业化之路仍模糊难辨。
人工智能面临政策拷问
除开数据带来的安全隐患,“AI的iPhone时刻”还将因相关政策监管而推迟到来。
自人工智能诞生以来,治理问题就一直是全球监管机构关注的热点。欧盟正着手准备创建一个新的监管部门来负责AI的治理,以应对ChatGPT这类人工智能可能带来的挑战。
英国正在计划如何分配监管机构管理人工智能的职责。英国政府3月29日发布了一项计划,将不会专门成立一个负责人工智能技术监管的部门,并将避免可能扼杀创新的严厉立法,而是会根据安全、透明、公平和问责制等广泛原则采取适应性强的监管方法。而国内针对ChatGPT这类人工智能治理相关的讨论也在业内不断增加。
不仅如此,人工智能大模型带来的风险已经引发了多位科技领袖的深切担忧。近日,OpenAI的共同发起人伊隆·马斯克和一群人工智能专家及行业高管在一封最新发布的公开信中呼吁,在未来六个月暂停对GPT模型的训练,以免该模型变得更加强大,从而对社会和人类造成潜在风险。这封公开信如今已经获得1000多人署名,呼吁在GPT进一步强大之前,需要首先就此类大模型达成由独立专家开发、实施并审核的共享安全协议。
当英伟达用“黄仁勋定律”迎接一个属于GPU的时代来临时,“AI的iPhone时刻”或许将首先面临政策、数据、安全的拷问,而唯有迈过这些门槛,“AI的iPhone时刻”或才终将来临。
排版/ 季嘉颖
图片/ 英伟达
来源/《IT时报》公众号vittimes
评论