文|数智商业秀 数智君
编辑|杨肖若
谷歌一顿操作猛如虎,组合“反击”重磅降临。
北京时间5月11日凌晨,在谷歌2023年的I/O开发者大会上,其发布了全新一代的大语言模型PaLM 2以及生成式AI能力的“试验版”谷歌搜索和智能云等产品。
这堪称一次相当惊艳的“组合炸弹”式轰炸,被很多媒体和网友吹爆了。很快,资本市场也快速响应,截止发稿,谷歌的股价上涨超过4%。
谷歌的这一番操作,着实令人惊叹:人工智能将会对我们的工作和生活产生如此影响!甚至也有网友称:这是否也意味着全球范围内的AI大战全面开启?
确实,在ChatGPT和New Bing先后抛出各自的“杀手锏”之后,Google的这套“组合”式“轰炸”,非常有理由被看作是其在进行重磅反击。
彷佛一夜之间,谷歌的操作既证明了自己,又在AI群隔空@了所有人,大战全面开启。
如果确认这场大战已经开始,主角自然包括了国内正在日夜兼程推出和迭代大模型的科技巨头们,也包括人类自己,没人能逃离这场“大战”的影响。
01 谷歌扔了一个重磅组合式“炸弹”
如同谷歌CEO皮查伊描述的那般——继“忙碌的一年”之后,谷歌终于等来了收获的季节。
在发布会上,皮查伊表示,此次谷歌发布的PaLM 2是目前最先进的语言模型,同时这也是PaLM语言模型的第二个版本。
“与PaLM 1相比,PaLM 2有了显著提升。”谷歌高级研究总监斯拉夫·彼得罗夫(Slav Petrov)说。
皮查伊具体称,“PaLM 2在逻辑和推理方面进行了广泛的训练,具有极强的逻辑和推理能力。”
我们知道,ChatGPT-4作为其中知名的一个代表大模型,其功能的强大已无需赘言,尤其是在逻辑推理和数学表现层面。
但据谷歌的官方测试,PaLM2的部分结果(例如数学)比GPT-4还要好。谷歌称,对PaLM2做了算法优化,使得它在体积上比PaLM要小,但整体性能更好,计算效率更高。
具体而言,在多语言能力方面,PaLM 2进行了更多训练,文本横跨100多种语言,很大程度上提高了其理解、生成和翻译细微差异化文本的能力,解决了对成语、诗歌和谜语这类文本的理解能力,毕竟这种文本的处理门槛较高。
此外,PaLM 2还能通过很高级别的语言能力考试。
在推理能力方面, 由于PaLM 2在包含科学论文和数学表达式的网页上进行了训练,因此具备了在逻辑、常识推理和数学方面的改进能力。
在编码能力上,PaLM 2支持20多种编程语言。由于它是在大量公开可用的源代码数据集上进行预训练,因而擅长Python和JavaScript等流行编程语言,同时也可进行Prolog、Fortran和Verilog等小众语言的编程。
对于PaLM 2,谷歌工程师在一份研究论文中称,该系统的语言熟练程度“足以教授这门语言”。“与其他大型语言模型一样,PaLM2与其说是一款单一产品,不如说是一系列产品,它拥有不同的版本,可部署在消费者和企业环境中。”谷歌工程师称。
据了解,PaLM 2已被用于支持自家的25项功能和产品,其中包括AI聊天机器人Bard以及谷歌文档、幻灯片和工作表等等。
在此次大会上,谷歌还通过将生成式AI生成的结果,嵌入到搜索结果显示页中,向外界展示了不同于ChatGPT的新式搜索显示效果,这也是谷歌在重构搜索层面的一大进展。
在现场,谷歌搜索副总裁利兹·里德(Liz Reid)打开笔记本电脑,在谷歌搜索框中输入了一个问题——“对于有3岁以下孩子和狗的家庭来说,布莱斯峡谷或拱门哪个更好?”
当她敲下“回车键”,谷歌搜索立即给出了结果。同时紧随在搜索结果下方,一个长方形的橙色部分闪闪发光,并显示“生成式人工智能正在试用中。”
几秒钟后,发光部分被AI生成的摘要所取代,几段话详细分析了生成式AI的推理过程。在右边还有三个网站的链接,帮助“证实”摘要中的内容。
ChatGPT重构了微软必应,Bard自然是基于 PaLM2 进行了迭代,形成了新的谷歌搜索。
当大语言模型PaLM 2接入Bard ,谷歌搜索能为用户提供文字、图片等多模态的逻辑整合版输出结果。而且升级版的 Bard 所能支持的语言拓展至包括日韩语的 40 种语言。
更惊人的是,Bard还能给出自行车购买指引。
此前宣布接入GPT-4 的Office,让微软在办公领域 “杀疯”,而此次发布会,谷歌将升级版 Bard 也整合到了自家的办公软件 “全家桶” 中,包括 Gmail、谷歌 Docs(文档)、Sheets(表格)及 Slides(幻灯片),也创造出了“Duet AI”办公助手。
当然,此次除了发布AI内容外,谷歌也发布了 Pixel Tablet 平板电脑、Pixel Fold 折叠屏手机、Pixel 7a 手机等硬件新品,堪称“实力全家桶”。
这次谷歌无疑在AI圈扔了一个重磅组合式“炸弹”,在牌桌上狠狠扳回一局。
02 谷歌的野心与低调
一直以来,外界认为谷歌其实在AI大模型这场较量中失去了先发优势。尤其是自2022年底开始,ChatGPT横空出世后,谷歌就因此陷入被动的局面。
今年以来,ChatGPT-4的发布令谷歌的境地更加尴尬。
不过,谷歌实际上是将自己的野心深藏,保持低调。要知道,谷歌比OpenAI等更早看到超大规模语言模型的必要性,并坚持在稀疏模型架构上做深入探索。
谷歌的AI技术架构最早可追溯到2001年。
Jeff Dean被称为“传奇工程师”,他也是美国工程院院士,作为谷歌的20号员工,他创建了Google Brain,开发了谷歌机器学习开源框架TensorFlow,也是谷歌广告系统、谷歌搜索系统等的重要创始人之一。可以说,他是谷歌的重要技术奠基人。
作为谷歌首席架构师、谷歌研究院高级研究员、谷歌人工智能团队谷歌大脑(Google Brain)负责人,Jeff Dean曾称,谷歌开始开始着手训练大模型的时候,机器学习技术还没有如今那么惊艳,对谷歌搜索的错误查询进行纠正。
而在接下来的20年中,谷歌一直秉承着AI优先理念,为业界贡献了无数经典模型。Jeff Dean将当时新的模型Pathways称为“下一代AI架构”——只要训练一个模型,就可以处理数以万计的任务类型。
这个模型的逻辑简单来说就是学习的是人类思考模式。传统AI模型训练后只能完成一个任务,而Pathways训练一个模型,就可以处理成千上万个任务。这被称之为“AI大模型”技术。
通常来说,每次处理一个新的问题时都需要训练一个新的AI模型,而这些数学模型的参数实际上是用随机的权重进行初始化,然后使用标注数据进行训练的。
据业内人士称,这种训练方式对于数据的纯净度要求很高,而大模型通过模型自身的能力进行优化,力求拥有计算和处理复杂数据的能力。
在那个时候,Pathways被称为“下一代AI架构”并不为过,在早期AI通过特定数据在深度学习模型上训练成熟之后,通过产业互联网的“深度认知”训练进一步增强能力。
所以从底层技术的角度看,谷歌早早就通过AI大模型的创新,在布局下一个科技时代。
到2022年,Google发布了Pathways AI 架构的大模型(Pathways Language Model),简称为 PaLM。而此次发布会上发布的PaLM 2,恰恰是PaLM语言模型的第二个版本。
谷歌CEO皮查伊表示,这是目前最先进的语言模型。在DeepMind与谷歌分治之前,其语言模型麻雀就走上了小模型参数打败精调的道路,而与谷歌合兵一处之后,势必在思路上对PaLM 2也做出了相当贡献。
皮查伊也强调,“PaLM 2的成果建立在谷歌大脑和DeepMind这两个世界级研究团队所取得的进展之上。”
不过,Jeff Dean这次没有亮相发布会,也给外界留下了一个神秘谜团。
03 AI大战全面开启?
虽说发布有先后,伴随着外界对后来者的期望越来越高,但这也意味着,继谷歌之后,全球的AI大战全面拉响。
不知在谷歌祭出杀手锏之后,微软和OpenAI又会如何回应?但或许,未来生命研究所和“ChatGPT之父”更早一些的行为和回应,足以说明了一切。
今年的3月29日,未来生命研究所(Future of Life Institute)3发布了一封题为《暂停巨型AI实验》的公开信,呼吁所有AI实验室立即暂停训练比GPT-4更强大的AI系统,至少6个月。
其中包括“人工智能教父”的杰弗里·辛顿、“钢铁侠”马斯克等在内的1110多名专业人士签署了这封公开信。
近日,在麻省理工学院举办的“The Future of Business with AI”论坛上,OpenAI的首席执行官Sam Altman首次回应了《暂停AI巨型实验》的公开信。
“我们目前没有训练 GPT-5,也不会在短期内进行训练。”按照这位“ChatGPT之父”的说法,“建更大的模型,喂更多的数据”已经不能奏效,GPT-4的硬件条件也到了天花板。
但自ChatGPT发布以来掀起的科技军备战,其实一直没有停息,其余威在国内愈演愈烈,各公司在AI领域卷个不停,大模型集中爆发,被媒体评价为“颇有十年前‘百团甚至千团大战’的气势”。
最近半年以来,科技巨头玩家们的确都在摩拳擦掌、低调蓄力,不知何时这些疯狂的技术巨头就抛出一个个“杀手锏”。
国内也在暗暗“较劲”扳手腕,相比此前数千家团购赛道玩家疯狂烧钱,每一位“百模大战”的参与者都在争夺时间,试图让自己提前出线。
据不完全统计的公开数据,在ChatGPT发布后的短短4个月时间里,至少已经有30个国内研发机构和企业,在ChatGPT发布之后纷纷推出自己品牌的大模型与相关产品。
一时间,整个科技圈 “类ChatGPT”比比皆是,声称“国内首发”的企业更是不少,资本市场闻风而动、风起云涌。
最近,继百度、阿里巴巴、商汤科技等大厂纷纷发布大模型之后,科大讯飞于5月6日推出了旗下的讯飞星火认知大模型。同时,大讯飞星火认知大模型面向教育、办公、汽车、数字员工等行业的解决方案也对外亮相。
一时间,大模型的报道铺天盖地,随后陷入短暂的沉寂。而下一波,大概率正在来的路上。
或许,人类是时候可以停下来问问自己这些问题:
·我们是否应该让机器用宣传和虚假信息淹没我们的信息渠道?
·我们是否应该自动化所有工作,包括令人满意的工作?
·我们是否应该开发非人类思维,这些思维可能最终比我们更多、更聪明,甚至最终取代我们?
·我们是否应该冒险失去对文明的控制?
可以想到,人工智能已经引起了人们的担忧,未来的进步肯定也会带来更多问题,所以对人工智能长期安全的焦虑,也是有必要的。更重要的是,它的短期影响也不容忽视。
在谷歌的发布会上,谷歌研究部副总裁左宾·盖若曼尼指出了一个值得关注的问题,即模型并不是“越大越好”那么简单,研究的创造性才是建立伟大模型的关键。
他表示,谷歌近期在构建和训练模型方面取得的进展使之了解到如何真正释放多模态能力,如何比以往更有效地构建模型。此后,谷歌会致力于那些为人们的日常生活带来真正好处的模型构建。
为人类生活创造美好的科技社会,我们人类至少应该做点什么。
评论