界面新闻记者 |
界面新闻编辑 | 宋佳楠
美国科技巨头谷歌持续在大语言模型领域向OpenAI和Meta发起进攻。
2月21日晚,谷歌宣布新一代免费可商用大语言模型Gemma在全球开放使用。该模型被谷歌视为自身“最先进的开放模型”。
这是该公司在开放AI大模型领域做出的一大动作。谷歌DeepMind产品管理总监Tris Warkentin称,开放模型对谷歌来说是一个新的机会,让其可以与社区和谷歌之外的人合作,在AI研发方面创造新的机会。
Gemma得名于拉丁语“宝石”,仅用于处理文本信息,其基础技术架构与谷歌最强AI模型Gemini一致,但参数规模较小,仅有20亿参数和70亿参数两个规模版本,且两种参数规模的Gemma模型都会有预训练和指令微调版本。
较小的参数规模有助于Gemma实现更广泛部署。谷歌介绍称,Gemma支持主流AI框架,还可在笔记本电脑、台式机、物联网、移动设备和云端等环境上运行。
该公司公布的测评结果显示,Gemma在数学、编码、推理精通性和知识测试等许多外部基准测试中都优于Llama 2模型。Llama 2是Meta发布的最新一代开源大模型,包含了70亿、130亿和700亿参数的模型。
值得注意的是,谷歌强调Gemma为开放模型,而非“开源”,这意味着谷歌并不会分享Gemma的多项技术细节,包括Gemma的源代码、训练数据等。在应用上,谷歌称其使用条款允许所有组织负责任地进行商用和分发。
开放Gemma或是针对开源大模型领域所受批评的部分回应。此前谷歌和OpenAI因坚持技术封闭而遭到外界抨击,两者在最新、最先进的模型上都选择了闭源,被认为不利于技术进步。
对此,新浪微博新技术研发负责人张俊林评价称,Gemma代表谷歌大模型策略的转变——兼顾开源和闭源,开源主打性能最强大的小规模模型,希望战胜Meta和Mistral(欧洲AI公司,推出了Mistral 7B开源AI模型);闭源主打规模大的效果最好的大模型,希望尽快追上OpenAI。
在AI社区,目前Meta的Llama 2一直是最强大的开源大模型之一,该模型信息和源代码支持免费商用,因此获得大量AI开发者支持。
谷歌显然希望借助Gemma吸引更多开发者进入谷歌云生态。一方面,Gemma针对谷歌自研云端AI芯片TPU进行了优化,声称可发挥更好的效能。同时,谷歌云新用户还会获得300美元云积分,用来研究Gemma。
此外,Gemma将能够在英伟达芯片上运行,由双方合作进行优化,以加速该模型在云端数据中心、PC端侧的推理性能。如将Gemma用于搭载英伟达GPU的AI PC上,驱动本地聊天机器人软件,并与英伟达的多项AI工具集成。
OpenAI、谷歌、Meta等大型科技公司的大模型之战有愈演愈烈之势。
谷歌在2023年3月推出AI对话机器人Bard,并在去年5月推出最新的闭源大语言模型PaLM2。在上周,该公司官宣“下一代AI大模型” Gemini 1.5,称在诸多方面已经超越OpenAI的GPT-4 Turbo。Meta则热衷模型开源,旗下Llama 2最为知名。
而在近日,OpenAI发布文生视频模型Sora再次引爆AI圈,也进一步拉开了与其他大模型公司的距离。谷歌要最终赶超OpenAI仍将充满诸多不确定性。
评论