文|定焦(dingjiaoone) 黎明
编辑|方展博
中国的大模型创业很火,但有些公司可能跑偏了。
“百模大战”这半年,大大小小的科技公司,都推出了自己的大模型。仿佛不发布一个大模型,就不配坐上通往AI时代的列车。
这造成一种现象:高度雷同,同质竞争。大家一蜂窝扑上来,重复造轮子。
11月15日在深圳举行的西丽湖论坛上,百度董事长兼CEO李彦宏发表演讲时表示,他看到很多企业对大模型的本质理解不深,被各种说法忽悠,都想去自己搞个基础模型,或者按照网上传播的评测方法去挑选一款评分高的大模型,就以为这是拥抱AI了。
“殊不知大模型本身不仅不产生任何价值,还造成了对公司资源、社会资源的巨大浪费。”
金沙江创投主管合伙人朱啸虎近期也说过,今年上半年有一波AI的虚火,大家天天在讲大模型。投资人FOMO,投了很多大模型,现在都后悔了。他认为明年下半年大部分创业者会出局。
大模型创业,方向比努力更重要。要想持久坐在牌桌上,就得看清浪潮的流向。
跟风搞大模型,AI创业的歧路
都知道大模型很重要,问题是,我们到底需要多少个大模型?
在15日的演讲中,李彦宏引用公开数据说,截止10月份国内已经发布了238个大模型,而6月份的时候这个数字是79个,相当于4个月就翻了3倍。
平均下来,每天至少有一个大模型面世。
200多个大模型,看似很多,实际差异很小,大家本质都差不多。其中,还有一些是“套壳”——在Llama开源模型的基础上训练而来。比如零一万物的Yi系列大模型,最近就被质疑完全使用LLama架构,却对外宣称“原创”。
相对之下,美国作为大模型的发源地,也只有上十个大模型。
大模型不是越多越好,我们不需要那么多大模型,最终这些大模型也不会全部活下来。
李彦宏认为,大模型可以被视为AI时代的操作系统,是各类原生应用的基础底座。他做了一个类比:纵观互联网发展史,不论是PC时代,还是移动互联网时代,操作系统都只剩下少数几个——PC是Windows系统,移动时代是安卓和iOS。
那么同理,大家普遍认为,最终能活下来的通用大模型,也会是个位数级别。这意味着,国内一股脑冒出来的200多个大模型,绝大部分都是炮灰。
一家AI设计公司的创始人对「定焦」说,大模型是一种基础设施建设,需要集中力量办大事,投入产出比才最高,生态里的各种人汇集在平台上,就会形成平台效应和规模效应。
不是所有公司都能成为基础设施般的存在,这与野心无关,而与能力有关。要做出一款好用、可用的大模型,技术门槛和成本门槛极高。
OpenAI潜心研发这么多年,背靠微软的支持,投入数十亿美金,才取得今天的成绩。国内的百度、华为、阿里等互联网大厂,也是因为有过去多年的积累,今天才能快速跟上潮流。那些跟风入场、从零起步的创业公司,想要自研一款通用大模型,难度可想而知。
即便技术实力过关,或者借用开源方案,训练模型的成本也让很多公司吃不消。训练一遍,耗资几百万人民币,不在少数。关键是,训练出来的模型本质上不是原创,也没什么人使用。
按照李彦宏的说法,“国内有200多个大模型,很多上了这个榜单、那个排名,其实都没有什么使用量。”他认为,“重复造轮子其实是对社会资源的极大浪费。”
有一些公司剑走偏锋,想从头训练自己的专用大模型,这样成本可控。但李彦宏认为,这样炼出来的大模型是没有智能涌现能力的。因为只有参数规模足够大,算法、数据训练都做对的时候,并且能够持续投入,不断迭代,才能够产生智能涌现,大模型才具有触类旁通的能力。
做不了通才,又成不了专才,就没有核心竞争力。
“今天你推出一个大模型,花钱打了榜,有很多人用,可能明天就有个新的模型迅速替代掉。”另一家人工智能公司的创始人对「定焦」说。
所以,一些跟风搞大模型创业者,跑偏了。
创业者真正的机会
如果不做通用大模型,创业者应该做什么?
李彦宏的答案是:AI原生应用。“AI原生时代,我们需要的不是100个所谓的大模型,而是100万量级的AI原生应用。”他说。
互联网历史上的几波创业潮,涨潮的标志性事件,都是原生应用的爆发。距离我们最近的移动互联网,是由iPhone手机掀起的,业内公认的起点是2010年。
但事实上,初代iPhone在2007年就诞生了,一直到三年后,具有划时代意义的iphone 4发布,手机行业才整体进入智能化时代。iphone 4除了亮眼的外观设计,最大的贡献是搭建了系统生态,让无数开发者创造了大量原生应用,由此开启了创业者的黄金年代。
过去十多年,互联网行业最成功的公司、最亮眼的产品、最明星的创业者,都集中在应用层。微信、抖音、美团、滴滴,都是从零开始成为超级应用。
李彦宏认为,人类进入AI时代的标志,是出现大量的AI原生应用,而不是出现大量的大模型。基于基础大模型开发出来的应用,才是模型存在的意义。
AI原生应用,就是基于大模型智能涌现后产生的理解、生成、逻辑和记忆四大核心能力开发出来的应用。这些能力是过去的时代所不具备的,能解决过去解决不了或解决不好的问题,因而才能打开无限的创新空间。
那么,AI原生应用进展如何?
答案是尚未爆发。
国内的AI原生应用屈指可数。9月初,国内才开放第一批大模型备案,允许公开注册使用,此前都只能内测。百度的文心一言APP第一批上线,迅速登顶手机应用商店排行榜。11月1日,百度正式上线文心一言专业版,开启订阅收费,每月59.9元。这是国内首个采用会员模式面向C端收费的大模型产品。
国外的进展更快一些,AI原生应用的数量已经有上千个。据应用商店监测平台Sensor Tower的数据,美国市场贡献了55%的AI应用总收入,欧洲市场占20%,包括中国在内的其他市场,加起来只占比25%。
10个大模型里找不出1个应用,这就是中国大模型创业的现状。
对于创业者而言,必须要考虑清楚,是去跟风砸钱做基础大模型,还是做大模型在垂直行业的精调,抑或是基于大模型打造新的应用。
在李彦宏看来,直到今天,不论中国还是美国,最好的AI原生应用还没出现。这恰恰就是创业者千载难逢的机会。
是时候寻找爆款应用了
中国的AI原生应用发展缓慢,不是中国创业者不努力,而是起步晚了。
大模型创业分为三大类:一是做基础大模型,二是做行业大模型,三是基于前两类大模型开发应用。
在中国,基础大模型和应用层的创业,几乎是同步展开的。去年底ChatGPT火了之后,中国的创业者一方面研发基础大模型,同时也尝试AI原生应用的各种可能性。但基础模型不成熟,意味着应用层发展所倚赖的条件不具备。
大半年的“军备竞赛”之后,一些头部的大模型厂商脱颖而出。互联网大厂中,典型的如百度,创业公司中,也有一些发展很快。这些基础大模型是AI原生应用的底层驱动力,为爆款应用的出现提供了基础。
按照李彦宏的话说:“只有用好最强大的基础大模型,中国的开发者和创业者才可能做出更多超级应用。”
根据与大模型接入的深度,应用层创业可以分为两类:自建模型开发应用,以及直接调用已有大模型开发应用。
百度正在孵化全新的AI原生应用。比如智能代码助手Comate。据百度透露,百度现在每新增100行代码,就有20行是AI生成的,而且这个比例还在快速增长中。这样的AI原生应用,通过人机协同,大幅提升了研发效率。
与此同时,百度在内的一些头部大模型厂商,以及一些开源平台,对开发者提供全套开发工具,降低了应用层的创业门槛。对于那些无力独立训练一个大模型的中小开发者,接入大厂的API,成为一个性价比较高的选择。
前几天OpenAI召开首届开发者大会,推出Assistants API,让开发者能够调用GPT上几乎所有的新功能,面向普通用户推出的GPTs,则让不懂代码的人也能轻松编程。这“杀死”了一些模型层和中间层创业者的生意,却为应用层的繁荣打下了基础。
这是一个重要的风向转变。国外已经将重点转向了应用层的AI agent(智能体),而国内还在卷大模型。
李彦宏说,API是AI原生应用调用基础大模型的主要方式。未来,每一家企业跟自己客户打交道的方式,都将被改造为AI原生应用,这将大幅度提升企业的竞争力。“百度的目标,就是打造好大模型的基础能力,支持好AI原生应用开发。”
百度拥有800万AI开发者,不久前上线的大模型插件平台,让个人和企业都能把自己的数据和能力,快速变成插件。插件是一种特殊的AI原生应用,大大降低了开发者门槛,有利于构建繁荣的AI原生应用生态。
在巨头们已经铺好路、建好基础设施的情况下,创业者与其重复造轮子与巨头对抗,不如将重点放在应用开发上,寻找下一个爆款应用。
梳理清楚自己的核心优势和竞争壁垒,在生态里找到自己的位置,才能在大模型创业潮里借势而起。
*题图及文中配图来源于Unsplash。
评论