文|娱乐资本论 James
3月初,AI公司月之暗面(Kimi)据报完成了新一轮超过10亿美元的融资,投资方包括红杉中国、小红书、美团、阿里等。Kimi引爆了资本市场的新一波热情,甚至出现了“Kimi概念股”。
视智未来注意到,这轮融资进行时公司估值达到25亿美元,意味着创始团队在这一轮融资中出让了 40% 的股份。换句话说,如果基于公开报道推断,月之暗面创始团队手里的股份有可能已经小于 50% 了。
这次阵势极大的新融资,一举将Kimi从原来的第二梯队玩家,推进了中国大模型最亮眼的独角兽行列;同时,也似乎把人们重新带回了10年前一度暗淡下去的,那份对于中国互联网行业黄金时代的回忆当中,尤其是担心创始人稀释的风险,有时甚至会丧失对公司的控制权。这种情况之前就频繁发生在摩拜等共享单车领域,以及去哪儿、拉手网等竞争烈度极高且资金需求极大的领域。
跟那个时候相比,现在的国内各路资金,不论是大厂还是私募,确实仍然处于“缺钱”状态。而AI公司特别是基础大模型公司,跟之前那些烧钱换市场的“微创新”相比,又似乎是真的需要钱。
“我觉得他们几乎拿走了市场上的所有资金。”面对视智未来采访,规模较小的AIGC应用层创业者这样说。
“我们还需要大量资金,10亿肯定还不够。”在面对视智未来提问时,Kimi相关人士这样说。
风云变幻之间,原先以为断崖式领跑的厂家们,现在再看似乎也没有那么遥遥领先。初期“百模大战”的浮躁褪去,仍有玩家在退潮后幸存,进入下一轮游戏,但他们没人敢高枕无忧。
历史确实不会重复,但是一直在押韵。Kimi带来的热度,是否意味着一个新的互联网10年周期的开启?
01 谁是真·长文本?
200万字(token)的长文本处理能力,是月之暗面长期主打的唯一差异化定位。
对上下文长度的规模拓展(Scaling)已经迅速成为一种趋势。中信建投研报指出,长文本能力能将大模型应用场景拓展至长文总结、剧情创作、代码复现等复杂任务,且可以直接基于全文理解进行问答和信息处理,从而缓解大模型“幻觉”问题。
在Kimi稳定支持200k(20万字)之前,其它模型的文本能力如下:
GPT-4从一开始的4k、8k拓展到了GPT-4-turbo的128k。
Claude2支持200k的输入。
百川、零一万物首次发布的模型也接近支持200k。
去年底,Gemini 1.5 Pro一次性将文本输入长度拉到1m,但据第三方测试,效果很差。
在月之暗面“出圈”后,其他家在支持长文本方面的升级进度,几乎在一夜之间赶了上来:
百度文心一言:200万-500万字;
360智脑:500万字;
阿里通义千问:1000万字;
岩山科技Yan自称“无限长度”。
就在近期,阿里发布通义开源模型1.5的32B版本时,还引入了一个叫“大海捞针”的趣味能力测试,也就是在长文本中随机放入与主题无关的文字,并让大模型找出。他们说,这可以证明它并不是依靠自己的知识库或者幻觉,而是依靠用户提供的文本作答。
不过,当视智未来问到:“您怎么看待其他模型公司在发展长文本技术?”的时候,Kimi相关人士的回答充满了领先的自信:“我们最近发现回应这个问题挺难的。你比如说,谁在发展长文本技术?(其他家)这些其实都不是真正的长文本。他们只是用技术术语说自己能做到而已。”
该人士提到,大模型基于前文来预测下一个字,前文越丰富,预测越准确。这里的“前文”就是预测的窗口。
“我们已经将窗口扩展到200万。我们使用的是负注意力机制,进行全面采样,不进行降采样。他们还停留在8000字的限制,他们的模型基于这个范围,从资料中搜索片段,拼合进8000字中,然后提供信息。”
“他们的模型缺乏足够的上下文来回答问题,就像是考试时准备的小抄,可能有用,也可能没有。我们的方法则是完整阅读并理解每个字,然后进行交流和讨论。”
Kimi 的 200 万字长文本支持需要排队申请内测
作为参考,阿里解释它们对qwen开源模型采用了分组查询注意力机制,用最通俗的话就是将输入分拆成段,再组合理解。同类技术在将模型参数规模缩小,使之更为节能或可以端侧运行时经常使用。
不管怎样,模型支持长文本的综合效果如何,还缺乏实际场景的证明。和当下的大模型基准测试一样,长文本能力测试也是缺乏可信标准,处在自说自话的状态中。
对于Kimi而言,在最终可用性上大幅抛离竞争对手,当然是它们要尽力追求的目标。但实际情况并不是那么泾渭分明。
即使是争议最少的参照对象GPT-4,也偶尔会有“季节性倦怠”、“变懒”等不尽人意的时刻。将生成结果的用户满意度做到80%,和做到99.99%,是完全不同的两码事。
02 获客成本很高吗?
如果各家大模型在效果上很难做鲜明的区分,用谁都不会太好或者太差,那么营销推广就变成了重要的命题。自从春节前后,在B站、抖音等平台上,以及机场、电梯里,好像到处都能看到大模型广告。
例如,视智未来经常在电梯广告看到下面这种投放:
智谱AI截止2023年已经获得25亿美元融资,它主要在电梯、公交地铁、机场等户外场合投放。与之相对,Kimi的主战场是B站。
有人说:“像B站网页端,我滑下来 10 个广告有 9 个都是它,而且这个情况持续很多天了。”
“其实这是一个误会。”Kimi相关人士告诉视智未来,目前B站的广告投放可以选择按安装量效果付费,加上其它投放广告的人少,也没有出现太典型的个性化投放。“我们只花了一点点钱,它的算法也不足以将广告足够分散。”
资料显示,B站的App下载广告计费方式有CPM曝光计费、CPC点击计费、OCPC点击计费等。其中确实存在只有完成下载安装才付费的模式。
Kimi目前客户群体很大一部分是大学生,这与B站主流用户群重合。“所以对我们来说,B站是个好的渠道。但我们不能让它过度曝光,以至于大家产生反感。我们需要让用户了解并使用它,并保持用户粘性。这是一个良性循环。不能让已有的用户每天打开就看到一大堆广告,这会造成不好的体验。”
在大量投放和媒体宣传的共同作用下,Kimi获得的成果也比较显著,iOS客户端一度冲进App Store 免费版应用的第五名,超越微信。3月21日,Kimi的小程序、App、网页版一度宕机,官方解释称已经进行了5次扩容。
有数据统计,目前Kimi模型的日活跃用户数已达100万人(60万在小程序,34万在网页端,还有5万在App端)。此外,在iOS和安卓主要应用市场,每月Kimi下载量大约维持在1.8万左右。
据Similarweb统计,月之暗面官网3月的月访问量约为1220万次
曾有媒体根据行业通用的估算方法,测算目前Kimi投放广告的获客成本约在10元,如果算上拉新后用户问答互动产生的算力成本,每个用户的获客成本达到12-13元。按此计算,Kimi每天的获客成本将烧掉至少20万元。
前述相关人士对视智未来否认了任何推测Kimi获客成本的说法。“他们基于的是行业内的成本标准,但他们不知道实际情况。”
03 算力,算力,算力
表面上,我们看到的是大模型的宣传阵势极大。但如果推广成本也没有太高,钱要花在什么地方呢?
在冰山隐藏于水面之下的部分,可能是更多的算力和数据成本。
3月,有消息称微软计划在未来几年为 OpenAI 投资 1000 亿美元建设数据中心,这比当今一些最大的数据中心的成本高出 100 倍。
1000 亿美元的投资,也已经是截止2020年,自动驾驶汽车领域投资的很多倍,也可能相当于Meta在元宇宙相关技术上的总投入。而这,居然仅仅是花到一个数据中心的项目上而已。
OpenAI和Meta等巨头一直在为百亿、千亿、万亿美元级别的新融资奔走,奥特曼认为对芯片企业的投资额将会高达7万亿美元。这些数字就好像随口一提一样,即使它们可能已经是某个省份乃至国家的全年GDP。
人工智能的发展成本如此高昂,这还没有提到算力是不能复用的,每次运行都会重新产生成本,以及购买语料数据等同样需要钱。一个大模型开发商需要以上所有这些成本支出,这解释了为什么投资者如此关心大模型企业的投资回报。
AI基础设施正取得肉眼可见的回报,因此AI部门在综合性大厂内,早期往往和云计算部门视为同一分支。假设大厂自己运营芯片或数据中心的供给,那么哪怕它们自己的大模型没有一炮打响,至少也可以通过把算力卖给别人获利。
但是月之暗面目前还不是这样。它如何证明自身产品的实用性,以及在给基础设施提供方转移支付以后,还能保证自己和投资人的利益,目前还不清楚。
首先,Kimi很难自有算力。在3月份Kimi爆火宕机前后,一份关于Kimi的“专家交流纪要”流传,其中提到公司使用字节的火山引擎来支撑训练和运营,“公司不太可能私有化一个数据中心,供应链资源很难开拓,而且成本很高。”
火山引擎的官网将月之暗面列为案例
其次,大模型通用的准确性问题没有解决。作为黑盒的大模型,使得判断问题和缺陷,进而改善效果变得很困难。人们对聊天机器人答案的准确性提出了越来越多的质疑,而这种不确定性,在大模型浪潮持续一年后,已经显著阻碍企业和消费者对AI服务的支出。
终端用户们有的会使用ChatGPT+Kimi等多个模型交叉验证,有的在让其阅读一本书时,将结论和引文,页码等一同输出。但越是加入人工核验,就越影响AI输出内容的性价比。对于企业需要寻求自动化方案而言,假如大模型驱动的自动回复系统出现一次问题,就可以变为一场公关灾难。
第三,Kimi不能一举终结国内基础大模型的竞争。它目前纯靠提示词(zero-shot)的编程能力跟智谱、文心等还有差距,规划中的多模态还没发布,付费API定价也高。
在文心、360智脑、通义等切入长文本之前,它们普遍谈到长文本处理是通过消耗算力到单位内容上来实现的,技术含量没有想象的那么有决定性。
视智未来也问到了Kimi何时切入多模态的问题,回答是:
“我们一直在做多模态,只是还没到一个好的发布点。我们的策略是,必须有独特的亮点才能发布。不可能发布一样的东西。比如我们的Kimi发布时,它支持20万字的上下文。我们不会发布市面上已有的一样的东西。”
04 投资=投人
既然融资好处这么多,其它AI创业公司就没有融资的想法吗?
“我觉得他们几乎拿走了市场上的所有资金。Kimi一轮融资就达到了7-8亿美金。”时隔一年,秘塔科技COO王益为再次接受视智未来的专访。本次专访于3月30日晚8点在视频号“娱乐资本论”全网首播。
“作为一个小公司,我们的资源和预算非常有限。我们不能像大公司那样参与重大的竞争。确实,看到Kimi和智谱,我也很羡慕。如果我们有无限的资源,我们的策略会完全不同,我们可能更擅长口口相传。”
秘塔的写作猫及法律AI产品,之前已经引起了一些行业关注。2023年秘塔拥有超过1200万注册用户,增长速度在AI创业公司中颇为引人注目。最近,秘塔又官宣了新产品“秘塔AI搜索”,它一次搜索生成的文本可以长达3000-4000字,实际上相当于“代写论文”。
不过,在去年一年的AIGC狂飙突进中,秘塔没有拿到任何新的资金。王益为感觉,他们和投资人之间多少有点儿“不对付”。
“我能理解投资者的观点。我们的项目可能看起来有些不同寻常。我们既不是纯粹的技术大模型公司,也不完全是应用型公司。或者说,我们和投资人的口味不一样。”
“我和许多VC谈过,他们有一种观点很有意思。他们说我们没有大牌科学家,我们的运营团队看起来不够豪华。在这种竞争激烈的环境中,我们公司的CEO虽然非常有实力和洞察力,甚至产品思维非常出色,但这似乎还不足以让人相信我们能带领公司走得更远。”
“投资就是投人”曾经本来就是风投的其中一条规律,在模型效果缺乏客观实际评判标准的时候,现在基本跃升为一条“铁律”。
月之暗面有着极高的人才密度,公司员工也就100多人,其中北京总部的员工不到100人。但这些人当中,有在Google Scholar上引用次数过万的联合创始人,又吸纳了大量参与过Google Gemini等重要大模型研发的人才,这让它成为目前最有投资价值的大模型初创公司之一。
有报道称,在杨植麟刚开始大模型创业时,大量VC曾试图能够在项目早期联系上他,但他对投资方的选择十分谨慎。除去后续的广告铺路,Kimi其实从一开始就可以说是“含着金钥匙出生”。
视智未来报道过的另一家在融资方面比较顺利的初创公司,是做文生3D的VAST AI。我们的报道提到,宋亚宸的招聘思路是从一开始去找行业内最核心的论文,然后把这些论文的一作、二作、三作找到,每天和他们聊公司业务规划和行业进展。
宋亚宸自己每天前期花80-90%的时间在招人上,而且“只要最好的人”,因为“做更难的事,需要花最大的精力找同路的人。”因为创业团队早期没有露出,为了招聘到最顶尖的人才,去年8月份他争取前往图形学顶会SIGGRAPH做了主题演讲,和IBM,英伟达,索尼等的高管同台。
相比之下,秘塔的联合创始人们有北大校友提供的法律应用资源,但在团队整体履历上确实没法跟独角兽们比。
“那我们能做什么呢?只能一点一点证明自己。现在我们又进入搜索领域,也是要靠优质体验打出名声,让投资人相信这件事,而不再质疑我们在面对百度和阿里时该怎么办。我们能做的就是坚持。”王益为说。
05 退出的方式
随着公司估值的提升,未来Kimi如果需要进一步融资,可能会面临更高的估值要求,和更大的股权稀释风险。现有投资方也担心如何退出的问题,因为他们占有的股份这么大,要是不上市,就没什么好办法了。
除了极少数专注于投融资的评论者,似乎没人意识到,Kimi这轮融资,在如此早期就出让这么大比例的股份,从以往的案例来看是不寻常的。回想科技创投刚刚在中国兴起的2010年代,如果像去哪儿一样,投资人理论上可以随时踢掉创始团队选择被并入其他巨头;如果公司经营不佳,创始团队也可以如拉手网的吴波般开新公司。
“关于这个事情,它在当代并不重要。”Kimi相关人士对视智未来说道,“京东等大厂创始人手持的股份可能连10%都不到。最重要的是什么呢?是要获得资本,用来实现这个项目。这可能是更关键的事情。”
这也确实是以Kimi融资为代表的这一轮AIGC融资热,跟历史相比不同的地方。看看国外Anthropic、Mistral AI、OpenAI等AIGC独角兽企业的股权结构,可说是一个比一个特殊。
Anthropic拥有谷歌和亚马逊的“双料投注”。Mistral AI在成立后的半年多时间里,接连完成了1.05亿欧元种子轮融资和后续的4.15亿欧元融资,微软也对其进行了1500万欧元的投资。
OpenAI的实体是一个为了“全人类共同利益”成立的非盈利机构(虽然咱也看不出它哪儿非盈利了),微软持有49%的股份,其他VC各持49%,OpenAI基金控制剩余2%。之前深度参与的马斯克似乎在一次次跟团队的纷争中被彻底踢出了公司,在他“起诉”OpenAI时,对方的回应是,认为他眼红自己走后公司的发展成就,想回来分得一杯羹。
通过同股不同权、反稀释条款等方式,这些公司都在想办法维持控制权,同时拿到最多的钱。但是归根结底,这里面起到最大控制作用的变量,是创始团队本身。
OpenAI“宫斗”期间,奥特曼一度不得不戴上“访客”工牌才能进入他的公司
实际上,相关的故事已经在AI界上演过。去年11月OpenAI经历大震动,Sam Altman有整整一周时间“被踢出”公司。此后,我们又看到苏莱曼的Inflection AI被微软“吸血丢壳”,核心团队跑去了微软,留下投资人手里拿着“壳”和有限的补偿。
Inflection AI 被微软“雇佣式收购”,是一个意料之外,情理之中的结局。Pi.ai 虽然很独特,但怎么看都无法独立生存。然而,它原本的“壳”已经在此前的融资狂潮中被各种股东深度绑定,想跑可没那么容易。放到10年前的上一次投资狂热中,这样骑虎难下的公司可能难以如此体面地退场。
这些在AI业界不断上演的剧本,再次证明了现阶段“投资就是投人”的铁律。在投资环境恶劣时,资方和创业者之间缺乏互相了解,投资人急于投出钱,却又对选择标的畏首畏尾。
融资过程中的“主动PR”,一般来说目的有两个:为正在进行的谈判创造有利条件;吸引更多资方参与投资。而融资消息本身,也是一次好的PR机会。
通过海量投放和消息轰炸打出声量,Kimi这样的独角兽新贵既可以让自己稳稳跻身“第一梯队”,也为之后找大客户打下良好的认知基础。
不管用什么方式,在它一旦可以证明自己之后,投资人“等待出手”的势能,就会在它身上充分释放,转化为“害怕错过”。
评论