文|定焦 黎明
编辑|魏佳
一个仅成立一年的创业公司,一群顶着名校光环的90后,做出了一款效果出众的大模型产品,让整个AI圈震动。
自从妙鸭相机短暂出圈后,国内的大模型行业,已经很久没出现爆款产品,Kimi填补了这一空白。
最让人意外的是,A股股民也来凑热闹,各大炒股群讨论Kimi概念股,流量激增导致Kimi服务器宕机。
如今一个多月过去了,虽然热度减退,但身边依然有人在讨论Kimi。
北京一所高校的在校大学生告诉「定焦」,近期学校组织了学习会,安排老师学习Kimi,老师给学生布置作业,要求学习、训练Kimi。
在网络上,时不时能看到有人推荐Kimi,这其中有一些可能是定向投放的广告推文,但也不乏一些自来水。
Kimi带给人们的一个认知冲击是,AI发展太快了,创业公司也可以在短时间内做出让人眼前一亮的产品,相比之下,那些号称做了十几年、砸下千亿资金的科技大厂,不过如此。
Kimi抢走了科技大厂的风头,未来还可能抢走他们的用户。问题是,火爆能持续吗?
谁在用Kimi?
Kimi是一个面向C端用户的智能助手,善于读长文、搜网页,主打功能包括整理资料、解读文件、辅助编程、文案写作等,被网友称为ChatGPT中文平替。
因为有ChatGPT在前边教育市场,还有文心一言、通义千问、讯飞星火等大厂推出的产品相互内卷,Kimi提供的这些功能,其实很多人之前或多或少了解过。
但对比之下,像Kimi一样让很多人自发使用,不只是厂商自吹自擂,还能让2亿A股股民狂欢的国产大模型产品,此前没有过。
Kimi呈现给用户的东西很简单:一个像百度搜索一样的搜索框,“文件,拖进来;网址,发出来”,然后用户可以直接针对发给它的文件或网址提问,让它帮忙总结归纳、分析数据、全网搜索。
图源 kimi.ai官网截图
最大的亮点是它支持超长文本输入,一开始是20万字,后来增加到200万字,而当时纵观全球范围内的大模型,没有一个能超过10万字的。
这在用户体验上最大的变化是,你给大模型投喂资料,不用再把文件拆分成好几个了,直接丢进去就行,它都能很快读懂,还能“大海捞针”定位其中的信息,告诉你某个信息出现在哪一页。
看到这,Kimi的用途很明确了——长文本阅读和分析概括,可以理解为AI搜索+文档总结。它是一个生产力工具,帮助我们处理信息,偏实用导向,不是用来吟诗作画、聊天娱乐的。
这个定位,决定了Kimi的使用者主要是打工人。Kimi官方介绍文档中提到了六类人群:学术科研人员、互联网从业者、程序员、自媒体与内容创作者、金融和咨询分析师、法律从业人员。他们有个共性:要处理大量文档信息。
一位非诉律师对「定焦」说,之前经常用ChatGPT整理法律政策,利用它写报告、总结,但ChatGPT有个问题是每次输入的信息不能太长,比如一份1万字的材料,需要分成好几份,分批发给它才能进行分析。Kimi的长文本特点,解决了这个问题。现在他是两款产品同时在用。
一位自媒体从业者告诉「定焦」,他会用大模型分析上市公司财报信息,查询一些财务数据,在对比了文心一言和Kimi之后,他觉得Kimi更好用。“Kimi的功能很直接,简单好上手,总结归纳能力很强。”
不过,他们都表示,目前使用频率不高,更多是尝鲜、试用,因为AI生成的内容质量不稳定,有时候会出现胡说八道的情况,“可以参考,但不能全信。”
Kimi的开发者,是一个叫作月之暗面的创业公司,去年3月成立。Kimi去年10月第一次亮相,从一开始就主打长文本,对外宣传的噱头是“完整吃下了一本《三体》”。
亮相之后的半年内,Kimi迭代了三次。识别扫描件、上架小程序、联网搜索,以及将支持的上下文长度升级到200万字。
3月18日的200万字升级是一个转折点。在那之前,Kimi还是在互联网圈、大模型从业者,以及小范围的AI爱好者中传播,升级之后,Kimi成功引起了2亿股民的注意,出现一批Kimi概念股,Kimi APP和小程序宕机上了热搜,进一步传播出圈。
如今来看,Kimi能火,是多个因素共同促成的。首先是产品确实还不错,这是前提;其次恰到好处的营销,2月中旬月之暗面那笔10亿美金、号称国内AI大模型公司单轮最大金额的融资,极大增加了关注度;此外,Kimi概念股的发酵,来自2亿股民的神助攻,最后一举将Kimi送上了微博热搜和Appstore总榜前十。
Kimi的确是出圈了,这跟此前国产大模型只在业内人中传播不一样。不过,从总量上看,实际使用Kimi的人数还是有限,Similarweb监测到Kimi网页版的日活用户数峰值在三四十万的水平,全网日活峰值在百万水平。
对于一家创业公司而言,这个成绩相当不错。问题是,为什么做成这件事的是一家创业公司?
Kimi做对了什么?
月之暗面不是国内最早那批做大模型的公司,在它之前,百度的文心一言作为ChatGPT之后第一个亮相的国产大模型,被认为最接近ChatGPT。此外,阿里的通义千问、科大讯飞的讯飞星火、智谱GLM,都已迭代了好几轮。
但除了厂商们的主动发声,国内一直没有出现C端用户真正认可、愿意自发为之宣传的产品。
一大乱象是卷参数、刷榜单。几乎每家在发布产品时,都要把GPT拉出来对比一波,找到几个指标把GPT超越——比如,中文能力。GPT成了靶子,被国产大模型轮番吊打。但业内人都知道,论综合能力,国内没有一个大模型能超越GPT4。
“刷榜”是大模型行业公开的秘密。国产大模型乐于刷榜,经常在各种榜单上排名第一。但多位做榜单测评的业内人士告诉「定焦」,大部分排名没有太大参考意义,跟“刷题”一样,不代表真实能力。
普通用户感到很迷惑,“你说你很强,榜单上有你,媒体推荐你,博主夸赞你,我就信了你,但用完之后,一言难尽……”一位试用过多款国产大模型的用户说。
国内做大模型的公司很有意思,有些是为了拉股价,有些是蹭热点,还有的就是想圈钱,动机很不单纯。稍微好点的,是为了赶超对标OpenAI,是为了要赢。
即便是把长期主义挂在嘴边的大厂,很多也是为了打赢对手,而不是想着怎么满足用户需求。
最典型的是阿里和360。Kimi宣布支持200万字超长无损上下文之后,因流量激增服务器崩溃上了热搜。然后第二天,阿里通义千问宣布免费开放1000万字长文档处理功能,号称“全球文档处理容量第一”,紧接着360 AI浏览器宣布内测500万字长文本处理功能。
好吧,大厂又“赢”了,他们又“第一”了。
有人点评:“既然你(阿里、360)知道长文本好,而且你也能实现,早干嘛去了?这是来给用户提供便利的,还是来蹭流量的?”
除了大厂,还有大佬。去年Kimi刚发布不久,李开复成立的零一万物,发布了大模型Yi-34B,能处理约40万字,是Kimi的约2倍,声称问鼎了多项全球英文和中文能力测试排行榜第一。但马上就有业内人指出,“Yi系列”的模型架构与Meta的开源大模型LLaMA相比,只改了两个张量(tensor)的名字,让其陷入套壳争议。
图源 / 零一万物官网
在这样的大模型创业生态中,其实只要产品稍微好一点,营销巧一点,时机把握好,很容易脱颖而出。
今年3月,AI创业者华融琦利用Kimi,写了一个《Kimi最全指南》的云文档,传播很广。他对「定焦」说,Kimi做长文本很早,从一开始就拿这个点做单点突破,给人留下了根深蒂固的印象,而长文本是一个通用性的功能,Kimi相当于是以功能和场景出圈。另外,创始人杨植麟超级学霸、AI大牛、90后的人设自带滤镜,在感性层面获得了外界更多支持,用户出于认可自发的宣传也给Kimi增添了不少流量和好感。
产品定位决定了市场策略。在国内大模型产品中,Kimi是少有的从一开始就明确只做to C,不做to B的产品。Kimi发布的第一天,杨植麟就说过,希望先提升模型能力,同时也会聚焦C端超级应用,通过产品连接技术与用户,Kimi是第一个产品尝试。
对C端用户的看中,决定了Kimi的产品体验不会差。无论是200万字的超长文本,还是拖拽文件的无门槛操作,以及简洁的页面设计,都能体现这家公司的用户思维。
BAT等大厂的大模型,做的很早,想要的也很多。在“做给谁用”这个问题上,大厂是典型的既要还要,既要吸引C端用户,又想让B端客户付钱,所以大厂基本都是把大模型跟云服务打包在一块,C端B端两手抓。
智谱AI是清华系的创业公司,全面对标OpenAI,公认技术实力强悍。智谱也有面向C端的产品,但落地方向以to B为主——智谱在机场广告牌上打的大屏广告,“助力千行百业加速迈向通用人工智能时代”,明显是给企业看的。
相比之下,Kimi是少有的从用户需求出发打造的产品。这不是说月之暗面的动机多么高尚,只是从结果来看,用户认可度更高。
抢了谁的生意?
作为一家创业公司,月之暗面少了些包袱,得到人们更多包容,这是大厂没有的优势。
去年3月百度在国内率先推出文心一言时,人们的关注点不是产品的功能表现,而是它有没有套壳,以及产品演示为什么是录播。
C端用户对大厂有一种天然的挑剔,甚至认为他们是创新的敌人。所以当杨植麟顶着90后创业者的光环出现时,很轻易就被贴上了颠覆者、破局者的标签。
那么,月之暗面的真实技术实力如何?Kimi的火爆能持续吗?
AI创业公司语核创始人池光耀认为,总体来看,考虑到长文本能力,Kimi是潜力很强的模型,能排在国内的第一梯队。
他对「定焦」分析:“Kimi对长文本的追溯能力很强,在给定材料中靠指令要求追溯特定信息的准确度很不错。即使是把指令埋在两三万字的小说中也能做到正确遵循。另外,它处理大部分日常任务的逻辑性能足够,虽然对超长材料的总结提取可能会漏掉部分细节,但能保留主体正确。”
图源 / kimi.ai官网截图
华融琦认为,各家大模型都有自己擅长的点,Kimi的优势是解读长文本,像是一个超级智能的文本检索器;智谱的智能体比较完善,搭建了开源生态,基于这个生态开发项目比较方便;MiniMax的模型比较懂人性,在角色扮演、情绪价值上有优势;文心一言的安全性和合规性做的比较好。
“Kimi确实是C端工具中最耀眼的,但在其他方面,比如AI系统搭建,光靠Kimi还不行。”华融琦说。
由此来看,Kimi只是在C端用户最容易感知的一些方面,暂时做到了比较好的体验,但这不意味着它就具备了很大的优势。
AI行业投资人柳笛对「定焦」说,现有的这些大模型,没有同一框架下的可比性,其实论综合能力,百度、阿里、智谱AI的产品是不错的,但Kimi在一些办公场景,比如复杂搜索、多轮对话、报告分析等方面好用,被用户当作辅助工具来用。
不过,由于产品定位清晰,Kimi已经对大厂的产品产生了替代效应,比如搜索。
“我觉得有了Kimi,基本可以不用搜索引擎了。”一位Kimi用户对「定焦」说,在他看来,Kimi的联网搜索+自动生成功能,对传统搜索是降维打击,“过去搜资料,你要从大量结果中自己去筛选、判断、分析,现在这些过程都可以省略,你只需要下指令就可以了。”
很多人没有注意到,Kimi爆火的那段时间,还有一款产品的流量也增长迅猛。根据“AI产品榜”的统计,AI搜索产品“秘塔AI搜索”3月访问量同比翻了5倍,在总榜中的排名快速爬升,仅次于文心一言和Kimi。
柳笛认为,Kimi对大厂接下来的策略产生了影响。“大厂明确to C finetune(微调)的方向了,更加看重paperwork的质量,而不是纯生成一些聊天内容,让用户调戏。”
当然,也有人对Kimi的可持续性持怀疑态度,认为它不一定能赚到钱。国内的大模型厂商之所以要做to B生意,是因为能看到明确的变现场景,C端产品难出爆款,出了爆款后算力成本是个巨大负担,让用户付费则考验用户粘性。而很多用户涌入Kimi,也是看中它是免费。
秘塔科技CEO闵可锐曾经直言:在国内不论针对什么环境,与国际市场的付费意愿相比而言是糟糕的。
“Kimi也没成功,它在试图先培养用户习惯,现在能维持百万DAU(日活),月推理成本都得大几千万,接下来大家就要验证收费了。”柳笛说。
华融琦认为,Kimi对C端收费是一个必由之路,“只是要看在什么阶段、对哪些功能进行收费,这就很考验Kimi的产品和定价水平。”
大厂转变策略后,对Kimi形成围剿之势,因此技术和产品的迭代速度很重要。
“AI这一波浪潮,大家达成共识特别快,一旦进入白热化的打仗阶段,不管是抢用户还是抢收入,恐怕不会特别久。”华融琦说。
应受访者要求,柳笛为化名。
评论