扫一扫下载界面新闻APP

闭源才能赚钱，百度给闭源大模型投了一票

大模型到底是开源好、还是闭源好？

文｜三易生活

早前Meta的LLaMA大模型“意外”泄露后，大模型的开源与闭源之争就此提上了日程。大模型到底是开源好、还是闭源好？过去一年整个AI业界可谓是争吵不休。如今，又有一位重量级人士站出来表态了。

就在4月11日，百度创始人李彦宏的内部讲话被传出。据悉他在此次讲话中表示，去年文心一言发布时，百度方面就判断市场上一定会有开源的模型，而且不止一家会开源，在这种情况下多百度一家开源不多、少百度一家开源也不少。并且他认为，大模型开源意义不大，闭源才能走通商业模式。

李彦宏之所以坚定押注闭源，在于他认为开源大模型的运行模式和传统开源软件不同，并不是众人拾柴火焰高。作为从自由软件思潮之中诞生的结晶，开源软件也继承了自由软件所提倡的知识共享理念，同时又允许以专利的形式从知识产品中获得收益。事实上，开源本身并不是一种商业模式，而是一种软件的开发、发布和传播模式。

而开源就使得大规模协作开发成为了可能，从GNU/Linux、Android、Chromium这一系列大名鼎鼎的项目，到XZ Utils这类深耕细分领域的产品，它们的成功都是源自于汇聚了开源社区的力量，大量的开发者都在为这些项目贡献力量。

然而开源大模型的运行模式则完全不同，如今无论是来自欧洲的AI独角兽Mistral的Mixtral-8x7B，还是美国科技巨头Meta的Llama-2，它们都鼓励开发者贡献各种各样的数据、代码，但Mixtral-8x7B、Llama-2的主要开发者依旧还是Mistral、Meta。

开源大模型很难从社区获益，归根结底在于社区贡献的价值并不一定是正向的。AI大模型会出现“幻觉”(Hallucination)，现在几乎已经是业界的共识，AI科学家也仍未完全解开这个谜题，但数据的质量与大模型幻觉呈现正相关则是肯定的。

开源大模型接受垃圾代码、低质数据导致性能下降，这样的事情不是没有发生过。甚至Anthropic的研究人员曾发表论文警告，现阶段的安全训练无法消除插入后门触发机制的恶意行为，进而会导致开源大模型变得不安全。

开源大模型缺乏安全性，这也是OpenAI、Anthropic等闭源阵营旗手攻击开源的重要论点。

除此之外，开源大模型在性能上也还无法媲美闭源大模型。如今无论是哪个机构给出的大模型评测榜单中，OpenAI的GPT-4、谷歌的Gemini、Anthropic的Claude，以及国产的文心一言、讯飞星火、KimiChat，对比它们的开源大模型竞争对手都更有优势。所以在同等参数的情况下，闭源大模型的能力更强，李彦宏此言并非无的放矢。

此前福布斯的一篇文章《10 AI Predictions For 2024》就曾给了预测，尽管开源模型在某些领域有优势，但最先进的商业闭源模型可能仍将在性能上保持领先。

大家不妨试想一下，如果GPT-4不能保持性能领先，用户就会转向免费的开源模型。当免费、不受限制的替代品在质量上具有可比性时，用户确实不会为受限制的模型付费。可如今的情况，却是开源大模型的性能还不能挑战闭源大模型。

当然，开源大模型最致命的缺陷其实是在商业层面。Meta的Llama-2开源之后，国内的百模大战立刻拉开了帷幕，市面上很快也多了一大堆套壳模型。从某种意义上来说，大模型的开源其实是给自己平白无故地增加了一大堆竞争对手，而且这一部分竞争者又会分食潜在的企业级用户。

由于开源协议本身并没有限制商业化，因此在许多开源软件中存在着免费社区版和收费企业版共存的模式，也就是所谓的双许可证。其中免费版本负责扩大软件的影响力，再用付费版本获利，这就是开源软件经典的商业模式。比如在2018年被IBM以334亿美元收购的开源软件和技术供应商Red Hat，就是这一模式的典型。

开源大模型没有建立起商业模式，这是当下开源大模型鼓吹者始终无法回避的一个问题。抛开众说纷纭的B端业务，OpenAI的GPT-4、百度的文心一言目前都有付费订阅版本，C端用户的付费是实打实存在的。而家大业大的Meta打定主意要用开源来为自己挽回已经跌入谷底的企业形象，Llama则可以被视为Meta方面精心设计的一个广告。

但其他的开源大模型厂商不能总是只靠融资，事实上，即使是开源大模型的代表Mistral，如今对于开源也没有那么坚定。Mistral创始人Arthur Mensch近期在接受媒体采访时就曾确认，Mistral已经推出了商业模型，并且他还坦言，商业模型可以帮助Mistral创造收入。归根结底，大模型太贵，开发成本比传统的软件要高出了数个量级，因此也更加依赖融资。

当大模型与资本的牵扯如此之深的情况下，可后者显然是要谋求回报的，所以这可能才是李彦宏坚定看好闭源的原因。

本文为转载内容，授权事宜请联系原著作权人。