文|正见TrueView
AI大模型竞赛进一步加紧,国内企业、高校、科研院所、新型研发机构等均抢滩登陆中。
OpenAI投来的大模型技术冲击震撼还在持续。从搜索引擎到office办公,再到搭载了GPT-4模型全新的代码编辑器OpenAI Cursor,让人惊惧交加的技术革命正在逐步由预测变为现实。
业内曾把国内尚无法直接使用GPT-4当做窗口期,一如互联网时代。但近期欧爱运营有限责任公司(OPENAI OPCO,LLC)已在国内申请注册“GPT-4”商标,国际分类为科学仪器。此前,该公司还申请注册了一枚国际分类为网站服务的“WHISPER”商标。据了解Whisper为OpenAI此前发布的神经网络,声称其在英语语音识别方面已接近人类水平。
此举是否代表着OpenAI将扩大在国内市场的布局让人遐想。有接近微软的人士猜测,这可能是为了更好地让中国用户接入OpenAI API服务,以开展国内业务。“中国用户那么多,如果在国内搞一些服务器会更好。”
AI大模型竞赛进一步加紧,国内企业、高校、科研院所、新型研发机构等均有所动作,同时也被寄予厚望。观察发现,在技术追赶的过程中,大模型如同航天器一样,开发者们在对其命名过程中结合了历史典故、神话传说等不同历史文化,折射出了同一时代下创世者一致的科学梦想。
文心一言——百度
文心一言的模型演进始于2019年的自然语言处理(NLP)大模型ERNIE 1.0,如今已发展成为包含文本生成、文生图、智能对话等技能,具备跨模态、跨语言的深度语义理解与生成能力的大模型平台。关键技术包括SFT(监督精调)、RLHF(从人类反馈中进行强化学习)、Prompt(提示构建)、知识增强、检索增强和对话增强。
对于自己名字的由来,文心一言如此解释道:“文”是语言文字,“心”是用心理解,“文心”从诞生之初就是致力于理解和运用语言文字的自然语言理解模型,同时也呼应《文心雕龙》,寓意用雕缕龙纹一样精细的功夫去研究语言文字的内涵和魅力。
“一言”既有“一言为定、一言九鼎”之寓意,也有人机之间“你一言我一语”自由流畅沟通之期盼。文心“一言”既出,即可“一生二、二生三、三生万言”。
作为“全球大厂中第一个发布(大语言模型产品)”,且从昆仑芯底层芯片、飞桨深度学习框架、文心预训练大模型,以及最上层的搜索、智能云、自动驾驶、小度等应用,是全球少有的在人工智能四层架构中全栈布局的企业,市场对百度抱以空前期待,但结果就如同李彦宏在发布会上所说,体验“确实不能叫完美”、“训练是不够的”,发布却又箭在弦上,“为什么要今天发布?因为有市场需求,有了用户反馈,文心的成长会很快”。
急于追赶,急于抢占,急于商用,期望门槛高、产品不完美,高举轻放……或许将是国产大模型领域接下来很长一段时间内所处于的混沌状态。
通义——阿里巴巴
2022年9月,阿里巴巴资深副总裁、达摩院副院长周靖人发布阿里巴巴“通义”大模型系列,由统一底座层、通用模型层、行业模型层组成,并首次实现了模态表示、任务表示、模型结构的统一。
“通义”有“普遍适用的道理与法则”之意,如《汉书·卷三十六·楚元王刘交传》所载,“天地之常经,古今之通义也。”与模型特点相对应。
“通义”大模型统一底座是由统一学习范式和模块化设计理念构成;通用模型层覆盖自然语言处理、多模态、计算机视觉;专业模型层已在超过200个场景中提供服务。
此前,阿里内测中的达摩院版ChatGPT也被曝光,除了实现类似OpenAI版的对话能力,还融合了多模态任务能力,能够实现包括知识问答、AI绘画、代码生成、小说续写、文案撰写、写诗作词等。
在发展方向上,周靖人曾表示,对达摩院来说重点不是把模型的规模做大,而是通过一系列的前沿研究和实践沉淀更通用更易用的大模型底层技术。阿里达摩院希望将底座做得更实,将更多模态和任务考虑到统一模型范畴内,通过减少 AI 模型在实际场景落地中的定制化成本,真正体现出大模型的效果。
浑元——腾讯
2022年4月,腾讯首次对外披露“混元”(HunYuan)AI大模型研发进展,模型包含但不限于:计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向,已广泛应用于腾讯微信搜索、腾讯广告等业务场景,用于提升搜索体验和广告推荐精准度。
混元AI大模型是基于腾讯“太极”机器学习平台进行研发的,因此猜测命名源于道家学说:混元即无极,无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦衍万物。
腾讯太极广告一站式机器学习平台
随着大模型热度持续攀升,腾讯也如同遵循着产品命名中蕴含的万物演变规律一样,顺势“透露”。总裁刘炽平首次在公开场合确认将推出类ChatGPT产品,并表示“腾讯必然会投入各类资源来打造自己的基础模型技术,未来也会应用于各业务当中”。除应用于社交、通讯和游戏业务,聊天机器人、数字助手、资讯获取等方面也将是腾讯的尝试方向。
而在商业模式上,腾讯沿用互联网时代“习惯”,刘炽平提到:“正如互联网的发展一样,以打造有用的服务为开始,而后思考合适的商业模式。”
此后不久,有消息称腾讯针对类ChatGPT对话式产品已成立“混元助手”(HunyuanAide)项目组。项目组Owner为腾讯首席科学家、腾讯AI Lab及Robotics X实验室主任张正友博士,他也是腾讯历史上首位且唯一一位T17级(腾讯最高专业职级)“研究员/杰出科学家”。
而3月30日,腾讯正式发布AI智能创作助手“腾讯智影”,推出智影数字人、文本配音、文章转视频等AI创作工具,生成式AI布局加速。
盘古——华为
2021年4月,华为云盘古大模型正式发布,到2022年发展出了包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶段体系。
以“盘古”来命名预训练大模型,来自于“盘古开天”神话,有解读该命名寓意着华为将通过输出技术能力与产业融合,使AI走向千行百业打开新空间。
目前在行业大模型上,共发布了盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项。通过智能矿山领域可以窥见的华为行业大模型发展模式是——突破应用场景,形成业务闭环;突破样本泛化瓶颈,实现解决方案复用;实现“IT+CT+OT”的“3T融合”,即华为拥有以“矿山AI大模型”为代表的IT技术;以5G、F5G为代表的CT技术;以“矿鸿”操作系统为代表OT技术。
此外,华为大模型技术在消费市场的硬件终端应用上也有尝试。在3月23日华为的春季旗舰手机新品发布会上,同时发布了基于多模态大模型的智慧搜图功能。
“红孩儿”——360
3月29日,周鸿祎在一活动现场以“彩蛋”的形式演示了360GPT产品“360搜索”,周鸿祎称:“很多人关心360的人工智能进展,今天把‘刚出生的孩子’抱出来给大家看看。”这并不能看做是正式的产品发布,只是演示目前的产品雏形。
360的GPT 产品名字“叫360GPT还是360AI还没想法,希望大家多提宝贵意见,帮它起个名字”,周鸿祎于现场进行征名,网友在直播间纷纷提议取名为“红孩儿”。
在发展人工智能大语言模型上,360的战略是坚持“两翼齐飞”战略,先占据场景,同步发力核心算法技术。在To C端,将推出新一代智能搜索引擎,并基于搜索场景推出人工智能个人助理类产品;在To SME端,将基于生成式大模型推出SaaS化垂直应用,如结合生成式AI的“苏打办公套件”和“企业即时通讯工具-推推”等;在To G和To B端,计划结合数字安全业务推出企业私有化AI服务。
从现场“红孩儿”的表现看,360GPT产品在“算法技术”上确实不能称之为成熟,还是个“孩子”。虽然对于基本事实能做出比较准确的回答,也具有一定程度的理解能力,但在现场观众“梅西在阿根廷国家队进了几个球”的提问上,360“红孩儿”给出了错误答案。不过这并没有影响其股价应声上涨,自从2月份宣布类ChatGPT技术布局之后,三六零股价已经历多轮涨停,从最低点的6.3元左右涨至如今的16.5元,涨幅超过160%,市值再次超1000亿元。
玉言、子曰——网易
“玉言”大模型的前身是网易伏羲自研的GPT2生成模型,模型规模从最早的一亿参数增长至千亿参数,模型领域从文本拓展到图文、音乐、行为序列等多种模态。
“玉言”是对别人所说话的敬称,常与“金口”连用。该大模型的训练语料主要来源于小说、百科和新闻等,相关技术已应用在网易集团内的文字游戏、智能NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。
日前有消息称,网易有道自研的教育场景下类ChatGPT模型也将于近期推出,模型名字确定为“子曰”。基于“子曰”研发的AI口语老师和中文作文批改DEMO已完成,近期开放内测。
“子曰”在古代是各家学生对老师的尊称,也十分符合网易有道所研发的类ChatGPT模型的定位。
在发展方向上,“子曰”类ChatGPT模型将在网易有道已建立起的“内容+硬件+AI”产业链条上,较快实现商业化落地。
书生——商汤
3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,其前身“书生”由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学于2021年11月首次发布,并持续联合研发。
“书生”命名与研发团队学院派的背景一脉相承。官方释义为——书生作为中国古代读书人的经典形象,代表着一个通过不断学习、不断成长进而拥有各方面才能的人格化角色:从基础的知识技能学习开始,到对多种专业知识触类旁通,进而成长为拥有通用知识的通才。
将全新的通用视觉技术体系命名为“书生”,意在体现其如同书生一般的特质,可通过持续学习,举一反三,逐步实现通用视觉领域的融会贯通,最终实现灵活高效的模型部署。
“书生2.5”具备通用场景下图像描述、视觉问答、视觉推理和文字识别等感知和问题处理能力。在自动驾驶和居家机器人等场景下,可辅助处理各种复杂任务。未来的发展方向也将专注于通用模型的技术突破和创新应用。
曹植——达观数据
达观目前正在研发国产版GPT“曹植”系统,主要服务于专业领域的AIGC智能化应用,以及内置在客户各类业务系统中提供专用服务。
“曹植”命名引自曹植七步成诗的典故,官方解释希望它作为垂直、专用、国产的GPT模型,未来在各行各业里落地应用,为每个行业赋能。
“曹植”目前已在金融领域AIGC多场景投入应用,未来还将尝试政务、制造等多个垂直领域和通用场景。
孟子——澜舟科技
3月14日,澜舟科技发布孟子MChat可控大模型,具备聊天、问答、翻译、文本生成、信息抽取等多种能力,对功能、风格、人类认知等方面具可控性。
孟子有云:“以力服人者,非心服也,力不赡也”;“权,然后知轻重;度,然后知长短”。澜舟科技认为这两句话恰好体现了 NLP、AI 技术广泛使用带来的认知智能从“相关”到“认知”的转变。
目前,孟子可控大模型的能力平台已推出机器翻译平台、金融NLP、AIGC智能创作等多个企业级解决方案及对外开放服务,并和多家企业在金融舆情分析、多语言机器翻译、AIGC 营销文案写作、网络文学AI辅助创作上进行了合作。
除此之外,京东、小米、字节跳动等科技巨头,在大模型上也多有布局。京东表示,基于自研领域知识大模型K-PLUG生成的商品文案,已覆盖了京东3000+品类,累计生成30亿字,带来超过3亿元GMV。小米在大模型方面也采取了多技术路线并行的策略,未来会引入更先进的大模型能力,包括探索多模态、智能座舱交互等。字节跳动语言大模型团队由字节搜索部门牵头,图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。
在垂直细分领域,更有积累了丰富专业领域知识的中小创新企业,以各自擅长的方式和角度轮番切入尝试。不论规模,企业家们似乎都听到了时代巨轮转动的“咔”“咔”声,怀揣着几分畏惧、冲动、热血,带着几分粗鲁、逐利、决心,深一脚、浅一脚地一点点踩出国产大模型之路。
这里曾近乎为荒野。
评论