界面新闻记者 |
1月10日,《博鳌亚洲论坛创新报告2023》(简称《报告》)在广州发布,指出亚洲已成为AI大模型技术的主要产出区。
其中,中国为AI大模型专利最多产出国。华南理工大学法学院知识产权研究所所长关永红解读《报告》提及,截至2023年6月,中国AI大模型专利数量占比高达58%,韩国(占比8%)和日本(占比5%)也是亚洲专利主要产出地区;美国占比为18%。
关永红表示,截至2023年10月,国内大模型达到238个,但截至5月只有79个,反映中国大模型快速增长态势。
知识产权数量水平是创新能力产业化的标志。《报告》亦显示,对标纽约、东京等湾区,聚焦四大专利指标(发明专利、PCT专利、同族专利、专利被引频次),粤港澳大湾区的专利综合能力已经超越世界其他湾区。
在发明专利和同族专利方面,粤港澳大湾区公开量和复合增长率位居四大湾区之首:2017-2021年,发明专利公开总量及复合增长率分别为176.9万件和21.74%;同族专利公开量303.21万件,数量多于其他三大湾区总和两倍有余,复合增长率为20.24%。
分行业来看,粤港澳大湾区的发明专利集中在新一代信息技术领域,占比达62.37%,数字创意产业占比为19.63%。新能源汽车相关服务、新材料和生物产业也是主要行业。
高附加值的消费电子、新能源、新材料等先进制造集群是粤港澳大湾区发展AI大模型的基础。迄今为止,华为仍是全球最大的PCT专利申请人,2022年公布了7689件PCT申请,紧随其后的是韩国的三星电子(4387件)和美国的高通公司(3855件)。
OPPO、vivo、荣耀等手机厂商也纷纷下场。vivo在2023年11月发布蓝心大模型,OPPO在今年1月宣布AI大模型在手机端落地。
下一步,AI大模型需要提升逻辑推理能力,并考虑如何产生回报。
1月10日,vivo智能交互技术总监付凡提出,模型本质上是一种介质,“就跟人脑一样,人脑大概有860亿神经元,而vivo发布的模型可以达到约700亿神经元的量级。”
“怎样让模型学习人类的知识,需要通过模型结构跟数据去做这种算法知识,对模型信息进行压缩。我们理解到的信息其实基于压缩机制,对人类信息进行集合、压缩。基于这个前提,模型的智能就能体现在对人类所有知识的汇总。”付凡说。
付凡透露道,vivo从2018年成立研究院对数据图谱化处理:“目前整理了大概1.3万T的多模态数据,包括音频文字、图像设计,提供给模型训练的大概是2800T文本数据,最终模型会形成15T数据。15T是什么概念?相当于电脑、手机硬盘的存储大小。”为了提供这一量级的数据给大模型学习,在算力支持方面,“目前是顶级GPU大概2000卡的运行训练,保证模型训练的效率和稳定性。”
“目前我们感受到模型更多的是一个能力很强的文科生,其逻辑推理能力如何提升,跟心理学、营养学这样面向用户的科学该怎么结合,是下一步我们需要探索的。”付凡称。
德勤中国科技、传媒和电信行业主管合伙人程中认为,大模型将在产业端应用迎来需求爆发,例如能源行业探索“井下无人”,制造业开始探索无人化的黑灯工厂。
2022年,全球对AGI投资达约45亿美元;2023年第一季度该数值达到120亿美元。大部分集中在技术端。
程中强调,AGI撬动的只是一个热点,回到产业端,这项投资要产生回报,有几个不可忽视的话题。
首先是工程体验。“以前的产业数字化里经常谈敏捷开发,但这只能在技术上解决问题,未来更多的是工程体验,解决AI人才极度短缺问题,提升工程师效率。”
数据显示,全球来看,一个开发中的技术工程师平均一周工作量大概是41小时,“但这41个小时有接近一半的时间是在修复bug,不是为了新的功能和效应。如果用工程体验的模型去优化,让这21小时变成10个或5个小时,会给企业端带来很大的价值。”
“另外,要考虑怎么利用通用大模型。很多企业在构建自己的私有模型,但这不叫大模型,因为私有模型的数据涉及商业核心价值。我们预测,未来私有的AI模型跟通用大模型、产业大模型可能是多者融合的状态。算力方面,因为全球面临缺芯,算力不可能会野蛮生长,也可以考虑用共享的模式让算力更敏捷。”程中提到。
评论