文 | 极客公园 张勇毅
编辑 | 郑玄
你是否设想过「完全由 AI 掌控运行的世界」会是什么面貌?
或许你还以为这种设想距离我们仍然有一段距离,但实际上「世界上首个 AI」文明已经诞生,并且还是在一个全年龄向的游戏中。
「让 AI 自己构建世界并运行」这个概念,其实在大模型的发展过程中并不陌生:尤其是在一个开放世界类游戏中,探索 AI 会如何自主决策,一直是 Agent(智能体)研究领域常被提到的发展方向。
这种设想也经常成为文学作品的背景设定:在美剧《西部世界》中,就出现了这样一个完全由 AI「构建」、以美国西部拓荒历史为原型的虚构文明,它会根据实际情况做出对应的决策,即使是有人类的介入,这个完全由 AI 构成的小社会也能保持正常运转。
这样的设想,如今已经被一家 AI 陪玩公司开发出了雏形:9 月 4 日,创业公司 Altera 的创始人 Robert Yang 在社交媒体上发布了一段关于号称是「世界上首个智能体文明」的演示视频,并配文:
「人类之所以能登上月球,是因为人类能够完成大规模的合作」「AI能做到同样的事吗?」
截至本文发布时,这条视频的观看量已经突破 71 万次,并获得了包括 OpenAI 员工在内的多方技术大牛的转发与讨论。成为了业内讨论最多的新话题,Robert 本人更是表示会在九月下旬发表更多的研究论文,公开其中的更多有趣细节与技术原理。
01 构建新文明
这个所谓的「世界首个智能体文明」,实际上名为「希德计划」(Project Sid),旨在构建一个由数千个 AI 驱动的智能体构建起的文明。
从 Robert 公布的视频中能看出,目前这个世界中,「居住」着超过一千个智能体,并按照人类社会的发展模式,构建了属于自己的社会体系:包括政府、警察以及宗教机构,甚至还有对应的「宝石」来作为货币交易体系。
在演示视频中,这些数量超过四位数的智能体,他们每个都被赋予了自己独特的姓名、专长与爱好,这些在很大程度上决定了他们在这个小小社会中,会充当怎么的角色,最终让整个生态每个人都安居乐业,维持在一个平衡的状态,并齐心协力,在抵御怪物入侵以及满足生存的前提之下,完成基建等复杂工作。
在 GPT-4 的加持下,「希德计划」中的智能体们实现了前所未有的突破:他们收集的物品是以往类似实验的五倍之多,并且他们还模拟出了现实世界中存在的民主议会,以及宗教等人类文化特征。
更加有趣的是,开发者在智能体社会已经构建出民主制度的基础上,塞进了智能体版本的特朗普与哈里斯,并将美国两党的主要施政理念以文档的方式散布在这个社会中,让人类世界的美国大选真正来临之前,智能体社会先进行一次模拟大选。
在这个社会中出现某个成员失踪的情况时,其他智能体会先进行讨论分享现有信息,并迅速做出结论,合力寻找失踪的成员,并迅速提出「亡羊补牢」的改进措施——增加道路旁的火炬数量,来降低未来成员失踪这样的事件发生的概率。
这些模拟社会中的细节,不同于以往我们已经熟悉的 AI 单枪匹马的强悍表现,更是展现出了一个高度文明化的社会:能自行规范成员,并且在紧急情况下迅速互助来实现应变的团队。
02 开发团队
实际上,Robert Yang 此前创立的 AI 初创企业 Altera,在今年五月就推出过一款 AI 陪玩 Agent「Altera Bots」,应用游戏就是《我的世界》。
在五月发布的陪玩机器人中,Altera Bot 就已经展现出了无需玩家干预,自主进行游戏,在玩家游玩遇到瓶颈时出手相助。
但这个 AI 陪玩也不只是会完全听从玩家的命令行事,例如如果玩家要求 AI 陪玩机器人去攻击其他玩家,机器人就会拒绝这样的请求,甚至还会在玩家在游戏中攻击机器人时,做出一定程度上的反击。
彼时,这个 AI 陪玩机器人就已经展现出了一定程度上的自主决策能力,但这时的 AI 距离足以构建文明的智慧能力还有很长一段距离。
虽然 Altera Bot 作为一个陪玩机器人,其表现在当时一众对话机器人的表现中看起来并不出众,但这家公司在首个产品——也就是这款《我的世界》AI 陪玩平台发布之后,就迅速收获了包括 Google 前 CEO 艾瑞克施密特旗下投资公司在内的 900 万美元融资。
能迅速收获资本青睐的原因无他,Altera 创始团队不仅包括 Robert 这样拥有耶鲁计算神经科学博士学位的、并且创业前曾是麻省理工学院研究所负责人这样的大牛,公开的创始团队中,也还有多位来自 Google X、斯坦福机器学习研究小组以及伯克利著名 AI 研究机构的科学家加入。
除了创始团队,资本更看重的,或许是在「陪玩机器人」的表象之下,Altera 在数字孪生领域的巨大潜力;通过一个完全模拟出的人类社会,来观察群体在面对重大问题时的选择。
这也并不是《我的世界》第一次在生成式 AI 领域作为「开放世界样本」得到应用:2023 年五月,英伟达 AI 科学家 Jim Fan 等团队,已经通过将 GPT-4 打包进《我的世界》,测试 AI 基于环境反馈来学习技能的效果。
Voyager 已经初次展现出 AI 无需调整模型参数、可以复用此前学习到的技能、实现「终身学习」的潜力。但当时还停留在单个智能体的「升级打怪」之路。
如今,AI 在游戏中不仅可以独立思考,还能在此基础上完成团队协作,让 AI 完成很多原本看起来复杂的「超级工程」,成为了可能。
但想要构建一个稳定的文明,是一件极其复杂的工程:Altera 在希德计划的技术博客文章中提到,团队在构建这个世界时面临的主要挑战,就是如何去衡量社会进步程度与因素:社会的进步可以体现在 AI 更加富裕或是整个 AI 社会更加壮大,但这些都无法从整体上认定 AI 社会出于一个进步的状态。
此外,人类在通过自然语言给 AI 下达命令时经常会出现「词不达意」的情况,在 AI 社会中也经常出现,研究团队在论文中特别提到目前以 GPT-4 的能力赋予智能体,在传递具体任务信息(例如制作铁镐)时,对传达信息的准确度有着极高的要求,不然就会随着庞大社会中不同分工的逐层传递变化,导致实际结果与最初的指令天壤之别。
03 「数字生命」探索世界
在「数字孪生」与「数字生命」这两个概念爆火之前,《我的世界》其实一直是关于文明发展过程的优秀载体,由此带来的意义甚至已经超过了游戏本身的内容。让两组「村民」(游戏中的 NPC)在玩家的干涉下,各自发展文明,在发展到一定阶段后爆发战争,经常是 YouTube 上《我的世界》主题视频中的热门视频,播放量以千万计。
但除了这些剧情设定上带来的表演效果,在一个完全由智能体构建的社会中,会根据当前需求思考、整理需求的 AI,在游戏中不断发展,一定会触及智慧生命都会想到的那个终极命题:
「我存在的意义是什么?」
在《我的世界》中,这个「终点」被设计为「收集足够的材料与补给,打造下界传送门,去击败最终 Boss——末影龙」。
这个目标在英伟达 Voyager 时期,AI 已经可以实现打造一个有着复杂 3D 结构的下界传送门,但这时还是建立在人类提供信息标注反馈的基础上——因为其中不仅涉及到复杂建筑,还涉及到了在生存之外更高维度的需求。
在 Robert Yang 公布的演示视频中,其实也已经涉及到了这种 AI 的成长曲线:一位名为 Olivia 的女性智能体,她被设定的工种为「农夫」,负责为整个社区供应食物。
但在某一天,Olivia 受到了社群中某个冒险家的激励,于是产生了「世界这么大,我想去看看」的想法;但在与社区中的其他智能体讨论过后,她明白了向外探索的冒险固然重要,但当下的这个社区,同样离不开她的工作来喂饱所有成员。
在这个过程中,Olivia 觉醒了作为个体的价值探索,但同时也意识到了自己所背负的责任,这个高度人性化的过程,完全是一个社会化的智慧生命应该表现出的特征。
从开发团队发布的论文中也能看出,比起《西部世界》,开发团队更想做的或许是另一款游戏《底特律:变人》中设想过的场景:未来具有高度自主能力的智能体可以凭借极其聪慧的能力,以及能够理解现有规则并遵守的组织能力,去融入人类社会,来帮助这个社会变得更加高效,同时解决现有人类社会中一些仅凭人类很难解决的社会问题。
在《底特律:变人》中,创作者借游戏中人类角色汉森之口,道出了他们所设想的智能体融入人类社会的最终目标:CyberLife androids are designed to work harmoniously with humans.(模控生命的仿生人本来就是设计要与人类和谐共事。)
Altera 的希德计划,或许已经是目前人类在大模型研究领域所能实现的规模最大、最完善的社会模拟实验,其中智能体所展现出的人性与文明,甚至已经到了如今人类相比之下就会感到羞愧的地步。
当然也有人看的更远,在原贴发布的评论区,已经有人看到了这些智能体们,在文明与人性之下,所潜藏的欲望与冲突:在模拟中无论代表特朗普还是哈里斯的智能体当选,都提出了包括「反对堕胎」「增加更多警察来预防犯罪」这样相对具有争议性的政策。
一个完全由智能体构成的文明,会重新走上人类走过的道路,还是会通过更具智慧的方式,来更理想化的解决这些问题呢?
评论