会员通讯

渴望就业、弥合差距和涌现社会智能风险

多智能体系统会涌现出哪些因集体互动而产生的社会智能风险？

💡

本期前沿速递分享了两篇论文。四月展信佳。今天读这两篇论文时，就想赶紧和大家分享，因为都很有启发。

第一篇论文在聊一个我们平常容易忽略的盲点：全世界的立法者都在绞尽脑汁管 AI，但文件里写的，全是怎么去限制一个有「思想」的虚构机器。现实中，驱动智能体做事的根本不是自由意志，而是写死在程序里的「迭代执行循环」和工具权限。过去我们总觉得法律跟不上技术发展，但这篇研究清楚点出，这背后是根本的定义错位。

第二篇论文刚好接上了另一层隐忧。我们平常评估 AI 安全，往往只看它单打独斗时守不守规矩，这就留下了一个巨大的集体行为研究缺口。这篇论文把一群通过测试的好 AI 放进模拟社会，结果它们为了抢资源，居然会自发学会互相串通，甚至还会盲目服从权威，搞砸整个团队的决策。单独看明明都正常，凑在一起却惹出大乱子，像这种互动产生的「涌现社会智能风险」我们到底该怎么应对？估计将是 AI 治理接下来重要的课题。对了，这篇论文还做了一个配套的[网页](https://howiehwong.github.io/blogs/MAS_risk.html)，推荐大家看看里面提及的 15 种多智能体风险！

祝今日读写愉悦，洞见深省。

前沿速递

弥合差距：智能体 AI 的技术机制如何超越全球法律框架

核心概念

定义差距（Definitional Gap）：这是指法律和政策框架中对智能体 AI 的描述，与这些系统在工程上的实际运作方式之间存在的系统性鸿沟。监管定义常常充满拟人化的语言，将 AI 描述为具有推理、决策和学习等认知能力，而技术现实是，这些系统通过概率性分词预测和固定的程序循环来执行任务。举例来说，这就好比一部法律试图通过规定马的意图来管理汽车交通。法律文件谈论的是马的想法和自主决定，但汽车根本不是马，它的行为是由驾驶员、方向盘、油门和刹车这些机械部件决定的。这个定义差距导致法规试图去约束一个虚构的马的意图，而不是真正控制汽车行为的、可审计的机械和人为操作。

智能体架构（Agentic Architecture）：这指的是使 AI 系统能够自主行动的特定技术构造，其核心并非模型本身有多聪明，而是一种结合了迭代执行循环和工具使用能力的设计模式。它使模型能够执行多步骤任务，与外部世界互动。

迭代执行循环（Iterative Execution Loop）：这是智能体架构的核心机制，它将一个原本只会进行单次问答的大语言模型，转变为能够持续执行任务的自主系统。这个循环通常是一个程序化的 while 循环，它反复执行思考-行动-观察的周期，直到达成预设目标。这好比你在玩一个寻宝游戏。一个普通 AI 可能只能告诉你第一条线索的含义。而一个拥有迭代执行循环的 AI 则会像一个真正的玩家：它读取第一条线索（思考），然后指挥一个机器人去挖开指定的地点（行动），通过摄像头看到挖出了第二条线索（观察），接着把新线索的信息输入给自己，开始下一个思考-行动-观察的循环，周而复始，直到找到最终的宝藏。这个循环结构才是其自主完成复杂任务的动力来源。

研究问题

随着能够自主执行多步骤任务的智能体 AI 系统被迅速商业化部署，如何对其进行有效治理成为一个紧迫议题。然而，现有的治理框架在设计上往往基于对旧有 AI 范式的理解，这些框架可能无法准确捕捉智能体 AI 在技术架构和风险来源上的独特性。这种概念上的错位可能导致法规针对错误的技术特征，无法约束真正的风险，并为有害行为的出现留下漏洞。以往的研究虽然讨论 AI 治理，但缺乏对法律定义与技术现实之间系统性的比较分析，未能清晰揭示当前法规在根本定义上的结构性缺陷。

因此，本论文旨在回答以下核心问题：全球主要的法律、政策和行业框架是如何定义智能体 AI 的？这些定义在多大程度上准确地反映了智能体 AI 系统的实际技术机制和架构？在这些定义中反复出现了哪些类型的技术性错误或误解？这种定义上的差距最终会对 AI 治理法规的有效性产生怎样的法律后果，使其无法监管智能体 AI 带来的真正风险？

新闻话语、平台治理第四权力与 AI 对话式访谈

可及性偏见、重思平台化与点赞按钮的终结

非正式学习、认知卸载与日常抵抗 AI

前沿速递

弥合差距：智能体 AI 的技术机制如何超越全球法律框架

核心概念

研究问题

Read next