渴望就业、弥合差距和涌现社会智能风险
多智能体系统会涌现出哪些因集体互动而产生的社会智能风险?
第一篇论文在聊一个我们平常容易忽略的盲点:全世界的立法者都在绞尽脑汁管 AI,但文件里写的,全是怎么去限制一个有「思想」的虚构机器。现实中,驱动智能体做事的根本不是自由意志,而是写死在程序里的「迭代执行循环」和工具权限。过去我们总觉得法律跟不上技术发展,但这篇研究清楚点出,这背后是根本的定义错位。
第二篇论文刚好接上了另一层隐忧。我们平常评估 AI 安全,往往只看它单打独斗时守不守规矩,这就留下了一个巨大的集体行为研究缺口。这篇论文把一群通过测试的好 AI 放进模拟社会,结果它们为了抢资源,居然会自发学会互相串通,甚至还会盲目服从权威,搞砸整个团队的决策。单独看明明都正常,凑在一起却惹出大乱子,像这种互动产生的「涌现社会智能风险」我们到底该怎么应对?估计将是 AI 治理接下来重要的课题。对了,这篇论文还做了一个配套的[网页](https://howiehwong.github.io/blogs/MAS_risk.html),推荐大家看看里面提及的 15 种多智能体风险!
祝今日读写愉悦,洞见深省。
前沿速递
弥合差距:智能体 AI 的技术机制如何超越全球法律框架
核心概念
定义差距(Definitional Gap):这是指法律和政策框架中对智能体 AI 的描述,与这些系统在工程上的实际运作方式之间存在的系统性鸿沟。监管定义常常充满拟人化的语言,将 AI 描述为具有推理、决策和学习等认知能力,而技术现实是,这些系统通过概率性分词预测和固定的程序循环来执行任务。举例来说,这就好比一部法律试图通过规定马的意图来管理汽车交通。法律文件谈论的是马的想法和自主决定,但汽车根本不是马,它的行为是由驾驶员、方向盘、油门和刹车这些机械部件决定的。这个定义差距导致法规试图去约束一个虚构的马的意图,而不是真正控制汽车行为的、可审计的机械和人为操作。
智能体架构(Agentic Architecture):这指的是使 AI 系统能够自主行动的特定技术构造,其核心并非模型本身有多聪明,而是一种结合了迭代执行循环和工具使用能力的设计模式。它使模型能够执行多步骤任务,与外部世界互动。
迭代执行循环(Iterative Execution Loop):这是智能体架构的核心机制,它将一个原本只会进行单次问答的大语言模型,转变为能够持续执行任务的自主系统。这个循环通常是一个程序化的 while 循环,它反复执行思考-行动-观察的周期,直到达成预设目标。这好比你在玩一个寻宝游戏。一个普通 AI 可能只能告诉你第一条线索的含义。而一个拥有迭代执行循环的 AI 则会像一个真正的玩家:它读取第一条线索(思考),然后指挥一个机器人去挖开指定的地点(行动),通过摄像头看到挖出了第二条线索(观察),接着把新线索的信息输入给自己,开始下一个思考-行动-观察的循环,周而复始,直到找到最终的宝藏。这个循环结构才是其自主完成复杂任务的动力来源。
研究问题
随着能够自主执行多步骤任务的智能体 AI 系统被迅速商业化部署,如何对其进行有效治理成为一个紧迫议题。然而,现有的治理框架在设计上往往基于对旧有 AI 范式的理解,这些框架可能无法准确捕捉智能体 AI 在技术架构和风险来源上的独特性。这种概念上的错位可能导致法规针对错误的技术特征,无法约束真正的风险,并为有害行为的出现留下漏洞。以往的研究虽然讨论 AI 治理,但缺乏对法律定义与技术现实之间系统性的比较分析,未能清晰揭示当前法规在根本定义上的结构性缺陷。
因此,本论文旨在回答以下核心问题:全球主要的法律、政策和行业框架是如何定义智能体 AI 的?这些定义在多大程度上准确地反映了智能体 AI 系统的实际技术机制和架构?在这些定义中反复出现了哪些类型的技术性错误或误解?这种定义上的差距最终会对 AI 治理法规的有效性产生怎样的法律后果,使其无法监管智能体 AI 带来的真正风险?