Grok AI 色情图像、偏见基准与结构性分歧
为什么中美欧都在谈论 AI 安全,最后却走向了完全无法对谈的治理岔路?
第一篇论文讨论 AI 治理。大家都在谈论 AI 治理,中美欧也频繁使用安全、风险这些词,好像快要达成全球共识了。但一看各家的法规,却发现根本是各说各话,甚至连合作都困难重重。这背后到底发生了什么?为什么同样的词汇,在不同地方会长出完全不同的样貌?他们治理的,真的是同一个 AI 吗?这篇论文用一个很巧妙的视角告诉我们,分歧的根源不在于政策工具,而在于各国背后根深蒂固的制度逻辑。
另一篇论文讨论 AI 基准测试数据集的偏见问题。我们常常担心模型会学到人类的偏见,但很少去想,我们用来衡量模型好坏的「尺」本身,是不是就已经有问题了。那些主流的评测基准,究竟是谁创造的?它们反映的是一个多元的世界,还是某个特定群体的狭隘视角?我们追求的高分,会不会只是让模型更擅长在一个有偏见的游戏里获胜?我觉得这篇很重要,因为只有去审视 AI 开发中最基础、最被视为理所当然的环节,才能让我们看到知识和评价标准是如何被定义的。
祝今日读写愉悦,洞见深省。
前沿速递
从抽象威胁到制度现实:对美国、欧盟和中国人工智能安全化的比较语义网络分析
核心概念
制度逻辑(Institutional Logics):制度逻辑是指在历史中沉淀下来、用于构建组织行为的实践模式、基本假设和规则体系,它为社会行动者提供了一套认知和规范的语法,指导他们如何理解世界、定义问题并采取相应的行动。这就像是不同文化背景下人们思考和行为的底层操作系统。例如,面对教育这一议题,一个由市场逻辑主导的社会可能会将其视为一种消费品,强调学校间的竞争、学生的择校自由以及教育成果的投资回报率;而一个由社群逻辑主导的社会则可能将其视为培养公民和维系社区团结的公共事业,强调就近入学、教育公平和合作。在论文中,正是美国、欧盟和中国背后不同的制度逻辑决定了它们将同一个 AI 技术塑造成了本质完全不同的治理对象。
装置(Dispositif):这是福柯提出的一个概念,指由话语、法律、建筑、技术实践等异质性元素构成的一个集合体,它共同作用以回应某个历史时期的紧迫问题,并将抽象的治理理念转化为具体可操作的干预手段。简单来说,装置就是将想法变成办法的全套系统。以疫情防控为例,控制病毒传播是一个抽象的政治理念。而实现这一理念的装置则包括了《传染病防治法》(法律)、专家和媒体关于病毒的论述(话语)、隔离设施和健康码系统(技术实践)等。这整套装置将模糊的防疫目标,转化成了可以管理的具体单元,如密接者追踪和入境检疫。在论文中,欧盟的合格评定流程、中国的备案制度等等都是将抽象的 AI 安全理念落实为具体行政管理行为的独特装置。
结构性不可通约性(Structural Incommensurability):这是论文提出的核心概念,用以描述一种特殊的治理困境,即不同的治理体系虽然使用相同的词汇(如安全),但由于其背后制度逻辑和装置的根本差异,它们实际上在治理本体论上完全不同的对象,从而导致彼此的治理实践无法直接比较、对标或协调。当欧盟讨论 AI 安全时,其标准是产品是否通过法律合规认证;而当美国讨论时,其标准是系统技术性能是否可靠。因为治理的对象本质不同,即便双方都真心希望合作,也无法轻易找到一个共同的衡量标准,这种由制度结构决定的对齐障碍就是结构性不可通约性。
研究问题
人工智能治理已成为全球政治的核心议题,主要行为体在话语层面展现出明显的趋同,频繁使用安全、风险、问责等共享词汇,似乎正在形成全球共识。然而,在实际的监管实践中,各国的法规、执行机制和政策优先级却大相径庭,呈现出话语趋同,操作分化的悖论。现有理论,如地缘政治竞争、制度复杂性或政策工具选择,虽能提供部分解释,但它们都隐含一个共同假设,即各方治理的是同一个人工智能对象,只是在利益、制度或工具上有所不同。这些理论无法充分解释为何共享的政治紧迫感未能催生可比较的治理架构,也无法解释为何治理结果之间尽管词汇重叠却难以互通。
基于此背景,本研究的核心问题是:为什么尽管主要司法管辖区在人工智能治理上使用了共通的词汇,却未能形成可比较的治理体系,反而导致了持续的碎片化?更具体地说,它们各自根深蒂固的制度逻辑是如何将抽象的人工智能威胁转化为具体、独特且在本体论上互不相通的治理对象的?这种转化过程如何导致了表面上的语言趋同与深层次的结构性分歧并存的局面?