AI 女演员、风险分歧与作为政治概念的人工智能

AI 风险专家为何分歧巨大?

AI 女演员、风险分歧与作为政治概念的人工智能
Photo by Sergej Karpow / Unsplash
💡
本期前沿速递分享了两篇论文。

第一篇论文的问题和方法都很有意思,讨论为什么专家们对 AI 风险的看法差这么多?他们争论不休,真正的分歧点到底藏在哪里?我们有没有办法把他们的论证过程一步步拆开来看个究竟?

另一篇论文问了一些更尖锐的问题:科技巨头们天天讲的 AI 故事,背后藏着什么样的政治意图?他们是如何在技术还不确定的情况下,为我们描绘一个必然的未来?这种未来已定的说法,是不是悄悄限制了我们民主讨论的空间?

祝今日读写愉悦,洞见深省。

前沿速递

他们为何意见相左:解码 Lex Fridman 播客中关于人工智能风险的观点差异

核心概念

推理链(Reasoning Chains):论文将人们表达的观点理解为一个结构化的论证过程,即推理链。它并非单一的结论,而是由一系列相互关联的前提(包括事实、预测、因果关系、价值判断和定义)通过逻辑连支撑起来,最终导向一个结论。这套框架旨在系统性地解构一个人的论点。举个例子,当一个人说「我们应该暂停开发强人工智能」时,这只是结论。其背后的推理链可能是:前提 1(因果)超智能 AI 的发展是不可控的,前提 2(预测)不可控的系统会带来毁灭性风险,前提 3(道德)毁灭人类是不可接受的。通过分析这条链,我们能清晰地看到其论证的每一步,并可以将其与持相反观点的人的推理链进行精确比较,找出他们究竟是在哪个前提上开始出现分歧的。

根本分歧点(Root Divergence):在两方或多方的辩论中,根本分歧点是指他们各自推理链中最早出现冲突的地方。它是一个最基础的前提或信念差异,这个差异一旦产生,就会像多米诺骨牌一样,导致后续一系列的观点、预测和结论都走向不同的方向。识别这一点至关重要,因为它能帮助我们区分表面上的争论和问题真正的根源。例如,两人争论是否应该建核电站,他们可能在核电是否昂贵或核废料处理方案等问题上争论不休,但这些都可能是下游的观点。真正的根本分歧点可能是一个更基础的因果信念:一方认为复杂技术最终是可控的,而另一方则认为复杂技术存在不可避免的、灾难性的失败风险。找到了这个根本分歧点,才能真正理解他们为何无法达成共识。

研究问题

关于人工智能等变革性技术,社会上存在着深刻的意见分歧,即使在那些共同希望技术造福人类的群体中也是如此。以往的研究虽然尝试通过认知地图或论证挖掘等方法来理解冲突,但存在一些不足:认知地图通常只关注因果关系而忽略了价值判断和定义等其它论证要素,而论证挖掘技术在前提分类上较为粗略,且难以大规模自动化进行深入的比较分析。因此,学术界缺乏一个系统、全面且可扩展的工具来精确诊断公共辩论中意见分歧的根本原因。

基于此背景,本论文试图回答以下核心问题:在关于人工智能风险的辩论中,乐观派和悲观派的根本分歧点究竟是什么?这些分歧是源于对事实的认知不同,还是对因果关系的理解、道德价值的判断或关键概念的定义存在差异?我们能否开发一种自动化方法,从大规模文本数据中系统地提取和比较这些论证结构,从而揭示关于存在风险(X-risk)和就业风险(E-risk)这两种主要担忧的争议根源?