关系信任、算法自画像与心理记忆

ChatGPT 的记忆功能记住了什么?

关系信任、算法自画像与心理记忆
Photo by Zoltan Tasi / Unsplash
💡
本期前沿速递分享了两篇论文。

第一篇论文讨论的是 AI 信任。我们总希望 AI 值得信赖,但现在的做法大多是靠技术和法规来保证。这种方式就像一张张冷冰冰的证书,好像少了点人情味。那我们能不能换个思路,不只谈合规,而是把信任看作一种动态发展的道德关系?要怎么从非洲社群主义这种强调集体福祉的哲学里,找到建立信任的新方法?这些听起来还蛮抽象的原则,又该如何落实在 AI 产品的开发流程里呢?

另一篇论文聊的是我们每天可能都在用的 ChatGPT。为了让对话更顺畅和达人意,它会记住我们说过的话,但这个记忆功能其实在悄悄为我们每个人画一幅「算法自画像」。这幅画像到底是谁在主导绘制,是我们还是 AI?它又记下了我们哪些个人资讯,甚至是内心深处的想法和感受?我们有没有办法在享受便利的同时,保护好自己的隐私,不让这幅画像变得过于清晰呢?

祝今日读写愉悦,洞见深省。

前沿速递

超越抽象合规:将对人工智能的信任作为一种道德关系来运作

核心概念

非洲社群主义(Afro-communitarianism):这是一种源于非洲哲学的伦理框架,其核心观点是人的身份和价值是通过与他人的关系来定义的,即我为人人,人人为我。它不像西方个人主义那样强调个体的独立自主,而是更看重相互依存、集体责任、团结和社群的共同繁荣,同时它又独特地将这种集体关怀与对每个人内在尊严的尊重结合起来。

关系信任(Relational Trust):这个概念将信任从一个可以被设计和测量的静态系统属性,转变为一个在人与技术、人与人之间动态发展的道德关系。它认为,信任不是简单地基于 AI 的性能可靠或符合规定,而是通过长期的互动、相互的理解、共同的经历以及被证明的善意来逐步培养的。这就像你信任一位老朋友,不是因为他每次都完美地完成任务,而是因为在长期的交往中,你们建立了相互理解和支持的关系,你知道即使他犯了错,他的本意是好的,并且会努力弥补。在 AI 领域,关系信任意味着用户对 AI 的信心,并非来自一份冷冰冰的合规证书,而是来自开发者与社区的持续沟通,对用户反馈的积极响应,以及在系统出错时勇于承担责任的实际行动。这种信任是建立在有温度的、负责任的关系之上的。

设计公开性(Design Publicity):这是一种主动、前瞻性的透明度策略,要求在 AI 系统的设计之初就将其核心设计逻辑、价值取向和预期目标公之于众,而不仅仅是在系统建成后提供技术性的事后解释。它强调的不是这个 AI 如何工作,而是我们为什么这样设计这个 AI,包括在开发过程中做出了哪些伦理权衡和价值判断。在 AI 中,设计公开性让受影响的社区能够从一开始就参与讨论和塑造 AI 的基本设计原则,从而建立起基于深刻理解的、更稳固的信任。

研究问题

当前,主导性的人工智能信任框架通常将信任视为一种可以通过设计、评估和治理来实现的系统属性,其核心是遵守规范和技术标准。这种以合规为导向的方法,虽然提供了诸如公平性度量、可解释性工具包和监管框架等工具,但其本质上是将信任简化为一种技术和法律问题。这种做法的不足之处在于,它忽视了信任的社会和关系维度,即信任是如何在人与人之间、在特定的文化和社会背景下,通过主观体验和长期互动而形成、维持或破裂的。它往往将信任的责任从开发者和机构转移到技术本身,可能导致伦理洗白,而未能真正改变权力关系或解决根本性的不公问题。

鉴于现有信任框架的局限性,本论文旨在回答以下核心问题:我们如何能超越这种基于抽象合规的信任模型,将对人工智能的信任重新定义并实践为一种动态的、双向的道德关系?具体而言,如何借鉴关系伦理学,尤其像乌班图(Ubuntu)这样的非洲社群主义哲学思想,来构建一套更具包容性、参与性和情境敏感性的信任原则,并将其有效地融入到人工智能系统的实际开发生命周期中?