暂停数据中心、残障表征与人类能动性

当 AI 描绘残障人士时,它脑中浮现的是什么画面?

暂停数据中心、残障表征与人类能动性
Photo by Lena Polishko / Unsplash
💡
本期前沿速递分享了两篇论文。

第一篇论文聊的是 AI 图像生成模型里的偏见。我们都知道 AI 会从训练数据里学到一些刻板印象,但关于残障群体的表征问题,讨论得还比较少。当模型被要求画一个残障人士时,它默认会画出什么样子?对于像抑郁症这样看不见的精神障碍,模型又是如何通过画面氛围来表达的?更关键的是,开发者为了让图像更多元而加入的缓解策略,真的有用吗?

另一篇论文讨论当编剧开始用 AI 辅助写剧本,这个合作关系是如何一步步建立起来的?研究者不再只看某个时间点的互动,而是好奇整个动态发展的过程。他们想知道:编剧在和 AI 合作时,是如何主动计划、判断和调整的?经过一段时间的磨合,编剧本身的工作流程、创作信心,甚至是思考方式,发生了哪些改变?从这些经验出发,他们对未来的 AI 工具又有什么样的想象和期待?其中许多对人机关系的思考,我觉得还蛮有启发的,完全不局限于编剧的场景。

祝今日读写愉悦,洞见深省。

前沿速递

探究图像生成模型中的残障表征

核心概念

技术健全主义(Technoableism):这个概念指技术设计和想象中根植的一种健全主义偏见,即认为技术的主要或理想目标是消除、修复或治愈残障,从而推崇和强化非残障人士的生活方式。这种观念将残障视为一个个体需要解决的问题,而非社会或环境的障碍,并将残障人士视为技术的被动接受者。例如,人工智能系统常被宣传为解决个人局限的方案,比如开发一个能让盲人看见的设备,而不是通过改进社会基础设施来更好地支持盲人的生活方式。这种框架忽视了残障人士作为能动的主体所拥有的多样化生活经验和愿望。

情感框架(Affective Framing):这个概念指通过图像中的各种视觉元素(如面部表情、人物姿势、背景、光线和色调)来传达特定情感或情绪基调的方式。它不仅仅关乎图像中人物的情绪,更关乎整个场景所营造的氛围,共同塑造了观众对图像内容的感知。

表征缓解策略(Representational Mitigation Strategies):这是指人工智能模型开发者为减少或消除模型输出中的社会偏见、刻板印象和有害内容而采取的一系列技术干预措施。这些策略可以在模型训练的不同阶段实施。例如,在训练前,开发者可以过滤掉训练数据中包含暴力、色情或歧视性的图文内容;在训练过程中,可以通过数据重加权来平衡不同人群的出现频率,避免模型过度偏向某一群体;在模型部署后,可以设置提示词黑名单或使用分类器来拦截和拒绝生成不当内容的请求。论文中提到的 DALL·E 3 就采用了比 Stable Diffusion 更严格的表征缓解策略,旨在使其生成更多样化的人物形象。

研究问题

目前,图像生成模型因其训练数据源于互联网,常常会继承并放大社会中存在的偏见,如性别和种族偏见。尽管已有研究关注这些方面,但关于残障人士的表征问题却鲜有探讨。现有的研究初步表明,人工智能生成的图像倾向于将残障人士刻画成坐轮椅、悲伤或孤独的刻板形象,但缺乏对不同残障类别之间表征差异的量化分析,也未深入探究模型开发者采用的偏见缓解策略如何具体影响这些表征。

因此,本研究旨在回答以下核心问题:图像生成模型是如何表征残障的,特别是模型是否会将残障这一通用概念默认为某一特定类型的残障?此外,不同的表征缓解策略,例如 DALL·E 3 中应用的策略,与控制较少的 Stable Diffusion XL 相比,如何影响对残障,尤其是精神障碍的情感描绘?