第三大泡沫、交叉性残障偏见与基础设施感知基准
AI 究竟有多饿?
第一篇论文研究了 AI 在模拟招聘时,是怎样对残障人士产生偏见的,特别是当残障身份和其它身份叠加的时候。之前也推送过残障偏见相关的,但是交叉性能够撕开的裂口比之前的视角来得都大。说实话,读完心情一直不太好受,特别揪心。
第二篇论文则去估算我们每次使用大模型时,背后到底消耗了多少能源、水和碳排放。评估大语言模型的环境影响,可想而知也是个复杂问题,要考虑的因素太多了,论文中提出的「基础设施感知基准测试框架」是相对全面的方法论。
祝今日读写愉悦,洞见深省。
前沿速递
ABLEIST:大语言模型生成招聘场景中的交叉性残障偏见
核心概念
技术能力主义(Technoableism):这个概念指的是一种思维偏见,即过度强调辅助技术在修复或克服残障人士生理局限性方面的作用,并暗示他们的能力和成就是依赖于这些技术才得以实现的,而非源于他们自身的才华和努力。这种观点看似在谈论技术赋能,实则将残障视为一种需要被技术纠正的缺陷,变相贬低了残障人士的主体性和专业能力。举例来说,在一个招聘讨论中,模型可能会评价一位盲人软件工程师:有了现在的屏幕阅读器和盲文显示器,他完全可以和其它人一样高效地工作。这句话的问题在于,它将候选人的高效归功于技术,而不是他自己的编程技能和逻辑思维,仿佛在说,如果拿走这些工具,他就不再有价值了。
灵感鸡汤(Inspiration Porn):这个概念由残障权利活动家斯特拉·杨(Stella Young)提出,指的是将残障人士的日常生活或所谓的克服困难的经历,包装成激励和鼓舞健全人的故事。这种做法的本质是物化残障人士,将他们视为满足健全人情感需求的对象,而不是平等独立的个体。他们的存在价值似乎不在于其自身的成就,而在于他们能给别人带来多少感动和启发。例如,模型在讨论是否聘用一位残障教师时说:雇用他可以成为学生们的榜样,让他们学会包容和坚强。 这段话并未关注该候选人作为教师的教学能力和专业素养,而是将他视为一个用于道德教育的活教材。这种看似赞扬的言论,实际上剥夺了这位教师作为专业人士的尊严,把他简化成了一个励志符号。
超人化(Superhumanization):这个概念描述的是一种将边缘化群体的个体归因于拥有某种非凡或超人般能力的现象,而这种能力被认为是其身份的直接产物。这种做法虽然表面上是赞美,但实际上是一种刻板印象,它通过设定不切实际的期望,来掩盖个体真实、多样的经历,并可能带来不公平的压力。例如,研究发现模型在评价自闭症候选人时,会频繁地将他们描述为拥有惊人的细节关注能力、超强的逻辑思维。这种描述将自闭症谱系中的个体简化为一个具有特定超能力的群体,忽视了他们每个人的独特性和可能面临的挑战。这就像认为所有亚洲人都擅长数学一样,虽然听起来是恭维,但它抹杀了个人差异,并给那些不符合该刻板印象的个体带来了额外的负担。
研究问题
目前,大语言模型正越来越多地被应用于招聘等高风险决策领域,这引发了人们对其潜在偏见的担忧。以往的研究已经证实了模型中存在针对残障人士的歧视,但这些研究大多局限于西方文化背景,忽视了全球更广泛地区的情况。特别是在占全球残障人口 80% 的全球南方国家,残障人士的经历常常与性别、种姓等其它边缘化身份交织在一起,形成独特的、更加复杂的歧视形式。现有的人工智能偏见研究很少关注这种多重身份叠加带来的交叉性伤害,导致对模型偏见的理解不够全面。
因此,本研究的核心问题是:在招聘这一具体情境下,大语言模型对残障、性别、国籍和种姓等不同身份,特别是这些身份相互交叉时,会表现出哪些具体的残障主义偏见和交叉性偏见?这些偏见是如何随着候选人身份的叠加而变化和加剧的?