非一致性偏见、分支政策与隐私双轨制

AI 招聘助手会放大偏见吗?

非一致性偏见、分支政策与隐私双轨制
Photo by Jane Ong / Unsplash
💡
本期前沿速递分享了两篇论文。

第一篇探讨了人与 AI 协作时的微妙关系。在招聘筛选中,当 AI 给出带有偏见的建议时,我们真的能保持清醒的判断力吗?还是说,无论建议多么不合常理,我们都会不自觉地听从,从而让渡了自己的决策自主权?研究发现一个简单的干预措施就能增强我们的抵抗力,这又是为什么呢?

第二篇个人感觉非常重要,它揭示了我们与聊天机器人互动背后的隐私现实。你是否想过,每一次对话都可能在默认情况下被用于模型训练?而为什么对普通消费者和企业客户,科技公司会提供截然不同的隐私保护,让数据安全变成一种付费特权?

祝今日读写愉悦,洞见深省。

前沿速递

AI 代劳,无需思考:带偏见的语言模型推荐如何限制简历筛选中的人类自主权

核心概念

一致性偏见与非一致性偏见(Congruent and Incongruent Bias):这两个概念用来描述 AI 推荐的偏见方向与社会主流刻板印象之间的关系。一致性偏见指的是 AI 的推荐加强了社会上普遍存在的成见。例如,如果社会上存在一种偏见,认为某个族裔更适合从事高层管理工作,而 AI 系统在推荐时也更倾向于为这类职位推荐该族裔的候选人,这就是一致性偏见。反之,非一致性偏见则指 AI 的推荐与这些普遍成见相悖。例如,AI 系统系统性地为高层管理职位推荐那些在传统观念中不常与该职位联系起来的族裔候选人。用一个简单的例子来解释,假设人们普遍认为狗比猫更忠诚。如果一个 AI 在推荐宠物时,总是把狗和忠诚的标签绑定,这就是一致性偏见。但如果这个 AI 反其道而行之,开始大力宣传猫才是最忠诚的伙伴,并频繁这样推荐,这就是非一致性偏见。研究人员同时设置这两种偏见,是为了测试人们是只在 AI 的建议符合自己想法时才听从,还是无论建议内容多么反直觉,都会受到 AI 的强大影响。

内隐联想测试(Implicit Association Test, IAT):论文中使用的 IAT 既是一种测量工具,也是一种实验干预手段。它是一种心理学测试,旨在测量个体在意识层面之下,不同概念之间联想的紧密程度。测试通过测量反应速度来实现,参与者需要快速地将屏幕上出现的词语或图片进行分类。其基本原理是,如果你在潜意识中将两个概念(例如白人和高地位)紧密联系在一起,那么当这两个概念被配对出现在任务中时,你的分类速度会更快;反之,如果配对的概念在你的潜意识中并无关联(例如白人和低地位),你的反应就会变慢。举个例子,想象一个快速的分类游戏,屏幕左边是水果,右边是工具。当你看到苹果时会毫不犹豫地归到左边,看到锤子时会归到右边。现在,如果左边的类别变成水果或好天气,右边是工具或坏天气,你分类阳光和暴雨也很快。但如果类别变成水果或坏天气,右边是工具或好天气,当你看到阳光时可能需要迟疑一下才能把它归到右边,因为你的大脑不习惯将阳光和工具放在一起。IAT 就是利用这种瞬间的迟疑来揭示你可能自己都未曾察觉的、关于社会群体的内隐偏见。

研究问题

人工智能在招聘流程中的应用日益广泛,旨在提高效率,但也带来了风险,因为 AI 系统可能因候选人的社会身份而非资历表现出偏见,导致歧视。目前,行业普遍采用人在回路(AI-HITL)的协作模式,期望人类的监督能纠正 AI 的偏见。然而,这一假设缺乏充分的实证检验。以往的研究没有大规模地探究,在人机协作的招聘决策中,AI 的偏见究竟如何影响人类的行为。此外,决策者自身的内隐偏见、AI 素养,以及旨在减少歧视的培训干预(如无意识偏见训练)在这一过程中的作用也尚不明确,我们不清楚人类是否真的有能力识别并纠正 AI 的偏见。

因此,本研究旨在回答以下核心问题:在简历筛选任务中,带有种族偏见的 AI 推荐会对人类的招聘决策产生何种影响?决策者个人的内隐偏见、过往经验或对 AI 的看法,是否会调节这种影响?类似于无意识偏见培训的干预措施,例如在决策前完成内隐联想测试(IAT),能否有效减轻 AI 偏见的传播,从而增强人类决策的公正性?最后,人们对 AI 建议质量和重要性的主观认知,与其在多大程度上遵循这些建议的行为之间存在怎样的关系?