机器惯习、阶级与性别偏见
AI 扮演职业时会暴露阶级偏见吗?
第一篇论文深入探讨了 AI 聊天机器人如何习得并内化我们社会中的阶级结构,通过模仿不同职业的品味与谈吐,展现出「机器惯习」。
第二篇论文则通过大规模实验揭示,文生图模型不仅在复现,更是在系统性地放大性别偏见。虽然结论可能不是特别新鲜,但是相对之前分享过的文献来说,这一篇的研究方法更全面严密。
祝今日读写愉悦,洞见深省。
前沿速递
人工对话的社会文化根源:生成式 AI 聊天机器人的品味、阶级与惯习
核心概念
机器惯习(Machine Habitus):指的是机器学习系统通过其训练数据和反馈数据所习得并内化的一套文化倾向与习性。这套系统反映了训练数据中蕴含的社会结构、偏见和不平等。就好像一个人在特定的家庭和社会环境中长大,会不知不觉地形成一套看待世界的方式、品味和行为习惯一样,一个大语言模型在由人类社会产生的海量文本数据中成长,也会学习到这些文本中潜藏的社会规则和刻板印象。
社会空间(Social Space):这是布迪厄提出的一个核心概念,它并非指物理地理空间,而是一个根据个体所拥有的各种资本(如经济资本、文化资本)将其定位的抽象关系网络。在这个空间里,拥有相似资本总量和结构的人群会聚集在一起,形成不同的社会阶级,并发展出相应的生活方式和品味。就好像在一张城市地图上,富人区和工薪阶层区泾渭分明,社会空间这张地图也是如此,大学教授和建筑工人就处于不同的区域。论文认为,AI 模型的向量空间正是现实世界社会空间的数据化反映,模型通过学习数据,掌握了这张地图,从而能够根据输入的职业角色,准确地为其在虚拟的社会空间中定位,并赋予其符合该位置的品味和行为模式。
人工社会性(Artificial Sociality):指的是人工智能,特别是对话式 AI,通过模拟人类互动、参与对话并展现出符合社会情境行为的能力。它不仅仅是简单地回应问题或执行任务,而是指 AI 在互动中能够扮演角色、表达情感、调整语言风格,并表现出对社会规范的理解,从而营造出一种社交的假象。
研究问题
以往关于人工智能偏见的研究,大多集中在性别和种族这两个维度,取得了丰硕的成果,但对于社会阶级这一同样重要且复杂的社会学议题却关注较少。现有的研究虽然证实了算法系统可能加剧社会不平等,但很少有研究深入探讨生成式 AI 在日常对话中,是如何具体地、文化性地再现和固化与社会阶级相关的品味、生活方式和刻板印象的。这种研究空白使得我们对于 AI 如何在其人工社会性中反映并可能强化现实社会阶层结构的文化根源知之甚少。
因此,本研究的核心问题是:当生成式 AI 聊天机器人被要求扮演不同社会阶级(以职业为代表)的个体时,它们是如何在人工对话中表述和再现这些角色的生活方式、审美偏好和文化品味的?这些基于阶级的表述是否存在系统性的规律和刻板印象?不同 AI 模型(ChatGPT、Gemini、Replika)在展现这些阶级特征时有何差异,这些差异又是如何受到模型自身设计、技术架构和商业模式影响的?