AI 语音的社会影响、LLM 的男性默认与话语塑造
AI 语音会如何改变我们的说话方式?
第一篇论文,视角很独特!它探讨了那些日益逼真的对话式 AI 语音,究竟是如何通过「社会标记性」和「声学 - 韵律趋同」这些语言学机制,潜移默化地影响我们的说话方式、日常用语,甚至是我们展现社会身份的方式?
另一篇研究也相当有趣,它把目光投向了播客和大语言模型。大家有没有感受到,在商业、科技这些高价值领域,某些说话风格似乎更流行?这篇研究揭示了一种叫做「男性默认」的现象,研究发现男性的某些口头禅组合,在上述这些领域以及 AI 对语言的理解中,被无形中视为了标准。这不仅指出了男性话语模式的潜在主导地位,更警示了可能由此产生的性别偏见。
祝今日读写愉悦,洞见深省。
前沿速递
AI 会塑造我们的说话方式吗?合成语音新兴的社会语言学影响
核心概念
社会标记性(Socioindexicality)指的是交流的某些特征(例如词汇选择、语法结构、发音方式、语调、言语风格等)如何指示或暗示说话者的社会身份(如年龄、性别、社会阶层、地域归属、教育背景等)和群体归属。这些特征就像一个个「标记」,它们并不直接表达这些社会信息,而是通过与特定社会群体或身份特征的长期关联,间接地索引(index)出这些信息。换句话说,当我们听到某人说话带有特定的口音或使用特定的俚语时,我们可能会下意识地将其与某个特定的社会群体联系起来,这就是社会标记性在起作用。这些标记元素在口语交流中尤为突出,因为声音本身就承载了大量此类线索。
声学 - 韵律趋同(Acoustic-prosodic entrainment),也常被称为「对齐」(alignment)、「顺应」(accommodation)或「趋同」(convergence),指的是在对话过程中,对话参与者的声学特征(如音高、音量、音长等)和韵律特征(如语速、节奏、语调模式等)会不自觉地变得越来越相似的现象 。这是一种自然发生的互动行为,对话双方会下意识地调整自己的说话方式,以在某些声学和韵律层面上与对方相匹配。
研究问题
随着语音技术和语言技术的飞速发展,特别是大语言模型和文本转语音技术的显着进步,与 AI 进行口头互动变得越来越普遍和逼真 。这些技术使得 AI 能够进行更自然、更富有表现力、更像人类的对话,例如,在自然轮替和打断处理方面取得了突破,这预示着人类与 AI 进行口语交流的规模将急剧增加 。
基于此,作者提出了几个研究问题:随着对话式 AI 语音界面日益普及和逼真,它们将如何以及在多大程度上影响和塑造人类的日常说话方式、语音习惯和言语风格?AI 生成的语音中所嵌入的社会标记元素(如口音、语调、言语风格等)将如何影响用户的感知、行为,并进而影响他们的社会身份表达和群体归属感?