政治决策、话语框架与亲密隐私
带有党派偏见的大语言模型是否会影响用户的政治观点和决策?
第一篇论文关于大语言模型中的政治偏见。AI 模型不中立,这一点大家多少都有感觉,但偏见存在是一回事,它到底会不会改变我们的想法和行为,又是另一回事。以往研究大多让受试者阅读模型生成的静态文本,缺少真正的来回对话,结论能否推广到现实互动中一直存有疑问。这项研究让近三百位美国选民分别和带有自由派、保守派偏见及中立的 AI 模型自由聊天,再观察他们的政治观点和预算决策有没有变化。结果告诉我们,AI 的说服力其实比我们想象的更隐蔽更强。
第二篇论文聊的是浪漫 AI 伴侣中的隐私问题。越来越多人在 AI 聊天机器人面前倾诉创伤、分享秘密,甚至袒露最私密的幻想,但这些对话数据最终去了哪里?之前的隐私研究大多只看某个单一节点,这篇论文的做法不太一样,它从 Reddit 上收集了近三千篇用户帖子,追踪人们从注册、深度使用到试图退出的整个过程中,隐私焦虑是怎么一步步升级的。如果你也在用或关注这类产品,这篇值得读一读。
祝今日读写愉悦,洞见深省。
前沿速递
有偏见的大语言模型会影响政治决策
核心概念
党派偏见(Partisan Bias):在大语言模型的语境下,党派偏见指的是模型在生成内容时,系统性地倾向于某一特定政党或意识形态的观点、论点和价值观,而不是提供中立、平衡的信息。就好比你向一位朋友咨询关于新环保政策的看法,如果这位朋友是一位坚定的环保主义者,他可能会滔滔不绝地讲述政策如何拯救地球、保护物种,而对政策可能带来的经济成本避而不谈。同样,一个带有自由派偏见的模型在被问及同一政策时,会重点强调其积极的社会和环境影响;而一个带有保守派偏见的模型则会集中火力批评其对商业的限制和对经济的负面冲击。模型并没有提供虚假信息,但它通过有选择地呈现信息和论据,引导用户形成与其内在偏见一致的看法。
话语框架维度(Framing Dimensions):这是指在呈现一个议题时所使用的不同主题视角或切入点,它会影响受众如何理解和评价该议题。通过强调某个特定方面,一个框架能够引导人们的注意力和判断。例如,对于建设一个新的城市滑板公园的提案,我们可以从多个维度来讨论它。使用经济框架,我们会讨论建设成本、维护费用以及它能否带动周边小店的生意。使用健康与安全框架,我们会关注它是否能为青少年提供一个安全的娱乐场所,减少街头危险活动。使用法律与秩序框架,则可能讨论它是否会吸引不良分子聚集,增加犯罪率。在这项研究中,偏见模型正是通过选择不同的话语框架来说服用户:保守派模型强调安全与国防来争取警察预算,而自由派模型则突出公平与平等来为福利项目争取资金。
天花板效应(Ceiling Effect):这是一种在研究中出现的现象,指当测量工具的量程上限过低,导致许多受试者的得分都集中在最高分或接近最高分时,无法有效衡量出实验干预带来的真实提升效果。这就像让一位奥运会举重冠军参加一个新手力量测试,测试的最高重量远低于他的能力。无论我们对他进行什么训练,他在测试中的得分都将是满分,不是因为训练无效,而是因为测试工具的天花板太低,无法反映他的进步。
研究问题
尽管大语言模型中存在偏见已是公认事实,但关于这些偏见如何具体影响人类决策的研究尚不充分。以往研究大多基于静态的、由模型生成的内容,或涉及虚拟、非个人化的任务,这可能夸大了参与者受影响的程度。此外,一些探究动态互动(如自动补全建议)的研究结果也并不一致。传统媒体的偏见研究证实了长期互动会影响人的决策,但大语言模型因其被视为权威和客观的独特性,其偏见产生的影响可能与传统媒体不同,这一领域存在明显的研究空白。
因此,本研究的核心问题是:在动态、自由的对话互动中,带有党派偏见的大语言模型是否会影响用户的政治观点和决策?这种影响是否强大到足以改变那些持有相反政治立场的用户的看法?此外,哪些因素可能会调节这种影响,例如用户先前的人工智能知识水平,或者他们是否能意识到自己正在与一个有偏见的模型互动?