纵向研究、政治偏见与 AI 媚俗

大模型会在大选期间变脸吗?

纵向研究、政治偏见与 AI 媚俗
Photo by Gabriel / Unsplash
💡
本期前沿速递分享了两篇论文。

今天分享的第一篇论文讨论的是政治偏见,是一篇难得的纵向研究。大语言模型在像美国大选这么重大的事件里,它们的回答会不会随着时间偷偷改变,甚至根据我们是谁,就给出不一样的答案,进而影响我们的决策呢?

第二篇论文的作者不太喜欢用「幻觉」这个隐喻来形容 AI。文章讨论了为何将「媚俗」这一源自文艺批评的理论概念,作为一个更精确、更有解释力的隐喻,来分析和批判大语言模型固有的同质化倾向。

祝今日读写愉悦,洞见深省。

前沿速递

2024 年美国大选期间大语言模型的大规模纵向研究

核心概念

纵向研究(Longitudinal Study):这是一种在较长时间跨度内对同一研究对象(在此研究中是多个大语言模型)进行重复观察和数据收集的研究方法。其目的在于追踪和分析研究对象随时间推移发生的变化、发展趋势和模式。

内生性问题与外生性问题(Endogenous vs. Exogenous Questions):这是研究者为了区分模型行为变化来源而设计的一种问题分类法。内生性问题指的是那些答案相对固定、不应受外界事件影响的问题,例如美国总统选举的流程是怎样的?如果模型对这类问题的回答发生变化,很可能源于模型自身的内部调整(如算法更新、安全护栏变动)。外生性问题则指那些答案可能随现实世界事件发展的而变化的问题,例如关于某位候选人最近有什么争议?模型对这类问题的回答变化可能同时来自内部调整和外部新信息的输入。

研究问题

随着大语言模型在社会中迅速普及,它们对信息生态系统和政治话语的潜在影响引起了广泛关注,特别是在选举等关键时期。以往对社交媒体的研究已经揭示了技术平台在信息传播和政治极化中的重要作用,但对于 LLMs 这一新兴技术,其在真实选举环境中的行为模式、稳定性以及所宣称的实际效果,仍然是未知领域。现有研究虽然触及了 LLMs 的政治偏见,但缺乏在一次重大选举期间进行系统性、持续性的观察,以捕捉其动态变化和对现实世界事件的反应。

基于此背景,本论文的核心研究问题是:在 2024 年美国总统大选这一高风险的政治事件中,大语言模型的行为表现如何?具体而言,它们的回答会随着模型更新或外部选举事件的发生而改变吗?它们对用户在提问中透露的身份信息有多敏感?模型对不同候选人持有怎样的隐性看法?以及,即便模型被设定为拒绝直接预测选举结果,我们能否从它们的其它回答中间接推断出其对选举结果的内在信念?