r/ChatGPT 三年、多文化智能体系统与情感参与
当 AI 被要求代表不同文化时,为什么它们反而可能越来越像?
第一篇论文从多文化智能体系统切入。现在已经有不少场景会设想让 AI 代表不同文化背景的人,参与讨论、协商或公共决策。常见评估会问,一个智能体的回答是否接近某个文化群体的多数选择;但如果把多个文化智能体放在同一个系统里,另一个问题就会浮出来:它们彼此之间还保留多少差异?
第二篇论文切入的是另一种更日常的材料:r/ChatGPT 三年来的公开讨论。ChatGPT 这类消费级 AI 产品影响很大,却不容易评估。企业内部使用数据难以取得,用户真实形成的担忧、依赖和期待,也常常是在产品进入生活以后才慢慢显影。于是,研究者转向 2022 年 12 月到 2025 年 11 月间的 13 万多条 Reddit 帖子,细致地追踪了用户讨论是如何变化的?
祝今日读写愉悦,洞见深省。
前沿速递
超越对齐:作为多文化智能体系统集体属性的价值多样性
核心概念
价值多样性(Value diversity):这是指一个多智能体系统内部,不同文化智能体在价值问题上的回答彼此有多不相同。它是系统层面的集体属性,不能从单个智能体身上直接读出。常见测量方式是让所有智能体回答同一组价值调查题,再计算回答向量之间的距离。价值多样性越高,表示系统保留的文化价值差异越大;价值多样性越低,表示不同文化身份的智能体可能正在趋向相似回答。
价值对齐(Value alignment):这是指一个智能体的回答与目标文化参照之间的相似程度。在文化评估中,目标文化参照可以来自社会调查中的群体回答,例如某一国家受访者在价值题目上的多数选择。价值对齐主要回答「这个智能体像不像它被要求代表的文化」。它适合评估单个智能体的文化忠实度,但不能直接说明多个智能体组成的系统是否保留了文化之间的差异。
多文化多智能体系统(Multicultural multi-agent system):这是指由多个智能体组成、且每个智能体被赋予不同文化身份的系统。文化身份通常通过系统提示、角色设定或背景描述注入,使智能体在回答问题、互动或决策时以特定文化视角行动。这类系统可用于模拟跨文化讨论、社会平台或集体决策场景。评估这类系统时,既要看每个智能体是否贴近对应文化,也要看整个系统是否保持文化间的差异。
参与式预算(Participatory budgeting):这是指一种公共决策程序,居民可以提出、讨论并投票决定公共资金投向哪些项目。它常用于城市治理和社区资源分配,核心是让普通参与者直接影响预算优先级。作为实验任务时,参与者或智能体通常需要在多个公共项目中投票,投票分布可以反映群体对教育、环境、健康、安全、社会包容等议题的重视程度。
研究问题
多文化智能体系统越来越常被设想为能代表或服务不同文化背景的人群。已有研究主要评估价值对齐,也就是单个智能体的回答是否接近某个文化群体在价值调查中的多数回答。这种做法能衡量单个智能体的文化忠实度,却无法说明多个文化智能体放在同一个系统中时,系统整体是否仍保留文化之间的价值差异。一个系统可能每个智能体都看似对齐,但它们彼此之间的回答却非常相似,从而形成同质化。
因此,这篇论文的研究问题是:多文化多智能体系统是否需要一种独立于价值对齐的系统层面指标来衡量价值多样性?当前基于 LLM 的系统在不同文化、不同基础模型、不同智能体数量和互动条件下,能否达到人类社会参照中的价值多样性?这种价值多样性又是否会影响参与式预算等集体决策结果?