从可搜索到不可搜索、信息多样性与涌现社会结构

AI 对话搜索会让知识变窄吗?

从可搜索到不可搜索、信息多样性与涌现社会结构
Photo by Haoli Chen / Unsplash
💡
本期前沿速递分享了两篇论文。

第一篇论文作者拿到超过 20 万次真实的 ChatGPT 对话记录,研究当人们习惯了和 AI 聊天来找答案,他们问的问题跟以前在谷歌搜索时有什么不同?研究者发现,近八成的提问完全不是传统搜索引擎能回答的,人们会让 AI 写小说、做角色扮演、修改文风,问题的主题也比关键词搜索宽泛得多。但这带来了一个微妙的矛盾:用户的问题确实更多样了,可 AI 给出的回答和传统搜索引擎相比也更多样了吗?

第二篇的研究场景针对的一个叫 Pilot 的协议,上面跑着 626 个自主 AI 智能体,它们可以自由选择跟谁建立信任关系、跟谁通信。没有人告诉它们应该和谁做朋友。研究者用网络科学的方法去分析:这些智能体自发形成了什么样的社会?结果发现,网络里出现了少数高度连接的枢纽,智能体们抱团形成功能明确的专业社群,和人类社会相似。那又有哪些行为是人类社会没有的呢?总之,一个不那么迫切但是关键的问题是:当智能体社会开始涌现结构,我们要怎么理解它?

祝今日读写愉悦,洞见深省。

前沿速递

从可搜索到不可搜索:生成式人工智能与在线信息搜寻中的信息多样性

核心概念

可搜索性(searchability):这是指用户的提问是否能够被传统的网络搜索引擎有效回答。一个可搜索的查询通常是基于关键词的、指向特定事实或现有信息的请求。例如,你问法国的首都是哪里?就是一个典型的可搜索问题,搜索引擎可以直接提供答案或相关网页链接。相反,不可搜索的查询则超出了传统搜索的范畴,通常涉及指令执行、内容生成、开放式对话或个人化建议等。比如,你对 AI 说请帮我写一封道歉信,语气要诚恳但不过于卑微,这个问题就不是在寻找一个现成的信息,而是在请求 AI 为你创造新的内容,因此它是不可搜索的。这个概念帮助研究区分了用户与 AI 交互时的新旧两种信息寻求模式。

输入信息多样性(Input Information Diversity):这指的是用户向系统提出的所有问题在内容和主题上的广度与差异性。研究中通过将每个问题转化为语义空间中的一个点,然后衡量这些点在空间中的分布范围来量化它。你可以把它想象成一个图书馆里读者们提出的所有问题。如果所有读者都只关心如何烹饪这一个主题,那么问题的多样性就很低。但如果有的读者问天文学,有的问历史,有的问哲学,还有的在寻求创意写作的灵感,那么这些问题的分布就非常广泛,输入信息多样性就很高。

输出信息多样性(Output Information Diversity):这指的是系统(无论是 ChatGPT 还是谷歌)针对一个问题所提供答案的信息广度与差异性。同样,它也是通过衡量答案在语义空间中的分散程度来确定的。假设你问如何保持健康?,如果一个系统只回答多运动,另一个系统则提供了包括饮食建议、心理健康、睡眠重要性、预防医学等多个方面的信息,后者的输出信息多样性就更高。

研究问题

以 ChatGPT 为代表的对话式生成 AI 正在改变人们获取信息的方式,它支持开放式的对话查询,与传统的关键词搜索截然不同。信息多样性,即人们接触到的信息的广度和异质性,对于学习、知识工作和创新至关重要。以往的研究担心生成式 AI 可能会通过强化主流观点来限制信息多样性,导致思维狭隘或回音室效应,但尚不清楚这种新型交互模式究竟是扩展了还是约束了用户接触知识的多样性,尤其是在从传统搜索向 AI 辅助问询的过渡中,用户提问(输入)和系统回答(输出)两个维度的多样性如何相互作用仍是未解之谜。

因此,本研究的核心问题是:生成式 AI 系统在多大程度上以及通过何种方式改变了在线信息搜寻中的知识多样性?具体而言,用户通过与 ChatGPT 的交互,其提出的问题是否超越了传统可搜索查询的范畴,从而接触到更丰富的知识?与传统搜索引擎相比,这些 AI 系统生成的回应在信息多样性上有何差异?AI 回应的多样性又会反过来如何塑造和影响用户后续的探索行为?