相似度排名、谷歌知识基础设施与 AI 失败循环

工作场所 AI 为何反复失败?

相似度排名、谷歌知识基础设施与 AI 失败循环
Photo by José Trejo / Unsplash
💡
本期前沿速递分享了两篇问题意识很独特的论文。

第一篇论文关注谷歌搜索引擎的认识论转变。谷歌网页搜索靠 PageRank 算法,用链接关系判断权威性,这套机制已经被研究得很充分了,但图片搜索背后的排名逻辑其实一直不太透明。这篇论文在六个国家做了跨国比较,发现图片搜索的排序从「谁最权威」悄悄变成了「谁最像」,例如搜气候变化,不管你在澳大利亚还是尼日利亚,看到的都是差不多的干裂土地和卡通地球,权威来源反而被大幅稀释。你可能会想,不过是搜图而已,有什么关系?但当算法用视觉相似度来决定什么值得被看见,我们对复杂议题的理解会不会也跟着窄化了?这个问题蛮值得想想的,我之前还真没意识到。

第二篇论文聚焦工作场所里那些「说好要帮忙却越帮越忙」的 AI。社工、家庭护工、教师,这些以女性为主的职业,专业技能长期被低估。以往研究多把 AI 部署失败归因于技术不成熟或管理不善,但这篇论文挖出了一层更深的东西:职业贬值。开发者打从一开始就不理解这些工作有多复杂,做出的工具自然跟实际需求脱节;工具不好用,锅却甩给工人,说她们不会用、抗拒变革。这个恶性循环读起来让人有点不舒服,但也正因如此,它提醒我们,或许 AI 在职场中的失败,根子往往不在技术,而在谁的声音被听见、谁的专业被尊重。

祝今日读写愉悦,洞见深省。

前沿速递

从权威排名到相似度排名:计算机视觉对谷歌知识基础设施的影响

核心概念

网络认识论(Web epistemology):这指的是搜索引擎用来组织和排序信息、判断其价值的根本原则或逻辑。论文指出,传统的谷歌文本搜索遵循的是权威排名(ranking-by-authority)的认识论,其核心是 PageRank 算法,认为一个网页被越多高质量网页链接,其权威性就越高。而谷歌图片搜索则催生了一种新的相似度排名(ranking-by-similarity)认识论,它依赖计算机视觉模型来判断图片内容的视觉一致性,并优先展示那些看起来像的图片。

议题配置(Issue configuration):这指的是技术(如搜索引擎)如何通过其组织和呈现信息的方式,来塑造和建构公众对某个社会议题的理解和看法。搜索引擎并非中立地呈现信息,它所选择展示的网页链接、图片和摘要,都在无形中定义了一个议题的面貌,突出了某些方面而忽略了另一些方面。例如,论文发现谷歌图片通过在全球范围内展示高度同质化、去社会化的地球或森林图像来配置气候变化和生物多样性丧失议题,这使得这些议题看起来是遥远的、全球性的、与个人生活关系不大的问题,从而影响了公众的认知和参与感。就像拼图一样,搜索引擎提供了特定的碎片,并决定了这些碎片的摆放方式,最终拼凑出了一幅关于某个议题的特定图景。

研究问题

谷歌作为全球主导性的搜索引擎,已成为人们获取信息的关键知识基础设施。其传统的文本搜索以 PageRank 算法为核心,通过分析网页间的链接关系来评估其权威性,这一机制已被广泛研究。然而,随着视觉内容日益重要,谷歌图片搜索的使用也愈发普遍,其排名机制却相对不透明。谷歌图片采用计算机视觉等人工智能技术对图片进行分类和排序,这种技术转变可能深刻地改变了信息的组织和呈现方式,但学术界对此类变化对知识获取和议题建构的具体影响,尤其是在国际范围内的比较研究,还存在明显空白。

因此,本研究的核心问题是:在国际范围内,谷歌图片的搜索结果与谷歌文本搜索的结果相比有何不同?这些差异又应如何通过谷歌知识基础设施的变化来解释?