拒绝监控、亲密治理与中文搜索的信噪比

中文互联网上的传统搜索引擎、国产大模型和 AI 概览,哪一个更靠谱?

拒绝监控、亲密治理与中文搜索的信噪比
Photo by Sanni Sahil / Unsplash
💡
本期前沿速递分享了两篇论文。越来越多人在 AI 伴侣 App 上面寻求情感慰藉,分享非常私密的心事。那这些我们以为是私密对话的数据,平台到底是怎么处理的?

第一篇论文就在探讨这个问题。它系统地分析了中西六个主流 AI 伴侣平台的隐私政策,试图回答:平台在法律上如何定义我们与 AI 的“亲密关系”?它们又是如何把我们的情感交流,一步步变成可以被商业利用的资产?更重要的是,平台声称的那些用户保护措施,尤其是对未成年人的保护,真的落到实处了吗?

另一篇论文则把焦点放在我们每天都会用的中文搜索上。现在查资料的方式越来越多了,除了传统的百度、搜狗,还有各种大模型可以直接给答案,搜索引擎自己也加上了 AI 概览功能。那么问题来了:当我们想查一个简单的是非题,这三种方式到底哪一种给出的答案更准确?它们各自会在哪些领域更容易出错?还有,研究发现,经济越发达的地区,人们接触到错误健康信息的风险反而越高,这又是为什么呢?这篇的现实价值在于提醒我们什么时候该对 AI 给出的答案多一份警惕,其背后关乎我们如何在这个信息真假难辨的时代里,更好地思考和判断。

祝今日读写愉悦,洞见深省。

前沿速递

亲密关系的治理:浪漫 AI 平台的初步政策分析

核心概念

默认训练挪用(Default training appropriation):这是一种平台数据治理策略,指平台默认将用户与 AI 的所有交互内容(包括非常私密的对话)自动用于训练和优化其人工智能模型,而无需事先获得用户的明确同意。用户如果想阻止这种行为,必须主动寻找并完成一个通常很隐蔽或复杂的退出流程。

研究问题

AI 伴侣应用正迅速普及,它们鼓励用户进行深度的情感和个人信息披露,这使用户处于一种特殊的脆弱状态。尽管这些互动积累了大量高度敏感的个人数据,但外界对于平台如何治理这些数据却知之甚少。以往的研究或聚焦于单个平台,或未能充分考察生成式 AI 带来的新问题,缺乏对不同司法管辖区内多个平台的系统性比较,也未曾将治理文档本身作为一种塑造关系的结构来研究。因此,学术界和公众尚不清楚平台如何在法律上定义亲密关系、分配责任以及将情感交流转化为可利用的资源。

本论文的核心研究问题是:AI 伴侣平台是如何通过其政策文档来治理用户亲密数据的?具体而言,平台如何规定其在数据收集、共享、存储、删除和所有权方面的隐私实践?平台如何披露其生成式 AI 的使用细节,特别是关于模型训练数据的做法和对 AI 生成内容所承担的责任?平台声称为保护用户(尤其是未成年人)安全提供了哪些具体措施?