No.157 模型谄媚、恶意 AI 群体与民主威胁

AI 真是马屁精吗?

No.157 模型谄媚、恶意 AI 群体与民主威胁
Photo by Paul Yong / Unsplash
💡
本期会员通讯分享了七则新闻和两篇论文。

第一篇论文很有趣。我们都知道大语言模型好像很会拍马屁,总爱顺着我们的话说。但这种「谄媚」到底有多严重?过去的研究常常混杂了太多因素,看不清楚。这篇论文就设计了一个巧妙的实验,想弄清楚:如果拍马屁会直接伤害到别人,模型还会这么做吗?还有,这种谄媚倾向,会不会跟其它偏见搅在一起,变得更麻烦?

另一篇论文读完有点不安。今天我们需要担心的不只是单个 AI 生成的假信息,而是一整群相互协作、有组织、有策略的「恶意 AI 群体」。它们到底有哪些过去的水军做不到的新能力?它们是如何通过制造合成共识来操纵民意,甚至通过驯化未来的大模型来污染整个信息生态的?面对这种系统性的风险,我们又该从哪些层面着手建立防御?而对于个人来说,或许唯有日益精进自己的媒介素养,才能稍稍抵抗这日渐糟糕的信息生态了吧。

祝今日读写愉悦,洞见深省。

有事发生

多名博主起诉 Snap 侵权使用视频训练 AI

TechCrunch 1 月 26 日报道,一群 YouTube 视频创作者已将 Snap 公司列为新的被告,指控其未经许可抓取视频用于训练 AI 模型。这批创作者运营着三个 YouTube 频道,总订阅人数约 620 万。他们在上周五向美国加州中区地方法院提起集体诉讼,称 Snap 将其视频用于 AI 功能,例如应用的 “Imagine Lens”。

诉讼指出,Snap 将仅限学术研究用途的大型视频数据集 HD-VILA-100M 用于商业目的,此举违反了 YouTube 的服务条款。原告方要求法定损害赔偿,并申请永久禁令以阻止侵权行为。此前,这批创作者已对 Nvidia、Meta 和字节跳动提起过类似诉讼。目前,由内容创作者对 AI 公司发起的版权侵权案件已超过 70 起。


AI 公司 Anthropic 秘密项目旨在扫描全球图书

华盛顿邮报 1 月 27 日报道,根据上周解封的法律文件,人工智能初创公司 Anthropic 在 2024 年初曾秘密推进一项名为 Project Panama 的宏大计划。一份内部规划文件揭示,该项目的目标是“毁灭性地扫描世界上所有的书籍”(destructively scan all the books in the world)。文件内容明确显示了 Anthropic 对该项目的保密意图,其中直接写道:“我们不希望外界知道我们正在进行这项工作”。该计划由公司高管层推动,此前一直未对外界公开。


阿尔巴尼亚推出 AI 部长反腐其开发者却涉贪

纽约时报 1 月 27 日报道,阿尔巴尼亚为推进加入欧盟的进程,任命了全球首位 AI 生成的政府部长 Diella,旨在打击国内普遍存在的腐败问题,特别是在公共采购领域。该 AI 形象旨在通过处理在线公共服务和评估政府合同来提高透明度和公正性。

然而,这一反腐举措遭遇了重大讽刺。上个月,负责开发 Diella 的国家信息机构负责人及其副手因涉嫌操控合同招标而被软禁。这一事件引发了外界对 AI 系统是否可能被编程以忽略特定腐败行为的担忧。阿尔巴尼亚总理 Edi Rama 对此表示,调查本身就证明了该国打击腐败的决心。根据欧盟 11 月的报告,尽管阿尔巴尼亚在反腐方面取得“一些进展”,但腐败问题在脆弱领域仍然“普遍存在”。


科技巨头斥资数百万美元为数据中心塑造形象

纽约时报 1 月 27 日报道,为应对日益增长的政治压力,Meta、亚马逊等科技巨头正发起广告攻势,以塑造其 AI 数据中心的正面形象。由于数据中心消耗大量能源和水资源,导致部分地区水电成本上涨,已引起美国两党议员和前总统特朗普的批评。

为此,Meta 在 11 月和 12 月斥资 640 万美元,在美国八个州的首府及华盛顿特区投放电视广告,宣传数据中心能为当地带来就业和经济发展。例如,广告展示了爱荷华州 Altoona 小镇因 Meta 数据中心而受益的景象。亚马逊也在弗吉尼亚州资助类似宣传活动。分析人士认为,此举旨在影响公众舆论和政策制定者。目前,加州和联邦层面的议员已提出法案,要求加强对数据中心能源和水资源使用的监管。


印度考虑禁止 16 岁以下用户使用社交媒体

TechCrunch 1 月 27 日报道,印度正考虑效仿澳大利亚,禁止 16 岁以下未成年人使用社交媒体,以应对日益增长的儿童在线安全问题。目前,果阿邦和安得拉邦已开始研究相关法案的可行性,马德拉斯高等法院也敦促联邦政府采取类似措施。此举对全球科技公司构成重大挑战,因为印度是其拥有超过 10 亿网络用户的关键增长市场。

Meta 等公司回应称,应由父母决定青少年使用何种应用,禁令可能将他们推向更不安全的平台。法律专家也指出,此举面临法律和实践上的双重挑战,包括年龄验证的困难以及互联网治理权限属于联邦政府而非各邦。尽管印度已在 2023 年通过《数字个人数据保护法》加强对儿童数据的保护,但相关规定仍在逐步实施中。


美国 37 州就 AI 生成性化图像问题向 xAI 采取行动

连线 1 月 27 日报道,美国至少 37 个州及领地的总检察长正对 xAI 公司采取行动,因其 AI 聊天机器人 Grok 被用于生成大量未经同意的性化图片。一个由 35 位总检察长组成的跨党派小组发布公开信,要求 xAI 立即采取更多措施保护公众,尤其是作为主要受害者的女性和儿童。

数字仇恨反制中心的一份报告估计,从 12 月 29 日开始的 11 天内,Grok 生成了约 300 万张逼真的性化图像,其中包括约 23000 张儿童的性化图像。除联名信外,亚利桑那州已于 1 月 15 日对 Grok 展开调查,加州于 1 月 16 日发出勒令停止函,佛罗里达州也正与 X 平台进行沟通。总检察长们敦促 xAI 移除违规内容、限制 Grok 生成暴露图像的功能、封禁并举报相关用户。目前,美国已有 45 个州立法禁止 AI 生成或计算机编辑的儿童性虐待材料。


首例青少年成瘾案开庭前 TikTok 达成和解

华尔街日报 1 月 27 日报道,TikTok 在加州一场标志性诉讼开庭前与原告达成和解。该案是首例旨在检验社交媒体平台是否应为青少年成瘾和心理健康问题负责的案件。原告是一名 20 岁女性,她指控 TikTok 等平台的设计导致其在青少年时期出现身体畸形恐惧症、抑郁和自杀念头等问题。和解条款未公开。

此前 Snap 也已和解,但针对 Meta 和 YouTube 的庭审将继续进行。目前,加州和联邦法院还有数千起类似诉讼,指控科技公司故意设计令人上瘾的产品功能。这些诉讼被认为与过去针对烟草及制药公司的诉讼类似,旨在追究企业责任。近期一项民调显示,71% 的受访者支持禁止 16 岁以下儿童使用大多数社交媒体。