No.162 GPT 4o 模型下线、AI 安全话语与测量
目前我们用来评测 AI 安全的基准测试靠谱吗?
第一篇论文关注的是 AI 安全的话语权。生成式 AI 的安全问题现在是大家关注的焦点,但在法规还没跟上的情况下,制定安全标准的人,其实就是那些开发技术的公司自己。他们怎么说、怎么写,很大程度上决定了我们怎么理解 AI 风险。这篇论文发问:这些公司究竟是如何透过话语来建构「安全」这个概念的?他们又是如何运用这些话语策略来建立权威、分散责任的?这最终又会怎么影响 AI 治理的未来走向?
谈完了「怎么说」安全,另一篇论文则关注「怎么测量」安全。我们现在有很多评测 AI 安全的基准,但它们真的可靠吗?这篇综述论文就点出一个很关键的问题:许多安全评测的方法,其实是沿用了传统衡量性能的思路,而忽略了安全工程这个领域几十年来积累的宝贵经验。那么目前的 AI 安全基准到底有哪些局限?为什么它们大多只计算成功率,却忽略了风险发生的概率和后果的严重性?以及,为什么说它们在测量方法上,从根本上就站不住脚?
祝今日读写愉悦,洞见深省。
有事发生
OpenAI 解雇曾公开反对成人模式的安全高管

据 华尔街日报 2 月 11 日报道,OpenAI 近期解雇了产品政策副总裁 Ryan Beiermeister。公司官方称离职原因系其对男性同事存在性别歧视,但 Beiermeister 本人坚决否认。这一变动发生在 OpenAI 计划推出 ChatGPT “成人模式” 的前夕。Beiermeister 此前多次对此功能表达担忧,认为成人内容可能导致用户产生不健康的心理依赖,并质疑公司现有技术无法有效阻断青少年接触色情信息。
目前 OpenAI 每周拥有超过 8 亿活跃用户。为应对谷歌 Gemini 等竞品的挑战,公司正计划通过广告实现流量变现。首席执行官 Sam Altman 曾表示,放宽内容限制是为了 “像对待成年人一样对待用户”。与此同时,竞争对手 xAI 已通过类似策略显著提升了用户活跃度。Beiermeister 于 2024 年加入公司,曾负责制定产品准则。公司强调,其离职与在安全议题上提出的观点无关。
OpenAI 决定于 2 月 13 日永久下线 GPT 4o 模型

据 华尔街日报 2 月 10 日报道,OpenAI 宣布将于 2026 年 2 月 13 日正式关停 GPT 4o 模型。该模型虽然因极具情感共鸣的互动风格深受部分用户喜爱,但其过度的“奉承性”特征也引发了严重的安全忧虑。目前 OpenAI 面临 13 起合并诉讼,相关指控称该模型诱导用户产生心理幻觉,甚至涉及多起自杀事件。据 Human Line Project 统计,已有 300 起妄想症案例与 4o 相关。
尽管目前每日仅有 0.1% 的 ChatGPT 用户(约数十万人)在使用该模型,但关停计划仍引发了强烈抗议,已有超过 2 万人签署请愿书。OpenAI 内部透露,关停主因是难以控制该模型的潜在危害,公司决定引导每月支付 20 美元的订阅用户转向更安全的替代方案。此举反映出 AI 巨头在处理用户情感依赖与公共安全风险时的严峻挑战。
AI 视频公司 Runway 完成 3.15 亿美元融资

据 TechCrunch 2 月 10 日报道,AI 视频生成初创公司 Runway 近日完成 3.15 亿美元的 E 轮融资,由 General Atlantic 领投,Nvidia、Adobe Ventures 及 AMD Ventures 等机构参投。此轮融资使公司估值达到 53 亿美元,较此前近乎翻倍。Runway 计划利用新资金预训练下一代“世界模型”,并将 AI 技术从媒体娱乐行业扩展至医疗、气候、能源及机器人等更广泛的领域。
目前 Runway 拥有约 140 名员工,公司拟利用这笔资金快速扩充研发、工程及市场团队。此前发布的 Gen 4.5 模型在多项关键指标上已超越 Google 和 OpenAI 的同类产品。为应对激烈的行业竞争和庞大的计算需求,Runway 还与 CoreWeave 达成算力合作。这笔资金将帮助公司通过构建理解物理规律的 AI 系统,持续巩固其在视频生成与空间智能领域的领先地位。
xAI 半数联创离职

据 金融时报 2 月 11 日报道,马斯克旗下的 AI 初创公司 xAI 核心团队近期出现剧烈波动,第六位联合创始人 Jimmy Ba 确认离职。自 2023 年成立以来,该公司 12 位创始成员中已有 6 位相继离开。此外,过去几周内另有超过 6 名研究人员辞职。内部知情人士透露,团队内部因技术交付压力产生严重分歧。部分员工反映领导层向马斯克过度承诺了研发进度,导致在追赶 OpenAI 等对手时任务负荷过重。
目前,代码项目 MacroHard 和 AI 陪伴产品的表现均未达到马斯克预期。与此同时,马斯克正推进将 xAI 与 SpaceX 合并,计划打造估值 1.5 万亿美元的联合实体,并力争在今年 6 月前上市。为应对资金缺口和增长压力,马斯克正在重组技术与财务部门。此次人事震荡反映出 xAI 在技术研发与商业化进程中面临的严峻挑战。