No.192 超级数据化、数据节约与超级智能暂停开发

当各国都害怕落后时,暂停超级智能开发真的可能吗?

No.192 超级数据化、数据节约与超级智能暂停开发
Photo by Kaspars Eglitis / Unsplash
💡
本期会员通讯分享四则新闻和两篇论文。

第一篇论文追问当我们说前沿 AI 需要更多数据时,这些数据从哪里来,又由谁承担它们的代价?作者把这个过程称为「超级数据化」,并用 Hugging Face Hub 上超过 55 万个数据集的元数据、肯尼亚 134 名数据工人的问卷,以及全球数据中心投资与分布资料,拼出数据生产的完整链条。数据溯源能否让来源、处理和责任变得可见?数据节约能否让模型开发从「越多越好」转向更克制、更高效的设计?

第二篇论文讨论超级智能暂停开发。很多人会直觉认为,只要超级智能牵涉国家竞争,暂停就只能停留在道德呼吁或理想主义愿望里。因此,这篇的作者想回答在国家以自利为出发点的前提下,暂停开发人工超级智能是否一定是不理性的?在什么条件下,国家会把暂停开发视为符合自身利益的最佳反应?能力差距、赢家优势、技术不确定性和对失控灾难成本的感知,如何共同决定国家是选择竞赛还是暂停?

祝今日读写愉悦,洞见深省。

有事发生

Anduril 融资 50 亿美元估值达 610 亿

a4a7015e40846082963a7b9bf0999b0d_MD5|700

纽约时报 5 月 13 日报道,美国防务科技公司 Anduril 宣布完成 50 亿美元新一轮融资,使公司估值升至 610 亿美元,比 2024 年 6 月上一轮 305 亿美元估值翻倍。本轮融资由长期投资方 Thrive Capital 和 Andreessen Horowitz 领投,累计融资总额达到 68.2 亿美元,共进行八轮融资。报道指出,此次融资发生在特朗普政府将美军现代化列为优先事项的背景下,市场亦有 Anduril 未来一年内可能寻求上市的讨论。

Anduril 成立于 2017 年,总部位于洛杉矶以南,创始团队包括技术企业家 Palmer Luckey,公司产品涵盖自主潜艇和战机、武装无人机以及增强现实军用头盔等。早期 Anduril 为美国政府开发边境监控软件,俄罗斯 2022 年入侵乌克兰后开始在战场测试 AI 支持的无人机,目前已形成多型无人机产品线。2025 年 3 月,Anduril 与美军签署一份为期 10 年、价值 200 亿美元的软件和 AI 武器合同,同月宣布参与价值 1850 亿美元的美国 Golden Dome 太空拦截导弹系统项目联盟。首席执行官 Brian Schimpf 在周三发布的信中称,公司 2025 年营收增至 22 亿美元,几乎实现翻倍,并几乎将员工人数翻倍,交付首个澳大利亚皇家海军国际项目,并在空军无人作战飞机项目中完成自主飞行演示。公司还在俄亥俄州启用一座投资 10 亿美元的新工厂,用于加快武器系统生产。


OpenAI 等科技巨头加码华盛顿 AI 游说

76cc67bd49ce28e5c50d5f444801879b_MD5|700

纽约时报 5 月 13 日报道,OpenAI 将于周三在华盛顿白宫附近启用其首个游说办公室 Workshop,集实验室与展示空间于一体,用于与立法者更紧密互动。该公司在今年第一季度联邦游说支出达 100 万美元,是去年同期的两倍,重点推动数据中心建设及在训练中自由使用受版权保护内容。其竞争对手 Anthropic 今年 4 月也在华盛顿开设首个办公室,去年游说支出增至 300 万美元,是此前的十倍,并聘请 6 家游说公司。

公共公民组织的分析显示,华盛顿 1.3 万名联邦游说者中约 1/4 参与 AI 议题,较 2023 年的 11% 大幅上升。Meta、Nvidia 和 Alphabet 去年联邦游说支出合计 4780 万美元,比 2024 年增长 22%,其中 Meta 和 Alphabet 为最大企业金主。在美国各州密集推进 AI 立法、联邦政府考虑对新模型实施监管之际,OpenAI、Meta、Google 倾向弱监管以维护与中国的竞争优势,Anthropic 等则支持更严格法规,强调安全风险。与此同时,家长团体和倡导组织加大对儿童保护、电力消耗和经济冲击等问题的施压,使围绕 AI 未来发展和监管框架的政治博弈在选前升温。


Greg Brockman 接管 OpenAI 产品战略

b3c333e8eb8a2e24fe234c612774f7fa_MD5|700

TechCrunch 5 月 16 日报道,OpenAI 联合创始人兼总裁 Greg Brockman 正式接管公司产品战略。据报道,此前在负责 AGI 部署的 CEO Fidji Simo 因医疗原因休假期间,Brockman 已临时负责产品线。根据内部备忘录,OpenAI 计划把 ChatGPT 与编程产品 Codex 合并为统一体验,并将 ChatGPT、Codex 及 API 整合到一个平台,由一支核心产品团队负责。

Brockman 表示,公司将整合产品力量,聚焦智能体未来,在消费级和企业级市场同时发力。OpenAI 对 TechCrunch 表示,尽管 Simo 仍在病假中,但她参与了与 Brockman 的相关决策。此前,CEO Sam Altman 在去年年底发出红色警报,要求公司重心回归核心 ChatGPT 体验,此后 OpenAI 已叫停包括视频生成器 Sora 和 OpenAI for Science 在内的多项支线项目,凸显公司整体战略转向产品主线和平台化整合。


预印本平台 ArXiv 针对 AI 乱用现象推出严规

c06b73bb516878f9b8531f26c3812911_MD5|700

TechCrunch 5 月 16 日报道,开放预印本平台 arXiv 针对科研论文中大模型糊弄写作出台更严规定。负责计算机科学版块的主席 Thomas Dietterich 日前表示,如投稿中出现作者未核查大模型输出的确凿证据,例如捏造引用文献、与大模型的对话残留等,将认定论文内容整体不可信。违规作者将被惩罚:先遭遇为期 1 年的投稿禁令,此后再投稿必须先通过权威同行评审期刊或会议接收,才能上传至 arXiv。

新规并未完全禁止使用大语言模型,而是强调作者必须对论文内容承担完全责任,无论文本由何种方式生成,如直接照搬不当措辞、抄袭内容、偏见表述、错误结论或误导性引用,都由作者负责。该措施建立在此前对首发作者引入背书制度、以及 arXiv 从康奈尔大学剥离成独立非营利机构以筹资治理 AI 低质论文的背景下出台。新规还规定,处罚需由版块版主提出并经版块主席确认,作者可提出申诉。此举正回应近期研究发现,特别是在生物医学领域,由大模型导致的虚假引用明显增加的趋势。