会员通讯

No.154 对齐漂移、MAD–BAD–SAD 框架与制度性 AI

如何理解作为社会技术系统的 AI 智能体？

💡

本期会员通讯分享了两则新闻和两篇论文。

第一篇综述论文探讨了智能体与社会的复杂互动。当 AI agent 不再只是工具，它的技术设计如何与社会规范相互影响？这些互动又会带来哪些我们没想到的道德困境？这篇虽然没有提供什么新观点，但提供了一个整合框架对我们理解当前的研究动态特别有帮助。

另一篇论文则挑战了主流的 AI 对齐思路。为什么 AI 聚在一起反而会学坏？既然从内部改造 AI 那么难，我们能否从外部建立制度来约束它们？这个制度性 AI 的想法还蛮巧妙的，把安全问题从改造单个智能体转向设计环境，或许这才是更务实的解方。

祝今日读写愉悦，洞见深省。

有事发生

为增加收入 OpenAI 将在 ChatGPT 中测试广告

据纽约时报 1 月 16 日报道，OpenAI 公司宣布，将在未来几周内开始在其聊天机器人 ChatGPT 中测试广告。该广告计划将在免费版和每月收费 8 美元的 ChatGPT Go 版本中推行。此举是 OpenAI 为增加收入所做的更广泛努力的一部分，旨在将这款受欢迎的聊天机器人转变为更强大的盈利工具，同时公司也在考虑进行首次公开募股。尽管 OpenAI 去年营收达到 130 亿美元并预计今年将增长三倍，但其支出同样巨大，计划在 2025 年至 2029 年间花费 1150 亿美元。OpenAI 承诺，广告内容不会从根本上改变 ChatGPT 回答的客观性，并且不会向广告商出售用户个人数据及对话内容。用户也可以选择关闭广告个性化设置。

Signal 创始人发布私密 AI 助手 Confer

据 TechCrunch 1 月 18 日报道，Signal 联合创始人 Moxie Marlinspike 于去年 12 月推出了注重隐私的 AI 助手 Confer，旨在解决主流 AI 助手普遍存在的数据收集问题，避免用户对话被用于模型训练或广告投放。Marlinspike 认为 AI 聊天的数据收集构成了严重的隐私风险。为确保安全，Confer 采用多重技术保护用户隐私：客户端通过 WebAuthn 通行密钥系统加密消息，服务器端则在可信执行环境内进行所有推理处理，这使得服务方也无法访问用户的对话内容。Confer 提供免费版和付费版，免费版每日限 20 条消息和 5 个活跃聊天，付费版每月 35 美元，提供无限制访问和更高级的模型。

No.168 推理能耗、绿色 AI 权与 AIGC 平台治理

No.167 依恋悖论、人工亲密关系与 Token 税

No.166 伊朗袭击美资数据中心、竞技场博弈与自动化研发

有事发生

为增加收入 OpenAI 将在 ChatGPT 中测试广告

Signal 创始人发布私密 AI 助手 Confer

Read next