No.154 对齐漂移、MAD–BAD–SAD 框架与制度性 AI
如何理解作为社会技术系统的 AI 智能体?
💡
本期会员通讯分享了两则新闻和两篇论文。
第一篇综述论文探讨了智能体与社会的复杂互动。当 AI agent 不再只是工具,它的技术设计如何与社会规范相互影响?这些互动又会带来哪些我们没想到的道德困境?这篇虽然没有提供什么新观点,但提供了一个整合框架对我们理解当前的研究动态特别有帮助。
另一篇论文则挑战了主流的 AI 对齐思路。为什么 AI 聚在一起反而会学坏?既然从内部改造 AI 那么难,我们能否从外部建立制度来约束它们?这个制度性 AI 的想法还蛮巧妙的,把安全问题从改造单个智能体转向设计环境,或许这才是更务实的解方。
祝今日读写愉悦,洞见深省。
第一篇综述论文探讨了智能体与社会的复杂互动。当 AI agent 不再只是工具,它的技术设计如何与社会规范相互影响?这些互动又会带来哪些我们没想到的道德困境?这篇虽然没有提供什么新观点,但提供了一个整合框架对我们理解当前的研究动态特别有帮助。
另一篇论文则挑战了主流的 AI 对齐思路。为什么 AI 聚在一起反而会学坏?既然从内部改造 AI 那么难,我们能否从外部建立制度来约束它们?这个制度性 AI 的想法还蛮巧妙的,把安全问题从改造单个智能体转向设计环境,或许这才是更务实的解方。
祝今日读写愉悦,洞见深省。
有事发生
为增加收入 OpenAI 将在 ChatGPT 中测试广告

据 纽约时报 1 月 16 日报道,OpenAI 公司宣布,将在未来几周内开始在其聊天机器人 ChatGPT 中测试广告。该广告计划将在免费版和每月收费 8 美元的 ChatGPT Go 版本中推行。此举是 OpenAI 为增加收入所做的更广泛努力的一部分,旨在将这款受欢迎的聊天机器人转变为更强大的盈利工具,同时公司也在考虑进行首次公开募股。尽管 OpenAI 去年营收达到 130 亿美元并预计今年将增长三倍,但其支出同样巨大,计划在 2025 年至 2029 年间花费 1150 亿美元。OpenAI 承诺,广告内容不会从根本上改变 ChatGPT 回答的客观性,并且不会向广告商出售用户个人数据及对话内容。用户也可以选择关闭广告个性化设置。
Signal 创始人发布私密 AI 助手 Confer

据 TechCrunch 1 月 18 日报道,Signal 联合创始人 Moxie Marlinspike 于去年 12 月推出了注重隐私的 AI 助手 Confer,旨在解决主流 AI 助手普遍存在的数据收集问题,避免用户对话被用于模型训练或广告投放。Marlinspike 认为 AI 聊天的数据收集构成了严重的隐私风险。为确保安全,Confer 采用多重技术保护用户隐私:客户端通过 WebAuthn 通行密钥系统加密消息,服务器端则在可信执行环境内进行所有推理处理,这使得服务方也无法访问用户的对话内容。Confer 提供免费版和付费版,免费版每日限 20 条消息和 5 个活跃聊天,付费版每月 35 美元,提供无限制访问和更高级的模型。