会员通讯

情境化 AI 评估、四个无底洞错误与统计公平性的崩塌

AI 评估如何避免透明度幻觉？

Photo by NASA Hubble Space Telescope / Unsplash

💡

本期前沿速递分享了两篇论文。

第一篇聚焦于人工智能评估的透明度与情境化，介绍了审计卡这一结构化报告工具，旨在系统性地呈现审计师背景、评估范围、方法、资源、过程完整性及审查机制等关键背景信息，以应对当前评估报告信息缺失、解释困难的问题，并强调了 AI 评估的社会技术本质。

第二篇则深入剖析了当前 AI 伦理领域流行的「统计公平性」方法的根本缺陷，揭示了其存在的四个「无底洞错误」——混淆公平与平等、排斥性视角、忽视基数比例以及群体公平的谬误——论证了该方法为何从概念上就不可行，并呼吁超越这种基于统计指标的公平观。

祝今日读写愉悦，洞见深省。

前沿速递

审计卡：情境化人工智能评估

核心概念

审计卡（Audit Cards）：一种结构化的报告格式，旨在明确呈现人工智能审计的关键背景资讯，包括审计师身份、评估范围、方法、资源可及性、过程完整性和审查机制。

想象一下，你想买一个二手的玩具机器人。卖家告诉你这个机器人很棒，跑得快、会说话。但你心里会嘀咕：「真的吗？谁测试过？怎么测试的？有没有什么问题卖家没说？」这时候，如果卖家能拿出一张「玩具机器人检查报告」，上面清楚写着：是谁检查的（比如一个专业的玩具修理师）、检查了哪些功能（跑、说、电池续航）、用什么方法检查的（比如在特定跑道上计时、录下说话声音）、检查时发现了什么（比如说话有点口齿不清）、检查员有没有拿卖家的好处等等。有了这张报告，你就能更放心地判断这个机器人到底好不好，值不值得买。

「审计卡」就像是 AI 的这种「检查报告」。现在的 AI 系统越来越复杂，比如聊天机器人、自动驾驶系统等。我们需要知道它们是否安全、可靠、公平。很多人会对这些 AI 系统进行「审计」或「评估」，就像检查玩具机器人一样。但是，光看评估结果（比如「这个 AI 通过了安全测试」）还不够。我们需要知道更多背景信息才能判断这个结果的可信度。

研究问题

人工智能治理框架越来越依赖审计，然而其底层评估结果需要解释和情境化才能真正提供资讯。即使技术严谨的评估，如果报告具有选择性或模糊不清，也可能提供很少有用的见解。目前的文献主要关注技术最佳实践，但评估本质上是一个社会技术过程，关于报告程序和情境的指导很少。鉴于此，本文旨在解决的问题是：如何在人工智能审计报告中提供必要的背景资讯，以增强透明度、促进准确解释评估结果并建立信任？

算法伪装、无差别区隔与语言机器类比

监管透明度陷阱、审计文化与后殖民语境中的 AI 伦理

新闻话语、平台治理第四权力与 AI 对话式访谈

前沿速递

审计卡：情境化人工智能评估

核心概念

研究问题

Read next