会员通讯

治理对齐、负责任人工智能与艺术社群

AI 生成内容会撕裂艺术社群吗？

💡

本期前沿速递分享了两篇论文。

第一篇论文是一篇饱满的综述，不用过多介绍，如果你关心负责任人工智能和 AI 治理，这篇属于必看类型。

第二篇论文比较有趣，它研究了 AI 绘画在线上艺术社群的真实处境。讨论在具有不同管理规则的线上艺术社群中，人工智能生成内容的帖子究竟有多普遍，其数量如何随时间演变？AIGC 是否为新创作者的参与提供了便利？社群成员又是如何看待和回应那些被怀疑是 AI 生成的帖子？

祝今日读写愉悦，洞见深省。

前沿速递

谁该负责？数据、模型还是法规——一项关于负责任生成式人工智能共创可持续未来的综合性调查

核心概念

治理对齐的评估准则（Governance-Aligned Evaluation Rubric）：这是一种系统性的评估框架，旨在根据主流治理法规和风险类别的要求，来衡量 AI 安全基准的全面性。它不仅评估基准是否覆盖了偏见、毒性、安全、隐私、深度伪造等技术风险，还评估其指标的有效性、文档的完整性等等。举例来说，评估一所学校的消防演习，传统的基准可能只关心演习是否进行。而一个治理对齐的准则则会像一份详细的审计清单，不仅检查演习是否覆盖了火灾、地震等不同场景，还会检查演习过程是否有计时、有记录，以及是否符合国家安全规定。这个准则的核心目的，是确保 AI 安全评估不仅仅是技术上的自我检测，更能产出满足监管和审计要求的可靠证据。

研究问题

人工智能系统已深度融入医疗、金融等关键领域，确保其部署的道德性、透明度和问责制变得至关重要。负责任人工智能（RAI）旨在应对这些挑战，但现有研究存在明显不足。一方面，学术界的理论框架与产业界的具体实践常常脱节；另一方面，现有的 AI 安全框架仅能覆盖治理机构所识别风险的一小部分。特别是随着强大的生成式 AI 的兴起，其独特的风险使得现有指导方针显得零散和不足。当前针对生成式 AI 的 RAI 指导原则、流程和工具缺乏整合，也缺少一套统一的、与治理目标对齐的评估指标和测试平台，导致企业无法将监管要求有效转化为工程控制，也难以生成可用于审计和持续监控的可靠证据。

基于上述背景，本论文试图回答以下核心研究问题：在后 ChatGPT 时代，负责任生成式 AI 领域的主流议题、风险和控制措施是什么？现有的评估方法主要关注哪些方面，又存在哪些明显的空白？支持 RAI 有效性声明的论据主要基于哪些证据类型？最重要的是，如何将这些发现整合为一个统一的实践框架，从而将抽象的治理原则与具体的工程控制及评估活动联系起来，以实现对生成式 AI 系统全生命周期的可审计评估？

监管透明度陷阱、审计文化与后殖民语境中的 AI 伦理

新闻话语、平台治理第四权力与 AI 对话式访谈

可及性偏见、重思平台化与点赞按钮的终结

前沿速递

谁该负责？数据、模型还是法规——一项关于负责任生成式人工智能共创可持续未来的综合性调查

核心概念

研究问题

Read next