治理对齐、负责任人工智能与艺术社群
AI 生成内容会撕裂艺术社群吗?
第一篇论文是一篇饱满的综述,不用过多介绍,如果你关心负责任人工智能和 AI 治理,这篇属于必看类型。
第二篇论文比较有趣,它研究了 AI 绘画在线上艺术社群的真实处境。讨论在具有不同管理规则的线上艺术社群中,人工智能生成内容的帖子究竟有多普遍,其数量如何随时间演变?AIGC 是否为新创作者的参与提供了便利?社群成员又是如何看待和回应那些被怀疑是 AI 生成的帖子?
祝今日读写愉悦,洞见深省。
前沿速递
谁该负责?数据、模型还是法规——一项关于负责任生成式人工智能共创可持续未来的综合性调查
核心概念
治理对齐的评估准则(Governance-Aligned Evaluation Rubric):这是一种系统性的评估框架,旨在根据主流治理法规和风险类别的要求,来衡量 AI 安全基准的全面性。它不仅评估基准是否覆盖了偏见、毒性、安全、隐私、深度伪造等技术风险,还评估其指标的有效性、文档的完整性等等。举例来说,评估一所学校的消防演习,传统的基准可能只关心演习是否进行。而一个治理对齐的准则则会像一份详细的审计清单,不仅检查演习是否覆盖了火灾、地震等不同场景,还会检查演习过程是否有计时、有记录,以及是否符合国家安全规定。这个准则的核心目的,是确保 AI 安全评估不仅仅是技术上的自我检测,更能产出满足监管和审计要求的可靠证据。
研究问题
人工智能系统已深度融入医疗、金融等关键领域,确保其部署的道德性、透明度和问责制变得至关重要。负责任人工智能(RAI)旨在应对这些挑战,但现有研究存在明显不足。一方面,学术界的理论框架与产业界的具体实践常常脱节;另一方面,现有的 AI 安全框架仅能覆盖治理机构所识别风险的一小部分。特别是随着强大的生成式 AI 的兴起,其独特的风险使得现有指导方针显得零散和不足。当前针对生成式 AI 的 RAI 指导原则、流程和工具缺乏整合,也缺少一套统一的、与治理目标对齐的评估指标和测试平台,导致企业无法将监管要求有效转化为工程控制,也难以生成可用于审计和持续监控的可靠证据。
基于上述背景,本论文试图回答以下核心研究问题:在后 ChatGPT 时代,负责任生成式 AI 领域的主流议题、风险和控制措施是什么?现有的评估方法主要关注哪些方面,又存在哪些明显的空白?支持 RAI 有效性声明的论据主要基于哪些证据类型?最重要的是,如何将这些发现整合为一个统一的实践框架,从而将抽象的治理原则与具体的工程控制及评估活动联系起来,以实现对生成式 AI 系统全生命周期的可审计评估?