会员通讯

机器学习反学习、氛围编程与伪生产力

AI 如何精准忘记学生敏感数据？

💡

本期前沿速递分享了两篇论文。

我们总在谈论如何让 AI 学习，但它能不能忘记呢？比如，一个教育 AI 学了些有偏见或者过时的数据，我们怎么能让它把这部分知识精准地删掉，而不是把整个模型推倒重来？第一篇论文讨论的「机器学习反学习」技术提供了一个答案。

第二篇论文也很有趣，现在都流行氛围编程，开发者和设计师可以直接用大白话告诉 AI 想要什么，AI 就能生成原型和代码。这听起来很酷，但它真的能提高生产力吗？还是说反而让我们陷入一种伪生产力的陷阱？这篇研究采访了很多从业者，他们的真实感受和遇到的问题，很值得我们反思「一切均可 Vibe」风潮背后的隐忧。

祝今日读写愉悦，洞见深省。

前沿速递

机器学习反学习：在教育领域构建负责任和自适应的人工智能

核心概念

机器学习反学习（Machine Unlearning）: 这种技术，旨在从一个已经训练好的机器学习模型中，选择性地、高效地移除特定训练数据点所产生的影响，而无需从头开始重新训练整个模型。其目标是让模型的状态回归到仿佛从未见过这些被移除数据时的状态。举例来说，假设你用一本包含错误信息的百科全书训练了一个 AI 助手。后来你发现了其中一个章节，比如关于恐龙的描述是完全错误的。传统的做法是扔掉整本百科全书，找一本全新的、正确的书，然后从零开始重新教一遍 AI。而机器学习反学习则相当于，你只需要找到那个错误的章节，然后用一种特殊的方法让 AI 精确地忘记从这一章学到的所有知识，同时保留它从书本其它正确部分学到的一切。这样既修正了错误，又节省了大量的时间和精力。

负责任人工智能（Responsible AI）: 这是一套原则和实践，旨在确保人工智能系统的设计、开发和部署是以安全、合乎道德和值得信赖的方式进行的。它不仅仅关注模型的准确性，更强调其在整个生命周期中对个人、社会和环境的广泛影响，核心原则通常包括隐私保护、公平性、透明度、问责制和安全性。

数据投毒攻击（Data Poisoning Attacks）: 这是一种针对机器学习模型的攻击方式，攻击者通过向模型的训练数据中故意注入少量恶意的、被操纵的数据，来破坏或控制模型的学习过程。最终目的是让训练完成后的模型在面对特定输入时产生攻击者想要的错误输出。例如，一个银行想训练一个 AI 模型来自动审批贷款申请，模型通过学习大量历史申请数据来判断申请人是否会违约。攻击者想要让一个信用记录很差的同伙也能通过审批。于是，攻击者设法在银行的训练数据中混入一些伪造的记录，这些记录将信用差的特征与成功还款的结果错误地关联起来。模型在学习了这些有毒的数据后，就可能形成一个错误的判断逻辑，认为某些信用差的特征反而是可靠的信号，从而在未来错误地批准那个同伙的贷款申请。

研究问题

人工智能和机器学习技术正日益融入教育领域，用于个性化学习、智能辅导和学习分析等。这些系统处理大量敏感的学生数据，如学业成绩和行为指标。然而，一旦模型训练完成，这些数据的影响便难以消除，即使数据已过时、不准确或需要根据隐私法规（如 GDPR 的被遗忘权）进行删除。现有系统普遍缺乏有效的机制来撤销特定数据对模型决策的影响，而不必完全重新训练模型，这带来了隐私泄露、算法偏见固化和模型适应性差等风险。尽管机器学习反学习（MU）技术在其它领域已展现出解决这些问题的潜力，但在教育领域的应用却存在明显的研究空白。

鉴于上述背景和研究空白，本论文旨在回答以下核心问题：MU 如何能够被应用于教育领域，以应对现有机器学习系统在隐私保护、公平性、安全性和适应性方面的挑战？具体而言，MU 如何作为一种技术机制，来落地负责任人工智能的原则，并增强教育 AI 系统在动态变化环境中的适应能力，从而构建更值得信赖的智能教育技术？

监管透明度陷阱、审计文化与后殖民语境中的 AI 伦理

新闻话语、平台治理第四权力与 AI 对话式访谈

可及性偏见、重思平台化与点赞按钮的终结

前沿速递

机器学习反学习：在教育领域构建负责任和自适应的人工智能

核心概念

研究问题

Read next