原住民知识体系、数据主权与人工智能
AI 会成为原住民知识的新殖民吗?
这篇论文系统回顾了原住民与人工智能交叉领域的研究。全球原住民人口超过 4.76 亿,拥有丰富的知识体系、语言传统和土地关系。AI 有可能帮助记录低资源语言、保护生态知识、改善偏远地区医疗和教育资源,也可能因为数据掠夺、文化不敏感和算法偏见,成为延续殖民关系的新工具。作者想回答的不是 AI 对原住民究竟好还是坏,而是 2012 年到 2023 年间的学术文献如何描述这些机会、风险和空白。
这篇论文适合放慢读。它提醒我们,所谓“让 AI 服务更多人”,不能只意味着把同一套技术扩展到新的群体。对于原住民社区而言,问题还包括谁拥有数据、谁控制知识流通、谁有权决定技术以什么方式进入土地、语言和社群生活。
祝今日读写愉悦,洞见深省。
前沿速递
原住民与人工智能:系统性回顾与未来方向
核心概念
原住民知识体系(Indigenous Knowledge Systems, IKS):这并非指单一的「传统知识」,而是由特定原住民族群在与其环境和宇宙的长期互动中,通过代际传承积累下来的一整套独特的、整体性的世界观和实践体系。它深深植根于口述传统、仪式、艺术、语言以及与土地和所有生物的紧密关系中,并强调知识的关系性、情境性和目的性,这与通常追求普适、客观和抽象的西方科学知识体系(WSK)形成对比。举个例子,想象一个世代生活在亚马逊雨林中的部落,他们的 IKS 就像一部活的、口口相传的「雨林生活百科全书」。这本书不会像植物学教科书那样仅仅分类和描述植物,而是会通过神话故事告诉你,哪种植物的树皮可以在月圆之夜缓解发烧,哪种藤蔓的纤维最适合编织渔网,以及必须在举行何种仪式后才能砍伐某棵大树,以示对森林精神的尊重。这种知识不仅是「信息」,更是一种生活方式和伦理准则,关乎整个社群的生存与和谐。
原住民数据主权(Indigenous Data Sovereignty):这是指原住民作为独特的民族,对其数据拥有内在的和不可剥夺的权利。这些「数据」不仅包括人口统计或健康记录,更涵盖了他们的语言、文化遗产、口述历史、生物基因信息以及与传统领地相关的各类知识。主权的核心在于原住民社区有权自主决定这些数据的收集、所有、访问、使用、保护和受益方式,确保数据治理符合其自身的文化价值观和集体利益。这套原则直接挑战了西方科研领域中「数据开放共享」的主流范式。举个例子,一个外部研究团队想利用 AI 分析一个原住民社区的传统歌曲,以研究其语言模式。如果遵循原住民数据主权原则,团队不能直接拿走录音就走。他们必须首先与社区长老会协商,获得明确的、知情的同意。社区有权决定:这些歌曲能否被数字化?AI 模型训练好后归谁所有?研究成果发表前是否需要社区审核?如果这项研究产生了商业价值(比如开发了一个翻译 App),社区应如何分享收益?从始至终,社区都是数据和知识的「主人」,而不是被动的「研究对象」。
协商空间(Negotiated Space):这是一个理论概念,指的是在原住民知识体系(IKS)和西方科学知识体系(WSK)这两种不同认知系统之间,通过对话、互动和相互尊重而创造出的一个合作与创新的场域。它并非要将 IKS「验证」或「整合」进 WSK 的框架,也不是要简单地将两者对立起来,而是承认各自的有效性和局限性,并在一个平等对话的平台上寻求知识的转化、适应与共同创造。举个例子,一个由生态学家(代表 WSK)和原住民长者(代表 IKS)组成的团队想要恢复一片退化的森林。生态学家带来了物种密度、土壤成分的量化数据和模型。长者则分享了关于这片土地的祖传故事,指出哪些区域是「圣地」不能打扰,哪些植物之间有「亲缘关系」需要种在一起,以及何时播种需要观察月相和鸟鸣。他们的「协商空间」就是每周的篝火会议。在这里,科学模型会根据长者的生态智慧进行调整,而长者的恢复计划也可能借鉴科学的育苗技术来提高存活率。最终,他们共同制定了一个既科学有效又充满文化敬意的恢复方案,这是任何一方都无法单独完成的。
研究问题
人工智能技术在深刻变革社会的同时,其对特定社会群体(尤其是历史上曾受压迫的群体)可能带来的负面影响也日益受到关注。对于全球拥有超过 4.76 亿人口的原住民而言,AI 既可能成为推广其独特知识体系(IKS)的工具,也可能因数据掠夺、文化侵蚀等问题成为「新的殖民者」,加剧现有的不平等。尽管关于 AI 和 IKS 的文献各自都很丰富,但以往的研究多集中于特定领域(如医疗或法律),缺乏一个系统性的视角来审视这两个动态领域的交叉互动情况,未能全面揭示其主要议题、机遇与挑战。
因此,本论文旨在系统性地回答以下核心问题:在 2012 年至 2023 年期间,关于原住民与人工智能的学术文献呈现出哪些主要的交叉主题?AI 在哪些方面被应用于支持原住民社区及其知识体系,又带来了哪些具体的风险与伦理关切?原住民知识体系本身如何能够反向影响和丰富 AI 的设计与发展?当前的研究版图中存在哪些明显的空白,未来的研究方向应该是什么?