学术诚信、语言悬置与少数民族语言
学术论文里又藏着多少未经声明的 AI 内容,有哪些措辞会暴露它们?
💡
本期前沿速递分享了两篇论文。
第一篇论文讨论主流的 AI 平台是如何在无意中抹去语言的多样性?为什么致力于复兴母语的人们,反而对看似能提供帮助的 AI 技术抱持怀疑?
另一篇论文研究当作者们偷偷使用 AI 却不声明,学术出版的诚信体系会受到怎样的冲击?那些声望高、收费贵的期刊,在把关上真的做得更好吗?具体而言,可以通过哪些文本特征来识别这些未经声明的 AI 内容呢?
祝今日读写愉悦,洞见深省。
第一篇论文讨论主流的 AI 平台是如何在无意中抹去语言的多样性?为什么致力于复兴母语的人们,反而对看似能提供帮助的 AI 技术抱持怀疑?
另一篇论文研究当作者们偷偷使用 AI 却不声明,学术出版的诚信体系会受到怎样的冲击?那些声望高、收费贵的期刊,在把关上真的做得更好吗?具体而言,可以通过哪些文本特征来识别这些未经声明的 AI 内容呢?
祝今日读写愉悦,洞见深省。
前沿速递
技术语言悬置与少数民族语言的数字未来:瑞典的人工智能与梅安语
核心概念
技术语言悬置(Technolinguistic suspension):这指的是一种特定的语言生存状态,即一种语言虽然在法律政策、文化档案或象征层面得到了官方认可,但却被排除在人工智能翻译、自动语音识别等现代技术基础设施之外,处于一种不死不活的中间状态。
数字语言消亡(Digital language death):这指的是如果一种语言无法成功过渡到数字领域,即便它还有口头使用者或纸质档案,也会面临在数字时代灭绝的风险。就像如果一种语言被保存在图书馆的布满灰尘的书籍里,但在社交媒体、短信或电子邮件中完全没人使用,那么对于年轻一代和未来的数字社会来说,这种语言实际上就已经死了,因为它失去了在现代沟通渠道中的生命力。
统一多语言主义(Uniform multilingualism):这指的是主流数字平台(如谷歌翻译)在处理多语言时的一种底层逻辑,即表面上包容多种语言,实际上却强制所有语言适应以英语为中心或主流语言的算法结构,从而抹杀了少数民族语言的独特性。
研究问题
梅安语作为瑞典北部的少数民族语言,历史上曾遭受国家的同化政策打压,导致代际传承中断。尽管如今它已获得官方承认,但在人工智能飞速发展的当下,梅安语正面临新的数字鸿沟。以往的研究多关注 AI 的伦理问题,却鲜少探讨技术基础设施如何从制度层面影响少数民族语言的复兴,以及这些语言如何在缺乏数据和商业动力的情况下被主流技术系统性地遗忘。
基于此,本文主要探讨了以下两个研究问题:是什么因素影响了针对梅安语的语言技术开发和制度支持?技术进步和适应性策略又是如何塑造人们对这些现状的反应,进而影响梅安语在当代瑞典的生存活力?