No.2 中国 AI 的语言偏科

这不仅是一个技术问题,更是一个关于文化认同和资源分配的社会议题。

No.2 中国 AI 的语言偏科
Photo by The Cleveland Museum of Art / Unsplash

在 AI 技术席卷全球的今天,中国已经凭借一系列高性能开源大语言模型(LLMs),如 Qwen2.5、Yi-1.5 和 DeepSeek-R1,成为全球 AI 竞赛中的一支劲旅。这些模型不仅在技术上令人惊叹,更因其多语言能力引发了广泛讨论。然而,这些中国开发的 AI 模型,真的能“说”中国的语言吗?它们是反映了中国丰富的语言多样性,还是仅仅追随了全球化的脚步?最近,康奈尔大学的研究者们发表了一篇题为《Do Chinese models speak Chinese languages?》的论文,深入探讨了这一问题。