为什么人工智能认为尼安德特人看起来仍像19世纪的怪物
这是一幅用DALL-E 3生成的AI生成图像,被纳入本研究。其提示描述了典型活动、环境、服饰和工具,但未要求科学准确性。图片来源:uux.cn缅因大学
(神秘的地球uux.cn)据今日科学新闻:四十多年来,科技悄然重塑了人类获取知识的方式。曾经需要书架、专家指南或长时间寻找的东西,现在都装进了口袋。手机、笔记本电脑、平板电脑和智能手表已经融合成一个庞大的图书馆,答案几乎瞬间出现。关于恐龙生活在哪里或脉搏跳动有多快的问题,可以在几秒钟内解决。随着生成式人工智能的兴起,这种速度进一步加快,承诺只需轻触屏幕即可获得清晰的体验。
然而,速度和自信并不等同于真相。随着这些系统变得更加流畅和视觉吸引力,一个核心问题在便利性之下依然存在。所传递的知识有多准确?它们来自哪里?为了探讨这种不确定性,研究人员转向了一个已经被科学辩论和历史修正包裹的主题:尼安德特人。
一个被不确定性塑造的物种
1864年首次描绘出的尼安德特人骨骼遗骸,从那时起,他们的形象就再也没有定论。几十年来,科学家们一直在争论尼安德特人的生活、穿着、狩猎方式,甚至他们如何在世界中移动。随着新发现的出现和旧有假设的挑战,解释也发生了变化。这段长期的分歧使尼安德特人成为探讨生成式人工智能如何处理复杂且不断演变的科学知识的理想案例。
由于没有单一、无可争议的尼安德特人生活图景,任何试图重建他们的系统都必须选择信任哪种过去版本。在这项研究中,研究人员马格纳尼和克林丹尼尔要求生成式人工智能系统做到这一点,不是通过评估其速度或创造力,而是通过审查其准确性和来源来实现这一点。
当过去凝结在时间中
研究过程中产生的图像令人震撼,但并非现代科学所期望的那种。尼安德特人以一个多世纪前的想象形式出现,却被过时的解读冻结。他们被描绘成原始的人类相关物种,拥有古老的特征,使他们更接近黑猩猩而非现代人类。他们的身体被描绘成过多的头发,姿态前倾,强化了早已被遗弃的野蛮与简朴刻板印象。
同样值得注意的是谁没有出现。这些图像大多排除了女性和儿童,将尼安德特人的生活描绘成狭隘、以男性为中心的存在。这种缺失悄然呼应了那些未能考虑社会复杂性和多样性的旧科学叙事,揭示了这些早期观点在可访问数据集中依然深藏不住。
这些视觉作品令人信服、细致且自信,但承载着当代学术数十年不断修订的诠释。
错过全貌的故事
ChatGPT产生的书面叙述也揭示了类似的问题。这些故事并未反映现代研究中认识到的多样性和文化复杂性,反而一贯低估了尼安德特人文化。他们的生活被简化、几乎带有漫画色彩的描述,仿佛复杂性从未进入讨论。
当研究人员将这些叙事与当前学术理解进行比较时,差距非常明显。大约一半的ChatGPT叙述与既有学术知识不符。在一个具体提示中,这种不匹配度上升到了80%以上。语言听起来权威,但内容往往源自科学后来重新评估或放弃的解释。
问题不在于犹豫或不确定。而是建立在不完整基础上的自信。
技术来得太早
在图像和文字中,又出现了另一个不一致之处。人工智能系统经常包含不属于尼安德特人时代的技术元素。在不该出现的地方出现了篮子编织、茅草屋顶、梯子,甚至玻璃和金属的元素。这些细节并非小小的装饰。它们重塑了人们对尼安德特人生活的想象,展现出超越当时时代所支持的技术复杂度。
这些错误并非仅仅源于创造力。它们反映了跨时代资料的融合,历史时期的界限模糊。人工智能系统拼接信息碎片,却未完全尊重其时间界限,创造出看似连贯但历史错置的过去。
追踪机器中的幽灵
为了理解这些不准确现象为何如此持续出现,马格纳尼和克林丹尼尔调查了人工智能系统的信息来源。通过将生成的图像和叙述与不同年代的科学文献交叉比对,他们能够识别出来源中的模式。
ChatGPT 产出的内容最符合 1960 年代的研究,而 DALL-E 3 则更贴近 1980 年代末和 1990 年代初的文献。这些时代并非系统有意选择的。相反,它们反映了用于训练的数据集中哪些信息最易获取和可访问。
研究结果揭示了一个低调但强大的局限性。生成式人工智能不仅仅是总结最优秀或最新的科学成果。它复制了它最容易获得的内容。
当可及性塑造想象力时
这一问题的根源不仅限于技术,还延伸到政策领域。20世纪20年代制定的版权法限制了学术研究的获取数十年。因此,大量科学文献一直被封存,直到2000年代初开放获取兴起。即使在今天,并非所有当代研究都能同等地供人工智能系统学习。
克林丹尼尔强调,实现更准确人工智能输出的一条道路是确保人类学数据集和学术文章对人工智能可访问。没有这种访问权限,人工智能系统只能依赖更早、更易获得的解释,无论这些解释多么过时。
知识的门槛、归档和共享方式直接影响机器如何重建过去。
在自信时代教导谨慎
马尼亚尼指出挑战的另一个重要层面:教育。生成式人工智能以惊人的自信表达,这种自信很容易被误认为是正确。教学生谨慎使用这些工具,并不是为了劝阻它们的使用,而是为了培养批判性参与。
Magnani认为,培养怀疑态度和技术素养将有助于建设一个理解AI生成知识力量与局限性的社会。用户不能仅凭表面接受输出,而是要学会询问信息来源及可能缺失的部分。
这项研究是Magnani和Clindaniel更广泛系列的一部分,旨在探讨人工智能如何与考古研究及对过去的解读交汇。每一项调查都为同一核心洞察增添了另一层:人工智能反映人类知识,同时也反映人类的盲点。
为何这项研究重要
这项研究很重要,因为生成式人工智能已不再是新鲜事物。它正成为通往信息的主要门户,塑造人们对历史、科学乃至人类本身的想象。当人工智能呈现过时或不完整的尼安德特人观念时,它所做的不仅仅是事实错误。它强化了长期被遗弃的假设,悄然重塑了公众的理解。
研究表明,人工智能的准确性不仅仅是技术上的挑战。这是一个文化和政策问题,涉及获取机会、教育和责任。随着人工智能不断定义知识的共享方式,确保其汲取最准确、最包容的来源,将决定它是成为更深入理解的工具,还是反映过去误解的镜子。
揭示了机器如何容易误记过去,这项研究清楚地提醒了我们。知识的未来不仅依赖更快的答案,更依赖更智慧的答案。
研究详情
Matthew Magnani 等,《人工智能与过去的解读》,考古实践进展(2025年)。DOI:10.1017/aap.2025.10110












