评论:ChatGPT威胁到语言多样性 在人工智能时代需要做更多的事情来保护我们的差异。Credit: Collin Bjork, Author provided
(神秘的地球uux.cn)据美国物理学家组织网(by Collin Bjork, The Conversation):围绕ChatGPT等人工智能(AI)技术的嗡嗡声显而易见。人们对这些工具的可能性既乐观又害怕。显然,这些技术将改变人们的写作方式。但是就人们写的东西而言,这些技术似乎是在拥抱现状。
事实上,这些工具目前的构建方式似乎在使写作同质化——让一切听起来都一样。而且写出来听起来一样的不仅仅是无聊;它还使不平等永久化。
当书写工具将一种书写方式置于另一种之上时,它们强化了现有的等级制度,不公平地将标准美式英语(SAE)和标准英语置于其他语言和书写方式之上。
ChatGPT是如何工作的?
像ChatGPT这样的技术被称为大型语言模型(LLM)。LLM通过使用机器学习来研究大量文本档案中的单词模式,从而对人类命令做出文本响应。
然而,最关键的是,ChatGPT不知道单词的意思。ChatGPT通过对堆积如山的定义进行排序来生成定义,然后将这些定义整理成适合查询上下文的单个响应。
换句话说,没有意义作为指导,ChatGPT依靠上下文线索、文体结构、写作形式、语言模式和词频来回应查询。
这个功能意味着,默认情况下,ChatGPT保持了写作和语言使用的主流模式,而忽略了不太常见的模式。
擦除多样性
占主导地位的写作模式不是偶然成为主导的。他们变得占主导地位是因为一个社会群体想要对另一个社会群体行使权力。
例如,英语并不只有一种。有许多英语。
例如,在许多美国课堂上优先使用标准美式英语的决定意味着,说黑人英语的人——一种有自己的语法、词汇和非凡的反抗历史的语言——会因为边说边写而受到惩罚和羞辱。
同样,在新西兰奥特罗亚州,女王英语成为主导,并不是因为它本质上比毛利语更好。相反,欧洲殖民者想要消灭毛利文化,用标准英语写作成为推进这一目标的重要工具。在20世纪,学生经常因为在学校说毛利语而遭到殴打。
违背默认
ChatGPT的支持者会很快注意到,ChatGPT可以阅读、分析和生成多种语言的内容,包括黑人英语和te reo毛利语。
但人们关心的不是ChatGPT能做什么。
而是它的默认设置是什么。它是关于ChatGPT是如何配置的,如何将某些书写形式视为正常的、典型的和预期的。它是关于ChatGPT如何要求一个特殊的请求来生成非规范的书写形式。
这种有问题的默认行为也出现在ChatGPT的姐妹程序Dall-E 2中。这个生成图像的人工智能被要求根据这个提示为这篇文章创建一个图像:“在笔记本电脑上打字的手的特写照片。”该程序创建了四个图像。所有人都有白色的男性手。
该程序需要一个更具体的提示来生成一个包括有色人种的图像,因为即使是人工智能可视化写作的方式也是由白人主导的。
最终,这种算法偏见继续让说英语的白人成为写作文化的标准,同时将其他人推向边缘。
怎么会变成这样?
毫不奇怪,ChatGPT的默认功能似乎优先考虑白人开发的英语写作形式。说英语的白人男性长期以来主导着许多写作密集型行业,包括新闻、法律、政治、医学、计算机科学和学术界。
这些说英语的白人总共写了数十亿字,比他们的有色人种同事多很多倍。这些作者写的大量文字意味着他们可能构成了ChatGPT学习模型的大部分,尽管ChatGPT的母公司OpenAI没有公开披露其来源材料。
因此,当用户要求ChatGPT生成任何这些学科的内容时,默认输出是以那些讲英语的白人的声音、风格和语言编写的。
挑战常规
有人会说,我们需要书面的默认和标准。他们认为,我们需要教人们用标准英语或SAE写作,这样人们就不会因为写作方式不同而错失工作和晋升机会。
但这种想法意味着屈服于工作场所的偏见,并通过我们的参与来强化不公正的制度。相反,其他学者说,我们需要挑战那些不公平的写作标准,并鼓励作家在其语言多样性中拥抱丰富的修辞可能性。
想要拥抱语言多样性的教育工作者可能会试图在他们的学校和大学中禁止生成文本的人工智能。
但值得记住的是,书写本身是一种技术,过去是,现在仍然是,用来加剧不平等。文学学者Alice Te Punga Somerville称之为“写作与历史和当前暴力的不可分割性”
然而,为了应对这种威胁,萨默维尔教授并不主张完全放弃写作。相反,她坚持用批判性和创造性的写作来反抗压迫。
在她的带领下,教育工作者可能会鼓励学生开发新的方法来部署这些工具,以构建一个更加公平的未来。这样做的意思是,正如弗肖恩·杨教授在《黑人英语》中所说,“好的作品看起来和听起来可能与一些人现在所期望的有所不同。另一个非常非常好的结果是,我们帮助减少了偏见。”