跨语言词序的优化

(神秘的地球报道)据EurekAlert!:对37种语言的一项研究发现了一种一致的趋势,即在构建句子的时候把在每一种语言的句法上相关的词之间的距离最小化。人们提出的语言通用特征之一是称为依存长度最小化的概念,这是让一个句子里的在句法上相关的词的距离——诸如在一个有主语和宾语的句子里的一个动词和一个名词之间的距离——最小化的一种趋势。

Richard Futrell及其同事测量了37种语言的句子的依存长度,计算了在句法上相关的词之间的距离,并且对一个句子中的所有依存长度求和。这组作者把测得的依存长度与多种模拟的随机化词序句子进行了比较,发现了所有接受测量的语言的说话方式的依存长度比这些随机的基准句子显著更短,特别是对于有12个词或者更多词的句子。各个语言之间的依存长度的变化可能是由于每种语言的结构,具有高度信息性形态的语言比其他语言表现出了更少的依存长度最小化。

这些结果提示了对于依存长度最小化是各个语言和语族的普遍现象的强的、大尺度的、跨语言的支持。这组作者说,依存长度最小化可能导致了有效的语言处理。





上一篇 下一篇 TAG: 语言