科学家利用人工智能来解读密码学上最大的谜题之一:600年之久的伏尼契手稿

伏尼契手稿(Voynich Manuscript)是一本不起眼的小书,但也是世界上最神秘的书之一,目前收藏在耶鲁大学的保管库里。这份珍贵的文件里有优美的书写字和

伏尼契手稿(Voynich Manuscript)是一本不起眼的小书,但也是世界上最神秘的书之一,目前收藏在耶鲁大学的保管库里。这份珍贵的文件里有优美的书写字和奇特的绘图,据信是600年前以一种未知或编码过的语言写成,至今无人能解。 Photograph by Cesar Manso, AFP, Getty


视频:观看影片神秘的古代圣经展览。 2013年12月27日,现存最古老的圣经之一,最近在史密森尼博物馆夫利尔艺廊(Smithsonian’s Freer Gallery of Art)精美的孔雀室里展出。这个贵重的手工艺品是夫利尔(Charles Freer)的私人搜藏品,里面有一段耶稣宣告了魔鬼对世界统治已终结的文字,在其他圣经相关手稿里都不曾见到。

(神秘的地球uux.cn报道)据美国国家地理(撰文:Elaina Zachos 编译:蔡雅铃):科学家利用人工智能来解读密码学上最大的谜题之一:600年之久的伏尼契手稿。

两位加拿大的解码人员可能破解了一份令解码专家困惑好几世纪的600年前的手稿,但更有可能的是:他们还是没解开。

一份发表在《计算语言学会会刊》(Transactions of the Association of Computational Linguistics)的研究里,亚伯达大学的计算科学家利用一种演算法试图解码伏尼契手稿的部分章节,这份手稿是中世纪一本用未解的密码编码、以未知的语言写成的书。

不过其他学者对研究结果还是心存怀疑,这份手稿仍然笼罩在神秘之中。

伏尼契手稿是什么?

伏尼契手稿很可能就是密码学者所说的用「密码」(也就是以字母来编码加密)写成的文件。这本手稿完成于15世纪的中欧,尺寸比今天的平装书稍大,里面包含了246张以羊皮纸或可书写的动物皮做成的脆弱书页。手稿里没有索引页,但可能有很久以前就遗失的折页。书的页码中间有缺漏,也有证据显示它以前可能被重新装订过,所以目前看到的页码可能和手稿出版时的页码不同。

手稿使用25到30个优美的环圈形字符写作,每一页由数个从左至右书写的短文段落所构成,并穿插着精细的插图。这些绘图有龙和城堡的涂鸦,还有植物、星球、赤裸的人体和天文符号等,全部用绿、棕、黄、蓝和红色墨水仔细绘成。手稿里有一个特别奇怪的段落,上面画有许多裸体女人浸泡在注满绿色液体又彼此相连的池子里。

这份手稿自1969年起就被收藏在耶鲁大学的拜内克古籍善本图书馆(Beinecke Rare Book & Manuscript Library),它的名称则来自于波兰裔书商伏尼契(Wilfrid Michael Voynich)。伏尼契在1912向义大利的耶稣会图书馆买下这本书,并试着引起人们的兴趣并解译它,可惜至今无人成功!

我们到底知不知道这本手稿里面写了些什么?

根据手稿内的插图,学者认为它可以分成六个部分:草本植物志、天文学、生物学、宇宙学、制药学和食谱。这份手稿可能是属于魔法或科学类的书。
历史纪录显示,它曾经被链金术士和皇帝拥有。 16世纪时,一位德国皇帝以为它是中世纪天主教修士培根(Roger Bacon)的作品,花了威尼斯币600元从一位英国占星家手中买下它,最后辗转落入一个波希米亚药师的手中。

这项新的研究作了什么?

在这项新发表的研究中,作者认为伏尼契手稿是「各式解密问题里最具挑战性的一种」,因为我们不知道转换的密码。不过更重要的或许是我们连它是用什么语言写的都不知道。

他们用自己设计的电脑程式来处理手稿的正文。科学家原本怀疑这手稿的写作使用了去母音重排序字,或是重组字,也就是将组成字词的字母按照字母顺序重新排列成新字(例如manuscript这个字按照字母顺序排列后变成acimnprstu)。所以他们以380种不同语言版本的联合国世界人权宣言,来训练这套演算法的解密能力。

研究人员以人工智能把现代用词与重组字配对,获得了97%的成功率后,就将手稿里前10页的文字输入电脑,这个演算法发现,编码过的字词里80%看起来是希伯来文。

现在,假定研究人员找到了手稿所用的语言了。接下来,他们必须找到加诸其上的密码。所以他们就将开头的句子交给母语是希伯来语的同事翻译,而当这位同事无法翻译出有条理的英文时,因为找不到其他学者帮忙,他们就改用Google翻译器。在研究人员更正几处拼字错误之后,手稿翻译出来的第一个句子是:「她向牧师、男主人和我还有人们推荐。」这是个奇怪的句子,不过确实具有一些意义。

科学家还翻译了一个有72个字的章节,就是草本植物篇章,他们用新密码解密出「农夫」、「光」、「空气」和「火」等字。

等等,他们用了Google翻译器?

是的,Google翻译器的做法是先分析数亿份人类翻译出来的文件,然后再根据这些文件的统计资料翻译出文字。虽然这个工具已经可以翻译整段文字,而非逐字翻译,但它的效果还是远不及人类翻译员。

现在我们回来讨论手稿。

这项研究有些什么问题?

做为创始研究,科学家对人工智能程式的训练方式是把各种现代语言(而不是15世纪的语言)翻译成英文。虽然伏尼契手稿可能是用希伯来语写的,但那可是中世纪的希伯来语,不是Google翻译器所用的现代希伯来语。

虽然这个人工演算法可把80%的内文与希伯来文配对,剩下的20%则和其他语言配对。根据这份研究,手稿可能还用了马来语(Malay)、阿拉伯语和安哈拉语(Amharic)等和希伯来语差异很大的语言。

公平地说,研究人员并未宣称解开了伏尼契手稿的所有秘密,他们只说自己找出了内文使用的语言和编码的方法。下一步他们要找一位精通希伯来文和重组字谜的学者来帮忙,也很兴奋地想把这个解密技术应用在其他古代手稿上。

然而过去就有解码员错误解读这本手稿,也有其他许多理论很快地被学者看破手脚。即便是以破解纳粹密码闻名的图灵(Alan Turing),同样没有成功解读伏尼契手稿。

我们仍然不确定手稿的内文是否用密码或建构的语言所写成的,此外它根本毫无意义的可能性还是存在。

关于手稿,还有其他理论吗?

除了加拿大团队,也有其他研究人员提出手稿是以希伯来文写成。许多其他语言也曾被考虑过,包括拉丁语和一种从汉藏语系衍生的语言。

有些人认为这本书里记录了培根早期的发现和发明,不过它也可能是基督教异端教派的混杂语祈祷书,或是神秘的哲学家为赚钱而卖出的一些无意义的胡言乱语的合集。

伏尼契手稿依然是密码学史上最大悬而未决的问题之一。每年都有许多译文被提出来,不过还是没有被认可的确定密码。




上一篇 下一篇 TAG: 伏尼契手稿 人工智能 密码学