262 比谷歌酷多了-《星球博物馆》


    第(2/3)页

    “superman一个简单的词,就可以用来指代尼采原著中,那种复杂的描述,这种创造性本身,可以看做是对信息的提炼和加工。在汉语中,这样的现象更加多见,汉语中的成语,可以说是创造性词汇中,最有代表的一个系列,简单的四个字,往往代表着很复杂的一大段概念的集合。

    “但是机器语言……不,我应该换一种说法,程序语言。如果我用这种对语言的复杂度标准,应用在大多数程序语言上的话,那这些程序语言的得分,将会是一个无限接近于0的值。”

    “之前我已经说过了,程序是一种最精确的语言——你可以想象一个,一个俄罗斯方块的游戏语言,整个程序就好像是一个单词,这个单词肯定是有意义的,假如我们把组合成这段程序的01展示给外星人看,把程序附带的运行环境也给他们看,如果程序能被运行——那外星人肯定就能看到一个确切的含义。”

    “在这个具体的含义中,是一个不断出现不同形状的几何图形出现,又消灭的意向——但组合成这个程序的那些单独程序语句本身是没有意义的,因为就像我们在讨论刻舟求剑时,不会去讨论船的速度,剑的重量这些因素一样……”

    老实说,听到这儿,陈舍已经有点理解困难了,乔伊也看出了这一点,他适当放慢了语速,但陈舍似乎依然难以跟上他的进度。

    于是乔伊只能简单化的给出结论:“以前,地球上是不存在符合语言学定义上的复杂语言的。但是现在……虽然不知道它是如何出现的,但我们认为,我们找到了……你知道这意味着什么吗?”

    陈舍摇头。

    “意味着也许就在这颗星球上,某个大公司的机房里,就存在着一些文明的构造——我说的未必是AI,但它们肯定是掌握语言规则的某种程序,或者某种……东西。”

    “它们的语言之复杂……我学汉语的时候,知道汉语里最难以被理解的,就是四个字四个字的成语,每一个成语都可以牵扯十几个附带词汇的意向。”

    “比如刻舟求剑,船,剑,船上的人,这是基本的,然后还有衍生的概念,水的遮蔽特性,相对于剑的密度特性,相对于人的危险特性……想象一下一个外星人要理解刻舟求剑这个词,他需要理解多少衍生的附带概念。最后,在完全理解了这些概念之后,他才有可能理解到成语本身特定指代的某种意向——是用来讽刺主观意志因为忽略客观条件的变化而导致的愚蠢行为。

    “在英语里,其实也有类似成语的短句,我就不细说了……”

    “这种我们刚刚发现的机器语言,你知道,在它的语言库里,我们找到最复杂的‘成语’,有多少意向指代吗?”

    陈舍看着乔伊,他竖起两个手指头:“两千多个……严格来说,它已经不能算是成语了,你知道,两千多个意向,通常来说,也就是两千多个词汇。要表达这些词汇,考虑到语句上必要的通顺和前后的逻辑,用中文大概写出来的话,就这一个词,就可以展开写一篇上万字的小说了。”

    “其实成语就可以看做是被高度压缩的小说故事——但机器语言中,故事的复杂程度更高。想象一下这样一个场景,一个外星人,在电脑上跟你聊天。他说了一句话,里面包含两个这样的关键词——这些词用01全部表示出来,也就是一两排而已。但翻译出来,却可以是长达几万字的内容。你可能需要认真的看20分钟,再思考20分钟,才会明白这两个词的含义——然后大喊一声,太TM绝了!”

    “所以,你们的任务……”陈舍尝试着猜测:“是翻译这种文字?”
    第(2/3)页