第1868章如何翻译外星文_我靠打爆学霸兑换黑科技

给力文学www.geilizw.com

因此需要调整图片特征，尽可能把图片和文字的吻合度拉到最高，用多张图片交叉说明一个词汇，类似于AI学习的过程，但为了沟通的便捷性，又不能让每个字词对应的图片太多，否则会严重拉长语言学习翻译的时间。

第二代星际语言翻译器，意识到外星生命可能并没有眼睛，压根看不见屏幕，因此增加了多种可见光之外的信息传达方式，整个翻译器的体积也急剧上升，从一块小屏幕，变成了冰箱大小。

但失去了图片，信息表述变得更加困难，神童们到这个版本开始研究，生命感知世界的方式总共可以有多少种？并尝试理解不同感官在脑海中形成的世界是什么样子，再进一步推导可能的语言形式。

研究结果比较乐观，大部分生物大概率会有视觉，因为光是感知世界最及时的媒介，用其他方式感知世界，在各类场景下往往会丢失大量信息，继而在生存进化中落入下风，很难成为星际文明。

第三代星际语言翻译器，添加了更多“达成共识”的初次接触信息。

譬如加入了中性氢原子的跃迁图像，氢原子在可观测宇宙中随处可见，无论在哪个星球诞生的文明都会熟悉氢原子，而跃迁长度21.106厘米以及跃迁时间0.704纳秒是固定的，就可以在长度单位和时间单位上取得一致。

各类物理化学知识都被加入初次接触信息中，毕竟整个世界是物理化学的世界，只要在物理化学层面达成一致，就可以一点点描述万事万物，虽然可能非常麻烦，但至少可以把翻译误解降到最低。

第四代星际语言翻译器，引入了更多信息论的成果。

譬如着名的齐普夫定律，也叫省力法则，拿足够长的一大段人类文字，将其中的高频字词统计出来，大概率会出现高频词次数和次序排序的反比关系，也就是说第二高频词出现的次数会是第一高频词的二分之一，第三高频词出现的次数会是第一高频词的三分之一，往后四分之一、五分之一等等。

最初齐普夫定律是从人类文本里总结出来的，但后来生物学家们发现，海豚座头鲸之类可以互相交流的生物，声音变化分布竟然也符合齐普夫定律。

此外这一版本的翻译器尝试额外引入了多种人类语言模型，用来应对不同信息熵的外星文明语言。

信息熵也叫香农熵，由信息论祖师爷香农提出了最初公式，历经一个多世纪的学术研究，结合马尔科夫链等理论，被反复升级优化。

简单来说，符号种类数量越小，信息熵越低，符号种类数量越大，信息熵越大。

信息熵越低的语言，文字理解学习起来更容易，但相同长度的文本能表达的信息量也越少，可以理解为更费口舌更费笔墨但不费脑子，沟通效率更低。

例如英文的一阶信息熵大约是4比特，汉字一阶信息熵大约是9.6比特，不同文本样本和不同建模得出的计算值会略有误差，但差距之大显而易见。

实际生活中最直观的例子，就是同样内容的文本，例如产品说明书或者联合国文件，就会出现汉字篇幅更短的情况。

第五代星际语言翻译器，在之前几代升级的模块上进行全面加强和改错。

传递信号的模块换上了最顶尖的，精度强度都上了一个台阶，造价上了十个台阶，好在这种和外星人沟通的东西也不用考虑量产成本，价格完全无所谓。

又加入了更多的初次接触信息种类，更灵敏的AI模型。

同时神童们在做第五代版本时，再度深入研究了语言信息熵，之前研究的语言只是现有使用的国际主流语言，这次神童们研究了历史上的古语言演变过程，并尝试自创信息熵更高或更低的新语言。

宋河看神童们的研究手册时，震惊于研究的细致深入程度。

有据可查的二百多种不同历史时期的语言，神童们分工合作都吃透了，得出大量数据详实的结论，这帮智商逼近二百的孩子，为了一个当时毫无实用价值的课堂小任务，业余时间自学成才变成了一堆古语言专家。

全球曾经出现过的主流语言里，信息熵的冠亚军分别是繁体汉语文言和东瀛候文，其中文言文不同历史时期的熵变化也做了排序，《尚书》时代的信息熵和《史记》时代的信息熵差别已经很大了。

最初神童们认为，很大概率外星文明的语言也会出现类似的变化，随着历史时期改变，出现信息熵减弱，从信息熵更高的《尚书》减小为《史记》，从信息熵更高的繁体减小为简体。

包括东瀛候文，是从汉语文言先演变成变体汉文，最后才演变成东瀛候文，整个演变过程也是信息熵不断减小的过程。

研究到这一步，神童们觉得外星文明的语言信息熵可能也会较低，毕竟星际文明的历史大概率会比人类历史更长。

但这一结论只存在了一个周末就被推翻了，神童们立马又得出了完全不一样的结论。

第1868章 如何翻译外星文 （1 / 2）