第 1 章 文字和语言 vs 数字和信息
Last updated
Last updated
语言和数学的产生都是为了记录和传播信息。
任何事物的规律性是内在的,不随着载体的改变而改变。
简单的声音不能满足沟通的需求,语言由此产生——随着对新鲜事物的学习,用来描述共同因素的语言被抽象成词汇——语言和词汇多到难以记忆,便产生了文字——文字多到难以记忆时,概念的概括和归纳就开始了——文字按照意思来聚类会产生歧义,可以利用上下文来消除——不同文明相互融合,于是产生翻译——记录物件数量,计数系统产生(10位以内掰指头,10位后使用10进制,后产生数量级)——阿拉伯数字的产生标志着数字和文字的分离,奠定了数学未来的发展。
事物发展到一定阶段时,会变得复杂起来,这时会有新的事物来代替它。新的事物看起来简单,但这种简单也是它的复杂性之所在,因为它又需要其它事物来进行解释。从这方面来说,事物之间并不存在好坏之分,放到合适的位置上便是好的。
翻译之所以能达成,是因为不同的文字在记录信息上的能力是等价的。即文字只是信息的载体,而非信息本身。信息冗余是信息安全的保障,只要有一份内容完好保存下来,原有信息就不会丢失。双语或者多语的对照语料对翻译至关重要,它是机器翻译的基础。
楔形/象形文字诞生——为方便雕刻,简化成22个字母——为方便学习,拼写和读音结合(将物体外表编码为抽象概念,常用字短,生僻字长)——为节省信道,传播信息前需进行压缩,接收后再解压,并校验——语法使语言表达更准确、更丰富。
语言坚持从真实语句文本(即语料)出发,语法坚持从规则出发,前者在自然语言处理上获胜。
讲述文字、数字和语言的历史,感受语言和数学的天然、内在的联系。