西西河

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163 新:
全看分页树展 · 主题 跟帖
家园 01编码没有记录语音,所以不是自然语言

谈不上是最先进“语言”,因为没有语音载体的成分在里面。

人类的口腔充其量只能发出600种音节,哪怕用声调/重音/轻音来调制,也不过1000余种。

那么扣除1比特的基本通讯编码需要后,能够用最少的编码符号就能把600多种语音记录下来,那么那种语言可以称得上最佳语言了。

拼音文字用26-33个符号和象形文字用6000个符号各自能把600种语音记录下来,显而易见拼音文字要简便得得多。

可以形象化说(当然不严谨),如果拼音字母文字是26位进位制,而汉语汉字就是6000位进位制了。

我经过计算,发现一旦使用汉语拼音,汉语拼音文字的文字熵的值会降下来,变成4.30比特,证明汉语汉字也是一种记录语音的工具,只要符号系统选择正确,可以变成一种低熵语言。只是使用的符号不同而已。目前汉语用3套方法记录文字:简体字,繁体字和汉语拼音。从简单性上分析,汉语拼音最简单,一年级小孩子化2个月就能掌握了--可以读出6000个注音汉字没有问题。

唯一的问题是我们的祖先用6000个符号对付600个种音节,那么至少每个音节有10个汉字符号来对应,造成同音字太多(最多的同音字yi达到近200个),在汉语拼音中,如何消除同音字带来的困惑,必须予以解决(一般通过双字多字词组)。

同音字不仅仅是汉语的问题,也是使用过汉语的文字的通病,日语/韩语/越语这些语种都有同音字问题。

上面只是用编码的效率角度判断一个语言的通讯能力。以后专门开贴谈这个效率问题。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河