用生命賣萌: 突然意识到中文的构架很不好

天下很多人，都使用基于罗马帝国使用的拉丁字母发展出的一套语言，特别是没文化的日尔曼人，没有自己的文字，就“伟大的艺术家偷窃”了一把，发明了英语，德语，etc. 今天，这些蛮族的语言，居然成了世界科学和工程的语言。

今天我想，罗马帝国打遍天下的原因之一，可能是拉丁文简单——在那通讯落后的年代，复杂的语言体系必然降低效率，比如中国皇帝在乌龟壳上，一月才刻三个字，这怎么征服天下啊。当然，那些连在乌龟壳上刻字都不会的民族就更悲剧了，只能被罗马帝国征服。

用不同长度和组合的character string来表达信息确实是一种高效的方案。上帝创造生命时，就是用string来记录遗传信息的，以至于今天所有bioinformatists都不能离开text editor做研究。String的力量是非常强大的，National Instruments发明LabVIEW时，希望以一种graphic programming的办法快速原型化，但是从LabVIEW 8.0开始，他们也引入了Mathscript [1]，使程序员可用Matlab-like syntax写code处理数据。

中文不幸像LabVIEW 8.0+一样，用了一种2-D和1-D混合的办法，用笔划在2D space的排列来造字（仅造字的办法就有6种，称为六书，造字单位亦居多，比如，中国字有大约300个部首[2]），为了表达更复杂的意思，再把字组成句子——用了拉丁文string的办法。以KISS的原则，这种混合的设计是不好的，比如这种办法使得活字印刷和电脑输入就复杂了。不要认为中文可以打字快就说明电脑输入简单，所有的中文输入法都使用了拉丁文的办法：基于一串key strokes来输入中文——丢失了中国字2-D的设计。

To be continued...Comments and critiques are welcome.

PS：当然日尔曼语系的语言很多基本词汇和拉丁文没关系，因为虽然他们不会写字，但还是有自己乱喊的办法。拉丁字母使得日尔曼人很容易抄袭另一个强大的文明古希腊——因为希腊文也是用字母的。今天英语中很多科学和技术词汇之所以看起来奇怪，因为都是抄袭了希腊文。连Kunth同学发明TeX这个名字时，都要ZB的使用希腊文，而不是英文Tech.

References:
[1] NI LabVIEW MathScript RT Module, http://www.ni.com/labview/mathscript/
[2] 部首，维基大典，http://zh.wikipedia.org/wiki/%E9%83%A8%E9%A6%96

用生命賣萌

Nov 17, 2012

突然意识到中文的构架很不好

No comments:

Post a Comment

Translate

Links

cat /var/log