Nov 17, 2012

突然意识到中文的构架很不好

天下很多人,都使用基于罗马帝国使用的拉丁字母发展出的一套语言,特别是没文化的日尔曼人,没有自己的文字,就“伟大的艺术家偷窃”了一把,发明了英语,德语,etc. 今天,这些蛮族的语言,居然成了世界科学和工程的语言。

今天我想,罗马帝国打遍天下的原因之一,可能是拉丁文简单——在那通讯落后的年代,复杂的语言体系必然降低效率,比如中国皇帝在乌龟壳上,一月才刻三个字,这怎么征服天下啊。当然,那些连在乌龟壳上刻字都不会的民族就更悲剧了,只能被罗马帝国征服。

用不同长度和组合的character string来表达信息确实是一种高效的方案。上帝创造生命时,就是用string来记录遗传信息的,以至于今天所有bioinformatists都不能离开text editor做研究。String的力量是非常强大的,National Instruments发明LabVIEW时,希望以一种graphic programming的办法快速原型化,但是从LabVIEW 8.0开始,他们也引入了Mathscript [1],使程序员可用Matlab-like syntax写code处理数据。

中文不幸像LabVIEW 8.0+一样,用了一种2-D和1-D混合的办法,用笔划在2D space的排列来造字(仅造字的办法就有6种,称为六书,造字单位亦居多,比如,中国字有大约300个部首[2]),为了表达更复杂的意思,再把字组成句子——用了拉丁文string的办法。以KISS的原则,这种混合的设计是不好的,比如这种办法使得活字印刷和电脑输入就复杂了。不要认为中文可以打字快就说明电脑输入简单,所有的中文输入法都使用了拉丁文的办法:基于一串key strokes来输入中文——丢失了中国字2-D的设计。

To be continued...Comments and critiques are welcome.

PS: 当然日尔曼语系的语言很多基本词汇和拉丁文没关系,因为虽然他们不会写字,但还是有自己乱喊的办法。 拉丁字母使得日尔曼人很容易抄袭另一个强大的文明古希腊——因为希腊文也是用字母的。今天英语中很多科学和技术词汇之所以看起来奇怪,因为都是抄袭了希腊文。连Kunth同学发明TeX这个名字时,都要ZB的使用希腊文,而不是英文Tech.

References:
[1] NI LabVIEW MathScript RT Module, http://www.ni.com/labview/mathscript/
[2] 部首,维基大典,http://zh.wikipedia.org/wiki/%E9%83%A8%E9%A6%96

No comments:

Post a Comment