要高度重视汉字基础研究

下面是小编为大家整理的要高度重视汉字基础研究,供大家参考。

要高度重视汉字基础研究

 

 要高度重视汉字基础研究

 一

  不管我们做什么工作, 都要使用 语言文字。

 人类之间的交流是通过语言文字进行的, 人对机器的控制是依靠语言文字实现的。

 电脑处理的大量数据, 大都以文字符号的形式存在。

 离开了 语言文字, 电脑只是一堆废铜烂铁, 人类只能像野兽一样生存。

 语言文字在我们的工作、 生活和学习 中所起的作用 , 不论怎么强调也不过分。

 语言文字是信息技术的处理内 容, 信息技术是语言文字的处理方式, 信息技术必须服务和服从于语言文字, 这是语言文字与信息技术的辩证关系, 也是世界各国发展信息产业必须遵循的一项基本原则。

 美国通过发展信息产业, 进一步强化和提高了 英文的世界地位:

 世界上 90%以上的软件程序是用 英文编写的、 70%以上的网络内 容是用 英文传递的。

 与之形成鲜明对照的是, 拥有世界上三分之一使用 人口 的汉字, 却落到了 只能用 于翻译软件英文菜单的地步。

 以至于我国信息产业经过三十几年的发展, 还必须用 英文来发展自 己的软件产业。

 按照这一趋势发展下去, 除了继续为拉丁文字信息产业添砖加瓦外, 中文信息产业的竞争力得不到任何实质性的提高, 我国信息产业就很难在国际上争得一席之地。

 汉字是中华民族文化的根, 也是我国发展信息产业的源。

 回顾一下我国信息产业的发展过程, 像联想、 方正、 百度、 腾讯、 搜狗这样的旗舰企业, 无不是从发展汉字信息处理技术起家的; 像汉字系统、 编辑软件、 汉字输入、 字典软件、 中文搜索、 即时通信、 短信彩信这样大紫大红的软件, 无不根植于汉字文化的丰厚土壤。

 信息处理与其说是一种技术手段, 不如说是一种文化整合。

 遗憾的是, 我国信息产业过度追求技术手段的先进性, 严重忽视了 文化整合的迫切性, 至今

 还没有充分地认识到汉字对我国经济文化的发展, 尤其是对我国信息产业的发展具有至关重要的作用 。

 在当今“国际化” 、 “一体化” 的潮流中, 我们似乎忘记了 “只有民族的, 才是世界的” , 自 觉或者不自 觉地弱化了 汉字的影响,以至于汉字信息处理技术得不到应有的重视和支持。

 不要忘了 , 我们手中捧着的汉字, 正是祖宗留下的瑰宝。

 我们只有将汉字文化发扬光大的责任, 没有将汉字文化推向深渊的权力。

 如果哪一天汉字及汉字文化不复存在了 , 我们中华民族在世界上还有什么地位可言。

 这不是一个民族感情问题, 而是一个民族生存问题。

 现在该是我们认真对待的时候了 。

 要想迎来中华民族的伟大复兴, 要想在世界高科技领域占有一席之地, 从现在起,我们必须像当年搞“两弹一氢” 那样, 高度重视汉字基础研究, 花大力气搞好汉字信息化基本建设。

 二

 信息论为信息技术发展作了 理论上的准备。

 美国在信息熵理论的基础上,不仅建立起了 高效的英文信息处理系统, 而且全面解决了 英文数据管理的标准问题。

 我国在引 入信息熵理论后, 不仅没有在信息熵理论的基础上提出汉字信息处理的方法和标准, 反而从理论上“证明” 了汉字的信息熵远大于英文、 法文、 俄文等拼音文字, 宣布了汉字是世界上最不适合信息处理的一种文字, 只有面临着被替代或者被改造的命运。

 这一“证明” 表面上逻辑严密、 无懈可击,实际上却漏洞百出、 经不住推敲。

 由于出自 权威人士之口 , 这么多 年来, 很少有人对这一结论提出过质疑。

 我们曾经被这一结论震慑过, 也为汉字不济的命运悲哀过。

 不过, 在我们对汉字结构规律进行了 深入地研究以后, 尤其是在发现汉字基因、 汉字字母和发明汉字数码以后, 我们才真正找到了 推翻该结论的理论依据和事实材料。

 原来英文、 法文、 俄文等拼音文字的字母数量一般都在30个左右, 因此包

 含在每一个字母中的信息熵就很小。

 而汉字有成千上万, 其随机出现的不确定性比拼音文字字母出现的不确定性要大得多 , 每个汉字承载的信息量也远远超出了 一个字母承载的信息量, 因此包含在每一个汉字中的信息熵就很大。

 这种比较方法的出发点, 是将每个汉字都看作是一个字母。

 如果真是这样的话, 即使不用 信息熵理论, 直接将一个只拥有几十个字母的文字与一个拥有上万个字母的文字比较, 孰优孰劣, 已是再清楚不过了 的事情了 。

 这种比较方法显然是违背文字学常识的、 缺乏科学依据的, 也是站不住脚的。

 首先, 每个汉字都有着明确的意义, 而绝大多 数字母是没有明确意义的。其次, 相当数量的汉字都是单字词, 而由字母单独构成的词是很少见的。

 再次,世界上哪有上万个字母的文字, 这个概念完全是强加给汉字的。

 我们研究发现,汉字确实是有字母的, 不过既不是汉字本身, 也不是能够拼出汉字读音的拼音字母, 而是能够拼出汉字字形的拼形字母。

 由于拼形字母是汉字本身固有的,称之为汉字字母更为科学和准确。

 汉字只有九个字母, 这九个汉字字母极其简约、 极具规律地构成了 全世界所有汉字。

 汉字需要编码, 并不说明汉字落后。

 所有信息都需要编码和解码才能处理,包括英文、 法文、 俄文在内 的拼音文字也不例外。

 当手持通讯设备和信息设备发展起来, 只能用 数字键盘上的数字键来处理文字信息的时候, 拼音文字字母所具有的优势已经丧失殆尽, 与汉字一样, 共同面临着数字化问题。

 我们发明了 汉字数码, 只用 九个数字, 就将数以万计的汉字和数以十万计的词语有规则地、 唯一地表示了 出来。

 汉字的这种数字化程度, 世界上其他文字无论如何也达不到。

 这充分说明了 汉字是信息的最优秀载体, 是最适合现代信息技术处理的文字, 汉字的信息熵在所有文字中是最低的。

 三

  信息市场之争, 实质上就是信息标准之争。

 谁掌握了 信息标准的制定权,

 谁就掌握了 信息市场的制高点。

 问题是掌握了 信息标准的制定权, 如果制定不出符合规律的、 普遍适用 的、 并且具有权威的信息标准, 同样也会失去信息市场的主动权。

 汉字编码就是一个典型例子。

 虽然国家曾经组织过有关部门、 专家、 学者对现有的汉字编码方案进行过评审, 也曾考虑过集中力量搞一个汉字编码标准方案, 然而种种尝试和努力最终都没有了 结果, 至今仍是全民科研、万“码” 奔腾。

 不仅浪费了 大量的人力物力, 而且占用 了 信息通讯设备的资源,还给人们一种汉字难以处理的不实感觉, 将不少不懂汉语拼音的人挡在了 信息高速公路之外。

 如果这个问题不解决, 不让尽可能多 的中国人接触信息科技,中国的信息化进程就会受到很大影响。

 汉字信息标准化的核心是汉字标准化。

 要实现汉字标准化, 汉字字母首先要标准化。

 要在科学研究的基础上, 对汉字字母实行定性、 定量和定位。

 所谓定性, 就是对汉字字母进行科学定义, 建立统一规范的判别准则; 所谓定量,就是保持汉字字母数量的唯一性, 不因研究者和使用 者的不同而任意变化; 所谓定位, 就是汉字字母在键盘的位置是固定的, 不因设备和用 途的不同而随意更改。

 国家对汉字信息化的基本建设历来都是重视的。

 一系列汉字规范和标准的相继颁布实施, 对实现汉字信息化和发展信息软件产业起到了 非常重要的作用 。

 然而, 有两个关键性因素制约了 汉字信息化的基本建设, 以汉字信息为基础的我国信息软件产业远没有达到应有的水平。

 一是汉字基础研究严重滞后。

 随着我国综合国力的显著增强和国际地位的显著提高, 国外正在掀起一股股“汉语热” 、 “汉字热” , 与此形成强烈反差的是, 在我国, 汉字、 汉语及其承载的中华文化, 其地位和影响却没有得到大幅度提升。

 汉字基础理论的研究, 由于不能够迅速带来成果和效益, 国家和社会对这方面的政策倾斜和资金投入并不太多 , 从事这方面研究的人员 数量很

 少。

 像中国汉字工程院的研究人员 那样静下心来, 花费几年甚至是十几年时间来解决汉字某一基础理论问题和基础应用 问题, 应该得到国家的支持和社会的鼓励。

 二是汉字基础研究深度不够。

 发展我国信息软件产业, 最缺的既不是资金,也不是政策, 而是具有影响力和震撼力的原创性发明。

 只有拥有世界级的自 主知识产权、 核心技术和国际标准, 我们中国人才有可能在信息技术领域里有所作为。

 而最富文化底蕴的、 最具市场前景的、 最易形成突破的, 就是汉字信息处理技术。

 汉字信息技术的落后, 根源在于汉字基础研究的薄弱。

 只有在汉字基础研究方面出现重大突破, 才可能引 发汉字信息技术质的飞跃, 才可能迎来我国信息软件产业的跨越式发展。

 以发现汉字基因、 汉字字母为开端的汉字数字化工程, 涉及汉字信息处理的许多 重要领域, 以中国人的高度智慧, 以数字化的特殊方式, 提供了 解决嵌入操作、 语音控制、 人工智能等诸多 信息通讯领域尖端问题的简单方法和有效途径。

 由此产生的深远影响及其示范效应, 使我们完全可以期待汉字基础研究百花齐放、 硕果累累的那一天, 期待汉字发挥出巨大威力、 推动着中国经济和社会全面腾飞的那一天。

推荐访问:要高度重视汉字基础研究 汉字 高度重视 基础