《谈汉字编码研究的误区.docx》由会员分享,可在线阅读,更多相关《谈汉字编码研究的误区.docx(3页珍藏版)》请在课桌文档上搜索。
1、谈汉字编码研究的误区今天“汉字编码”和“中文信息技术”二个专业委员会在这里联合召开汉字输入技术与应用研讨会,这是在汉字输入学术领域里值得庆贺的一件大事。我首先向研讨会的组织者和承办者表示深切地感谢,感谢你们给了我一个汉字编码“发烧友”与专家们一起坐而论道的机会。从1996年11月的苏州会议到今天2002年11月的温州会议,已经过了整整6个年头。在这6年里,微机行业和互联网行业的飞速发展,形成鲜明反差的是汉字编码研究和中文输入技术发展的相对沉闷。当然这沉闷是个表面现象,在这表面现象下,是广大中文输入研究者的迷惘反思和对理想的中文输入法的探索与追求。本人反思的一孔之见是汉字编码研究存在着许多误区。
2、现坦陈于诸位专家学者面前,期望得着指点。本人所指“误区”是指本领域学术带头人提出的得到许多专家学者认同的似是而非的观点。首先在谈及正题之前必须说明,本人认为的汉字编码研究领域里的几个误区,丝毫没有一点轻视或贬低学术前辈和专家学者的意思,也丝毫没有否定几十年来汉字编码工作者付出的辛勤劳动和取得的丰硕成果的意思。恰恰相反,本人心中时时涌动的是对本领域学术前辈,专家学者和广大编码工作者,业余编码“发烧友”的敬仰和钦佩之意。因为本人由衷地认为,目前流行使用的各种汉字编码和输入法,都是十分优秀的,即使是还没有进行商品化开发的,也都是非常优秀的,它们的设计者,从各个方面,各个角度对汉语、汉字对中文与计算机
3、的结合进行了卓有成效的探索研究和实践。可以毫不夸张地说,汉字编码决无平庸之作,都是国人聪明才智的结晶,都是汉字文化宝库里的瑰宝。大家提出的一些建议和意见,即使是不成熟的意见,都体现了对真理的追求,闪耀着智慧的光芒,显示了汉字编码研究的强大活力和促进中文信息事业发展的强大动力。迄今为止,汉字编码方案“万码奔腾”的大好局面来之不易,应该得到公正的评价和真诚的鼓励,因为这是理想的汉字编码和中文输入法诞生的先兆。误区之T在全球信息化革命大潮中对汉字的误解与贬低。在最近几年,作为大学教材的语言文字原理一书中有这样一段结论:“汉字永远只能作为客人在电脑中出现,真正的主人还是拼音文字,因为人们无法直接用汉字
4、设计电脑程序,无法使汉字成为电脑符号”。这个结论如果从一个初学电脑的人口中说出,人们可能只会付之一笑,但这个结论是从几十位教授级专家联合编写的教材中出现,可见中国语言文字学界高层专家对汉字的误解和贬低有多严重,对汉字信息化革命的负面影响有多严重。也许可以说,计算机是先进的电子技术和西方文明的产物,从它的诞生到成熟,几乎没有一点汉字文化的因子。但是更正确地说,它是整个人类文化技术高度发展的产物,它的出现能促进世界上任何文化技术的发展。计算机自从具备了图文处理的能力以后,人们就亲切地称它为电脑。对于电脑来说,储存、检索、处理、输出,西文字符和中文字符的原理并无本质的区别,也无难易的区别。目前尚未圆
5、满解决的,只是中文在人机交流上有点小麻烦而已,说简单一点就是在普及中文输入上有一点小困难而已。我们广大编码工作者不正在努力解决这个问题吗?相信不久的将来,理想的汉字编码和中文输入法的问世,将使中文在人机交流方面比西文更简便、更快捷。常言道,哀莫大于心死,面对心已死的的那些专家学者们我们还能说些什么呢?还是让我们从正面来理解那个结论吧,它将激励广大的汉字编码研究者、广大的中文软件设计师发奋工作,不达目的,决不收兵,这个目的最终就是体现中文的优越性。误区之二是把汉字编码与汉字输入及相关软硬件及经济性等纠缠在一起,忽视了汉字编码的标准。刘勇泉先生在有关汉字信息处理研究的几个问题(1)一文中说:“我要
6、强调说明的一点就是,我们不能孤立地谈论编码,我们必须从整个系统的角度来论证这个问题,即考虑编码时,还必须考虑输入是否方便,处理是否容易,存储是否节约,等等同样,评定一个编码方案时,绝不能单单以某种编码法规则很少,容易掌握为依据,也绝不能以没有同码字为依据,必须综合各种指标(字码无二义性,操作方便易学,输入和处理效率高,存储节省,传输可靠,设备经济实用等等)加以全面比较,才能得出正确结论”。刘先生的这段论述,看似全面,公允,仔细推敲却使人糊涂,汉字编码怎么能与那么多的各项指标相关呢?李逸之先生在关于汉字编码的几点设想(2)一文中曾对汉字编码有一个确切的定义,他说:“我们现在使用的汉字在6000个
7、以上,把这么多的汉字,编排成输入计算机的数字或字母符号,就叫汉字编码”。事实也确实如此,据说现在已有汉字编码方案数千种,这数千种方案抽象起来,都是用几个数字或字母表示一个或几个汉字,对于计算机来说,几千种汉字编码都只是一种。这串字符含义有多丰富,只有设计者和操作者知道,计算机是不管的。本人认为,汉字编码只与设计它,用它的人有关,与计算机是无关的。评价汉字编码只有一条标准:以人为本,易学难忘,其它指标如输入是否方便,处理是否容易,存储是否节省,传输是否可靠,设备是否经济实用都不应该是汉字编码设计者、评论者考虑的,也是无法考虑和解决的。一位软件专家说得好,只愁理想的编码方案设计不出来,别愁设计出来
8、后,不能在微机上实现它。本人建议,由汉字编码专业委员会,筹集经费,组织力量,攻其一点,不及余力,这个一点当然就是“以人为本,易学难忘”。具体方法是,收罗方案,博采众长,逐级遴选,去粗存精,精雕细刻,镶金嵌宝,巧集大成,共成大业。误区之三是把易学难忘与高速高效相提并论,混为一谈。陈明远先生在汉字编码研究的进展及分析(3)一文中谈到对于中文编码的七个原则要求时说:“高效率是现代化的重要特征之一。这不仅是对字码本身的要求,也是对人机系统的要求。单纯强调减少击键次数,不一定能保持高效率。如果一味追求字码的码长,却加重了操作者的记忆和动作负担,忽视了方便性和简易性,那么实际速度不仅仅不能提高,反而会降低
9、”。本人之所以把易学难忘与高速高效相提并论作为一个重要误区来讨论,是因为这种观点,混淆了知识与技能两个完全不同的概念。现在有很多人把高速盲打吹得神乎其神,似乎成了评价编码方案的特别重要标准。本人认为,易学难忘是对编码的第一要求,而高速高效是对操作手的第一要求,严格意义上讲二者是不相关的。其实,高速高效对于职业打字员来说只是雕虫小技,是打字员必备的职业技能而已。陈明远先生是最早把西文打字的触打法比作弹钢琴的人之一,他说:“触打法规定这类似于弹钢琴-看谱不看键,以提高效率J可见陈先生也是把技能训练作为提高效率的重要手段的。为了说明知识和技能的区别,这里也把弹钢琴作一比喻,一个人懂音高,懂节奏,会识
10、谱,懂乐理,这是知识,想学弹钢琴,这是技能,老师告诉他,7个白键,5个黑键一组,从左到右一共七组八组,他就会弹曲子了吗?十天半月可培养一个打字员,几个月可练成一个打字高手,几个月能练成一个钢琴演奏家吗?没有三、五年,十来年的苦练,能成为一个演奏家吗?再别把高速盲打吹得神乎其神了,吹口琴,吹笛子,拉手风琴,拉二胡,弹琵琶,弹吉他,哪一样不是“盲奏”的呢?说白了,熟能生巧罢了,条件反射而已。一组数字或字符表示一个或几个汉字,这组符号就是汉字编码,这组字符序列表示的定义和规则复杂一点,这种汉字编码就相对难学易忘一点,而这种符号序列表示的定义规则简单一点,这种汉字编码就相对易学难忘一点。从学习掌握知识的角度来看编码,符号序列代表的定义规则应该力求最简单,而输入高速高效不应成为设计理想编码的干扰源。悠哉悠哉输汉字,每分钟二、三十个字,足够了,多惬意。静下来苦思冥想,汉字编码学术领域里的误区还真不少,本人只是恳切希望在本领域内多一些争鸣,斗胆直抒己见,可能辞不达意,冒犯之处,敬请谅解。汉字输入网站:华尚铮华欣2002/11/1(1)(2)(3)汉字编码研究会1978年青岛会议论文集