最近,两个知名的网络公司因输入法引发了一场争端,一时间,“输入法”骤然成了网络热词。引起笔者注意的是此次事件中显露出来的输入法规范性问题。据称,一方指责另一方侵权的重要证据之一,竟然是其输入法中的错误词条也同样出现在对方的输入法中。网络上更有人称,二者相同的错误超过10000条。这说明输入法已经
要将汉字编码和输入法纳入到语文系统中统筹考虑,规范性是首先要考虑的因素。此外还要考虑易学性、高效性和通用性。
汉字编码和输入法规范性的基本要求,是要完全符合国家语言文字规范。更高的要求则是还应具有“纠错”功能,能够主动引导用户正确读音和书写,正确用字和用词,纠正用户在汉字读音、书写和用字、用词方面的不规范和谬误,从而提高全社会的语言文字规范化水平。过去提到汉字编码和输入法的规范性,主要针对形码的“乱拆字”,音码的规范性问题则容易被忽略。实际上音码同样存在规范性问题,主要是词语规范。因此,汉字编码和输入法涉及的语文规范似应全面包括字音、字形和字义规范。输入法要满足规范性的基本要求,编码层次是关键,要追求规范性的更高要求,软件层次大有可为。
汉字编码和输入法的高效性,对输入法而言,当然是指可实现高速输入。作为一个硬指标,输入法需要满足职业录入员的速度要求。当汉字编码用于字典查字时,高效性最直观的解释,就是要实现像拼音文字那样直接翻页查字。输入法要实现高效性目标,基本问题应解决于编码层次,并为软件层次提供用武之地。
汉字编码和输入法的通用性,是指通用于汉字排检和汉字输入,通用于全部汉字,通用于全社会。从横向来看,对全体用户而言,输入法要通用于各行各业,满足各种职业对汉字的输入速度和用字范围的要求,例如既能满足职业录入员高速盲打的要求,也能适合古籍研究人员方便输入罕见字的需要。从纵向来看,对个体用户而言,输入法要适合终身使用,从初学识字起,一辈子都适用。要满足通用性要求,需要编码层次与软件层次的完美结合。
汉字编码和输入法的规范性、易学性、高效性和通用性四项要求,组成一个系统化的宏观指标体系,似可用于从定性方面考查和评价汉字编码和输入法的优劣。四项要求之间,有的相辅相成,例如规范性好的应该更容易学;有的则相互制约,例如不当追求高效,容易导致易学性差,等等。在四项要求中,规范和易学是前提,高效和通用只有建立在规范和易学的基础上才有意义。
输入法要全面地、综合地满足这四项要求,需要同时在编码层次和软件层次进行系统化的研究。纵观今日之输入法,软件层次明显比编码层次更强势。有些输入法,特别是音码,把不断增强的软件功能用错了地方。例如,为追求市场占有率而竭尽所能去迎合各种语文水平的网民的用字、用词和用语习惯,用软件将网络中出现的“各色”词语照单全收,“一网打尽”,并作为输入法的一个卖点,这种做法,实际上是对充斥于网络的各种不规范的、错误的、甚至荒谬的词汇、语汇的全面认同和纵容,并起到推波助澜的作用。这无疑不利于语言文字规范化。电脑软件和输入法应该为促进和提高语言文字规范化服务,而不是相反。
要将汉字编码和输入法纳入到语文系统中统筹考虑,需要语文界、软件界和中文信息处理界形成共识,更需要有关部门加强管理。据教育部语信司最近公布的国家语委汉语言文字规范标准项目,多达38个已立项研制项目,其中有不少项目应该对汉字编码和输入法研究具有直接的规范和指导作用,例如《汉字键盘输入语言文字规范评价原则》、《GB13000.1字符集汉字部首规范》和《现代汉语常用词词表》等。我们期待这些规范尽快完成并公布实施。