快好知 kuaihz订阅观点

 

王永民“五笔字型”中“末笔字型交叉识别码...

王永民“五笔字型”中“末笔字型交叉识别码”定义简析

 

   内容提要:“五笔字型”的“末笔字型交叉识别码”的提法混乱,规则不统一,有严重错误:

   所谓末笔,应该是严格按国家笔顺规范书写每一个汉字时的最末一笔。国家规定:“力、刀、万、方、乃”等一类字的末笔应为撇,可是“五笔字型”却规定为折;“瓦”一类字的末笔应为中间的点,“五笔字型”却规定为折;“戈、戋、我、咸、成、戊、戌、戎”等一类字的末笔应为右上角的点,“五笔字型”却规定为倒数第二笔撇,凡此等等。若用以上这些不规范的末笔去作为“末笔识别码”或“一二三末取四码”,所得出的编码肯定是错误和不符合国家语言文字规范的。

   更有甚者,笔者的重要研究发现认为:在其所谓“杂合型”的一类汉字中,有些汉字的末笔并不等于按该码拆分的最后一个字根的末笔。例如“国、团、园、图”等等一类字的末笔应为封口的一横,“五笔字型”却没有用它们去作为末笔识别码,而是分别用它们最末一个字根的末笔点、撇、折、点去作为识别码。同样的道理,“区、巨、匹、匠、医”等等一类的末笔应为折,该码却用最末一个字根的末笔捺、横、折、竖、捺去作为识别码;“可、何、式、武、哉、戒、或、必、肃、巫、乘”等等的末笔国家都一一有规定,“五笔字型”却是用了其最末一个字根的末笔去作为识别码。因此,我们可以得出这样的结论:“五笔字型”中“末笔字型交叉识别码”的提法混乱,规则不统一,有严重错误,应更正为“末根末笔字型交叉识别码”。这样一来,无论左右型、上下型和杂合型的汉字,需要追加识别码时,都可用最末一个字根的末笔去进行识别就一目了然,讲解起来也明白,学员也容易理解和接受。笔者的这项研究与具体实践,说不定还能帮助该码有所改进和提高呢。

笔者写这篇文章的目的,绝不是去批评某个编码,与某某人过不去,而是探讨、研究和论证某个新的语言文字规律,提高我们的学术认识水平,这不仅强调了新中国语言文字规范的重要性,不要与中小学的语言文字教学相悖和抵触,而且对“五笔字型”的改进和教学都有好处。多年以来,由于某些原因,不少专家学者和用户还不明了笔者的意见和论证,有知道的也大都不愿明确表态和正视,而是回避问题或闪烁其词。这是探讨语言文字规律的学术问题,科学的问题,来不得半点虚假,是就是是,非就是非。展开学术争论,让人明辨是非,有何不可!

   关键词:末笔字型交叉识别码  定义有错误 应更正为“末根末笔字型交叉识别码”

 

   王永民先生的“五笔字型”汉字编码主要是字根码,根据汉字拼形组合的特点,根据其编码方案《五笔字型键盘字根总图》中所确立的字根,计算机汉字录入人员必须按照每个汉字字根的排列组合顺序——“根序”递次编码输入计算机。由于不少汉字(如二根字、三根字)字根构件少,所得码长短,信息量不足,便会出现大量重码字,给汉字录入带来困难。为了解决这一难题,为了增大某些短码字的信息量,以便离散重码,发明者又给不少信息量不足的短码字在其字根码的后面追加了“末笔字型交叉识别码”,以作为离散重码的重要手段和得力措施,这是很有必要的,决不可少的。这也是学习五笔字型的难点和教学关键,必须彻底认识清楚,决不能有所含糊。为了便于探讨和分析问题,我们且先来介绍一下发明者的某些论述:

   凡取不够四个字根的汉字需追加一个识别码。识别码一般由这个字的末笔笔画代号与该汉字的字型代号结合而成。用编码歌中的话来说就是:“不足四码要注意,交叉识别补后边……”用于识别的末笔,这里有二点规定。您在使用中要特别注意。

   A.所有包围型汉字中的末笔,规定取被包围的那一部分笔画结构的末笔。

   如:“国”,其末笔应取“丶”,识别码为43(I)

       “远”,其末笔应取“乙”,识别码为53(V)

   B.对于字根“刀、九、力、匕”,虽然只有两笔,但一般人的笔顺却常有不同,为了保持一致和照顾直观,这里规定,凡是这四种字根当作“末”而又需要识别时,一律用它们向右下角伸得最长最远的笔画“折”来识别。例如:仇:亻九,34,53,51;化:亻匕,34,55,51,等等。”(见1990年12月1日北京王码电脑公司刊印的五笔字型《培训教材》54—55页)

   “末笔字型交叉识别码”只适用于不足四个字根组成的字。对于拆不够四个字根的汉字,为了避免使用上述“Z”键及在提示行中挑选,有必要在字根打完后,加上一个末笔字型交叉识别码,识别码由末笔画代号与字型代号组合而成。……

   C.为了有足够的区分能力,对于“进”、“连”这样带“走之”的字,它的“末笔”规定为包围部分的末笔。进:二 辶(12,22,45,23,FJPK)

   D.对于习惯笔顺不一致的“刀”、“力”、“九”、“匕”四个字根,当它们参加“识别”时,一律规定用“折笔”作末笔。如花:艹亻匕(15,34,55,52,AWXB)(见1990年12月1日北京王码电脑公司刊印的五笔字型《用户手册》13—14页)根据以上引述,我们可以得出如下的结论:

   1.在通常情况下,五笔字型所说的“末笔”就是指每一个汉字的最末一笔,它决定某些汉字需追加的识别码的区号。例如“长”的末笔为捺,其识别码的区号则为“4”,“召”的末笔为横,其识别码的区号为“1”。

   2.“所有包围型汉字中的末笔,规定取被包围的一部分笔画结构的末笔”,由此可知,这类汉字比较特殊,其参加识别的末笔不是该汉字真正的末笔,而是被包围部分的末笔。

   此外,人们还会提出这样的疑问:所有包围型汉字需追加识别码时属于以上特殊情况,那么所有半包围型汉字含不含在里面?属不属于这种特殊情况呢?这一点不能含糊,必须详加说明和解释清楚。发明者在例字中列举了半包围型的“走之”例字加以说明,我们姑且理解为半包围型的汉字也包括在内吧。但是例如下面一些汉字,既非全包围型,又非半包围型,其最末字根也非是“刀、力、九、匕”,为什么又不以各个字的末笔参加识别呢?莫非又有什么另外的特殊规定吗?请看如下例字:

   必:心丿,51,31,33,NTE,国标码为1756号,该字是由最后一个单笔画字根撇笔参加识别的,但是“必”字的末笔应为右边的点(见《印刷通用汉字字形表》5画、《汉字正字手册》13页),为什么不用“必”字的末笔点参加识别,而要用倒数第二笔撇参加识别呢?那么泌、秘、铋、佖、咇、妼等字也同样存在这样的问题。

    乘:禾丬匕,31,42,55,53,TUXV,国标码为1943号,该字是由最后一个字根“匕”的末笔折参加识别的,但是“乘”字的末笔应为捺,其笔顺为:禾 乖乘(见《印刷通用汉字字形表》10画、《汉字正字手册》31页),为什么不用“乘”字的末笔捺参加识别,而要用倒数第三笔折参加识别呢?

    冢:冖 豕丶,45,33,41,42,PEYU,国标码为5803,该字是由倒数第三笔点参加识别的,但是“冢”字的末笔应为捺(见《印刷通用汉字字形表》10画、《现代汉语通用字表》10画),为什么不用“冢”字的末笔捺参加识别,而要用倒数第三笔点参加识别(点捺在五笔字型中规定合笔,两种不同的识别方式所得的编码均相同,这是巧合,应另当别论)?那么诼、琢、啄等字也同样存在这样的问题。特别令人不解的是,有些全包围型、半包围型的字需要追加识别码时,发明者却没有一律按规定“取被包围的那一部分笔画结构的末笔”参加识别,而是另取了其它的笔画参加识别。这样做岂不没有了统一的标准、乱了界线了吗?也必然给追加识别码和这方面的教学带来了困难和混乱,让人无法依从,且请看下面的例字:

    毋: 55,13,33,XDE,国标码为4667号,该字是用最末一个字根“”(右字头)的末笔撇参加识别的,但是全包围型“毋”字的末笔应为横,不是撇,其笔顺比较特殊(见《印刷通用汉字字形表》、《现代汉语通用字表》4画)。为什么不用“毋”包围部分的末笔横参加识别,而要用倒数第二笔呢?其实它正确的编码应为:毋 丿 一 55,33, 11,13,XTGD。

    肃:彐 小 53,43,22,23,VIJK,国标码为4363号,该字是用“肃”的最末一个字根“”(介字底)的末笔竖参加识别的,但是“肃”的末笔应为字中的点(见《印刷通用汉字字形表》8画、《汉字正字手册》234页),该字是用“肃”的倒数第三笔参加识别的,为什么不用包围部份的末笔(也就是这个字的末笔)参加识别呢?

   固、母、床、历、同、区、风、问、句、尾、氘、戒、式、武、哉、疔、建、远、鬼、旭、赵等等全包围型或半包围型的字,都以被包围部份的末笔参加识别(其实有些被包围部份的末笔就是该字的末笔,有的则不是),那么为什么“凶、函、凼(dàng)、幽、豳(bīn)”等这类半包围型的字却不以被包围部份的末笔参加识别,而是以包围部份(下框)的末笔(也就是这类字的末笔)参加识别呢?这样岂不产生矛盾和抵触,规则不统一,把字的末笔搞混乱了,令人无所适从和不可思议了吗?

   此外,“戈、戋”等字的末笔均为右上角的点(见《印刷通用汉字字形表》4画和5画、《汉字正字手册》76页等有关资料),那么“找、戏、战、笺、饯、贱、溅、浅、钱、栈、残”等字的末笔就应以右上角的点作末笔参加识别,不应用下面的撇作末笔参加识别;“乃、万”等字的末笔均应为撇(见《汉字正字手册》175页和63页、《印刷通用汉字字形表》2画和4画等资料),那么,“仍、奶、扔、艿、氖、秀、芳、肪、房、防、枋、妨、仿、访、纺、旁、舫、鲂、钫”等字的末笔就应以撇作末笔参加识别,不应用折笔作末笔参加识别。

   把“龙”字作为杂合型处理,把“右”一类的字却作为上下型处理,这实在没有多少明显的科学依据和规律性,要么它们都两面包围(半包围型),那就应为杂合型;要么可以上下分开,且都为两个复笔画字根组成,应视为上下型。“龙字头”已被五笔字型编码方案确立为“总图”中的字根,所以“拢、笼、珑、宠、茏、胧、咙、陇、庞”等字的末笔只好用右下角的折笔来参加识别,但这类字的末笔(包括拔、尤、扰,优、疣等)均应为右上角的点(先主体后加点的笔顺规则),发明者在总体设计时应加以慎重考虑,不能同国家规范化的笔顺标准相悖。“刀、力、九、匕”参加末笔识别的规定也是这样,应加以修正:“九、匕”的笔顺规则为先撇后折,以折笔参加识别,这符合国家规定的笔顺标准,但“刀、力、方、万”等的末笔应为撇,若它们参加识别时取用折笔作末笔,则不符合国家规定的笔顺标准。计算机汉字录入要普及到中小学,我们的笔顺标准应同他们所学习的笔顺标准统一起来,不能各吹各打,自行其是,所有的人,各行各业都应重视语言文字规范化的问题。

   如何按国家规定的笔顺标准正确无误地确认一个汉字(特别是有特殊笔顺的汉字)的末笔,对于五笔字型汉字编码方案来说,十分重要,这不仅关乎到末笔字型交叉识别码的正确确定,而且也关乎到某些以单笔画字根为末笔的四根字、多根字“取一二三四或一二三末”编定字根码的大问题!例如“我、咸、成、戊、戌、戍(后一点)、茂、诚、城、铖、越、樾”等字的末笔都应为右上角的点,不应以倒数第二笔撇作为末笔(单笔画字根)编码。最为典型的是“瓦”字,五笔字型拆分为:一乙丶乙,编码为:11,51,41,51,GNYN,国标码为4563号(见五笔字型《编码字典》45页),但“瓦”字的末笔不是折,应为点(执行后写内点的笔顺规则),其笔顺为一乙乙瓦(见《印刷通用汉字字形表》4画、《汉字正字手册》251页)因此该字的编码实应为11,51,51,41,GNNY,这样才符合国家规定的笔顺标准,不至于相背离。同“瓦”字有关的“佤”(WGNN),国标码5684号),“瓶”(UAGN,国标码为3831号),“瓴”(WYCN,国标码为7418号),“瓮”(WCGN,国标码为4645号,“瓯”(AQGN,国标码为7417号)等字的编码都应将最末一码“N(51)”改为“Y(41)”才妥当。

   我们曾长时期地考查、研究和拆分了五笔字型编码方案中该追加识别码的各种类型结构的汉字及其它汉字,得出这样一个规律和重要结论:

   每一个字根也都有它的末笔,汉字是由字根按根序排列组合成的,那么某个字根的末笔就可能是这个汉字本身的末笔,有的却不一定是该汉字的末笔。左右型、上下型和一部分半包围型的汉字(如打、析、树;杀、亲、早、章;氢、赵、函、问、凤等等),其末笔就是按根序拆分出来的最后一个字根的末笔,有一部分半包围型等的汉字却不是这样,二者统一不起来(如可、武、巫、肃、戒等等)。王码的定义和规则并不能涵盖和适用于所有的汉字。笔者的重要研究认为:其实,“五笔字型”的“末笔字型交叉识别码”是用按其规则拆分每一个汉字最末一个字根的末笔去进行识别(走之底的字可例外,用其倒数第二个字根的末笔去识别,因为这便于离散重码),因此其“末笔字型交叉识别码”应正名为“末根末笔字型交叉识别码”才正确和明白无误,其规则也更明白、简洁而容易学习。

   总之,研究如何给信息不足的汉字怎样追加识别码的问题时,不能孤立地、笼统地谈汉字的末笔,还应将字根的末笔联系起来综合分析和研究。原因是五笔字型是字根码,非得如此不可呢!

   说明:拙稿基本精神原刊登于1993年第3期成都科技大学《中文信息》杂志,题目为《“五笔字型”交叉识别码剖析》,现作了增订和补充。

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:五笔字型  五笔字型词条  王永民  王永民词条  识别码  识别码词条  字型  字型词条  交叉  交叉词条  
电脑

 win7系统怎么打开扫描仪

有的朋友可能安装了扫描仪,但是不知道在电脑上怎么打开,下面我就来演示一下在win7系统怎么打开扫描仪。操作方法01:首先,打开电脑,点击开始菜单,进入控制面板。...(展开)