五笔字型输入法
五笔字型是一种快速的汉字输入法,虽然在学习五笔字型;输入法时需要有一[
定的记忆能力,但由于用该输入汉字时,是按一些具体固定的结构输入而组成汉
字,使重码尽量减少,从而大大提高了输入速度.
1 汉字字型结构分析
在学习五笔字型输入法之前,首先必须对汉字字型结构进行分析
在五笔字型中认为汉字的组成分为了3个层次;笔画.字根.汉字.
一切汉字都有是由笔画构成的,在五笔字型输入法中,汉字的笔画中,汉字的
笔画有横,竖,撇,捺,折5种。一个完整的汉字,既不是一系列不同笔画
的线性排列,也不是一组各种笔画的任意堆积,而是由若干笔画复合连接交叉
所表示的不变的结构————字根来构成的。
例如,邑字是由口和巴构成,汉字是由氵和又构成。这里的口巴氵和又都是五笔字型的基本字根。
操作人员将字根按一定的顺序和一定的位置关系拼合在一起,就形成汉字。
由笔画组成字根的过程是由五笔字型汉字输入法提供的,而由字根组成汉字的过程是由操作人员根据输入的具体内容输入完成的。
(1) I汉字的笔画
五笔字型汉字输入法在分析了汉字的所有笔画之后根据其在书写时的走向归纳为止类,即横,竖,捺,折。为了方便操作人员的记忆,五笔字型根据这些笔画要汉字中出现的频率用1,2,3,4,5五个代码分别代表横,撇,捺,折。表2.5列出了五种笔画的代码,走向及各种变形。
表2.5 汉字的五种基本笔画
代码 名称 笔画方向 笔画及其变形 例字
1 横 从左到右,从左下到右上 一 古二王坦
2 竖 从上到下 竖归川刻
3 撇 从右上到左下 用白禾种
4 捺 从左上到右下 入玉术点
5 折 带转折的笔画(竖左钩除外) 电乙心已
____________________________________________________________
在五笔字型;输入法中,横,笔类除外,提笔也属于横笔画,向左钩的竖
线属于竖笔画,点形的笔画属于捺.所有转折的笔画都属于折..
(2)汉字的结构
由于汉字数量较字根多,有时不同的汉字就可能由相同的字根组成,例如汉字
吧和邑都是由口与巴两个字根组成,汉字示和未都是由二和小两个字根组成,根
据汉字字根之间和位置关系,可以将汉字分为左右结构,上下结构和杂合结构图
种,根据不同汉字在所有汉字中的占有的比例,为它们设定代码,用1 2 3分
别代表左右结构和杂合结构,如表2.6所示.
-- 表2。6汉字的字型
——————————————————————————————
代号 字型 例字
————————————————————————
1 左右型 形例树能部
2 上下型 合示,黄落架
3 杂合型 国闲回夫电
——————————————————————————
(3)字根之间的关系
在五笔字型输入法中,字根的连接方式有无种
单 由单个字根独立构成一个汉字,不与其它的字根发生关系。这样的单个
字根称为成字字根,如一丁白已等。
散 由多个字根构成一个汉字,各个字根之间保持一定的距离,不相连也不
相交,如分剖等。
连 组成汉字的各个字根之间有着相连的关系,这种相连的关系包括——
带点结构,如太头术等,单笔画与其它字根相连,如千自下等。
交 由两个或两个以上的字根交叉相叠而成,如里必电等。
根据汉字不同的连接方式,可以看到;基本字根单独成字,在将来的取码中
有它专门的规定,因而不需要判断字型,属于散的汉字,可以分为左右,上下结
构;属于连与交的汉字,属于杂合结构.
2五笔字型的字根键盘
由若干笔画交叉连接而成的相对不变结构就叫字根,在五笔字型输入法中,组成汉字的字根共有130个,这些字根按一定的规律放在从A~Y这25个键上。
为了方便操作人员的记忆,也为了输入的方便,五笔字型按照字根分区划位原则共分成5个区,每个区又分成5个位,这样得到:11~15 21~25 31~35 41~45 51~55共25个键位,每个键位上安排2~6个字根,每个键位对应一个字母键,11~15这样的字母称为键位代码,再从具有同一键盘位代表的一组字根中选出一个代表性的字根,作为键名(每个键位方框左上角的字根就是键名),这样就形
成了一张五笔字型字根总表。图2.24中列出了五笔字型输入法中的所有字根及每一种字根所对应的区号,位号,代码和字母键。
11 王旁青头戋(兼)五一 21目具上止卜虎皮
12 土士二干十寸雨 22日早两竖与虫依
13大犬三羊古石厂 23口与川,字根稀
14木丁西, 24 田甲方框四车力
15工戈草头右框七 25山由贝,下框几
31 禾竹一撇双人立,反文条头共31
32白手看三二斤
33 月彡(衫)乃用家衣底
34人和八,34里
35金勺缺点无尾鱼,犬旁留又一点稀,氏无七
41言文方广在四一,高头一捺谁人去
42立辛两点六门疒(病),
43水旁兴头小倒立
44火业头,四点米
45之字军盖建道底,摘礻(示)衤(衣)
51已半巳满不出己,左框折尸心和羽
52子耳了也框向上
53女刀九臼山朝西
54又巴马,丢失矣
55慈母无心弓和匕,幼无力
五笔字型的键盘设具有以下的规律:
(1) 键名字根与同一区上其他字根的形态基本相似.(2)字根起笔笔画的代码相同
(3)大部分的第二笔笔画与位号相同,例如,石这个字根应该在一区,该字根的第
二笔为撇,所以其键位代码为13.(4)位号由键盘中向两侧由小到大递增.(5)五
笔字型特别设计了字根的助记词,一共25句,每一句表示一个键位上所拥有的
字根,其中最前面的数字表示键盘位代码.
3 五笔字型单字的输入
利用五笔字型输入汉字,是将汉字拆分成具体字根,再将这些字根按一定顺序
及位置关系拼合在一起组成汉字,因此,如何将汉字拆分成正确的字根,是正确输
入汉字的关键,因为对于有些汉字,可以这样拆分,也可以那样拆分,例如,对于开字,是拆分成二和两竖,还是拆分为一和草头,这样就产生了歧义,掌握;了汉字的拆分
原则,就可以遵循一定的规则进行拆分.五笔字型输入法的汉字拆分原则概括起
来有以下几点.
(1) 取大优先
如果一个汉字有多种拆分方法,则取拆分后字根最少的那种,也就是说,要使
各个字根都尽可能的大.例如,可以将汉字击拆分成一一山或二山或一一 丨凵
几种,具体哪一种是正确的,就需要通过这一原则进行判断.在上面的例子中,只有
第二种是正确的,因此选择二山.
(2) 能连不交
一个汉字如果能够拆分成相连或相交两种情况,那么取相连的拆分方法,例如
“丑”可按相连关系拆分成乙和土,而不能拆分成刀和二。
(3)能散不连
矢字可拆分成 和大,二者间按连的关系处理是杂合型汉字,如按散的关
系处理是上下型汉字,此时,应按散的关系处理。
可以把五笔字型的单字编码规则编成一首歌诀如下:
五笔字型均直观,依照笔顺把码取。
键名汉字击四下,基本字根请照搬。
一 二三取四码, 顺序拆分大优先。
不足四码要注意,交叉识别补后边。
以上歌诀总结了编码规则的几项原则。
(1)按汉字的书写顺序进行编码
(2)以基本字根为单位进行编码
(3)每个汉字取第一第二第三末字根表。最多只取四码。
(4)汉字拆分遵循取大优先原则。
(5)字型末笔取交叉识别码。
(6)对于键名字,可连按该键四次进行输入。
2 键名字的输入
键名字是键盘上的确25个键盘位,每一个字母键都对应着一个键盘名字 即字
根表中每一个字母键盘所对应字根中排在第一位的那个,它们所对应的字母如
图2.25示
图2.25键名汉字对应的字母键
这25个汉字的编码规则是.:在所有对应的字母键连击四下.如王的编码是GGGG,
白的编码为RRRR.
3)成字字根的输入
在五笔字型字根键的每个键位上,除了键名字根外,还有数量不等的几种其它字
根.它们中间的一部分本身也是一个汉字,通常称为成字字根.
成字字根的编码规则是:
编码=键名+首笔+次笔+末笔(不足四码,加打空格键)
其中的首笔,次笔,末笔,都是指五种其本笔画:横,竖,撇,捺,折,它们
对应的编码分别为:G H T Y N
例如:表2。7列出了一些面字字根及编者按码。
表2。7 成字字根的笔画数超过了2个
——————————————————————————————————
成字字根 编码 成字字根 编码
————————————————————————————————-——
五 GG HG 力 LTN
门 UYHN 八 WTY
川 KTHH 七 AGN
文 YYGY 九 VIN
—————————————————————————————————
4)5种单笔画的输入
5种基本笔画:横,竖,撇,捺,折可以分别用笔画一,丨,丿丶乙来表示,它们的输入方法:先击两下名码,再击两LL键。
一:GGLL 丨:HHLL 丿:TTLL 丶:YYLL 乙:NNLL
5)一般汉字的输入
键名字和成字字根只是汉字中极小的一部分,绝大部分的汉字是一般汉字。在学习一般汉字的编码规则之前,要先清楚两个概念:字根码和识别码。
字根码:就是字根所在键的英文字母,例如,氵的字根码是I,人的字根码是
W,力的字根码是L,己的字根码是N等
识别码:由汉字最后一笔的笔画编号和字型结构组成交叉代码,交叉代码所对应的英文字母就是识别码。5种笔画——横,竖,撇,捺,折的编码分别是1、2、3、4、5。在字型结构中左右结构,杂合结构的编码分别是1、2、3、。把这
两种编号组合起来就形成了交叉代码,不同的交叉代码对应不同的识别码,如表2。8示
表2。8 交叉识别码
-------------------------------------------------------------------------------------------------------
左右(1) 识别码 上下(2) 识别码 杂合(3) 识别码
横(1) 11 G 12 F 13 D
竖(2) 21 H 22 J 23 K
撇(3) 31 T 32 R 33 E
捺(4) 41 Y 42 U 43 I
折(5) 51 N 52 B 53 V
——————————————————————————————————
识别码的作用是为发减少重码,加快选字。用于识别的末笔,有如下规定:
■ 所有包围型汉字的末笔。规定取被包围的那部分笔画结构末笔。如国其末笔
应取“丶”识别码为43(I)
■ 带辶的汉字规定取里边字的末笔作为末笔识别码。如连。其末笔应取丨,识
别 码为23(K)。
■ 凡以“刀,九,力,匕”结尾的汉字,以“折”作为末笔。如“仇”其末笔应取“乙”识别码为51(N)。
例如,表2。9示:
由于五笔字型规定输入一个汉字最多不能超过硬个编码,所以五笔字型根据
一个汉字被拆分出字根和个数,将其分为了类:
(1) 多元字的编码规则
含有4个或4个以上字根的汉字称为多元字,其编码为:
编码=字根码1+字根码2+字根码3字根码4
其中字根码1、2、3分别代表第1、2、3个字根的字根码,字根码4代表最
后一个字根的字根码。
表2。9 识别码举例
---------------------------------------------------------------------------------------------------
汉字 末笔代码 字型结构代码 交叉代码 识别码
——————————————————————————————————
沐 捺 -4 左右结构1 41 Y
汀 竖-2 左右结构1 21 H
洒 横1 左右结构1 11 H
叉 捺 4 杂合结构3 43 I
亿 折5 左右结构1 51 N
——————————————————————————————————
例如,输入汉字“键”按照正确的拆分原则,“键”字被拆分出厂价个字根
“钅,彐,二,丨,廴”根据多于4个字根汉字输入的编码规则,只需按顺序输入前3个字根“钅,彐,二”和最后一个字根“廴”的字根码,即输入“QVFP” 例如,输入汉字“型”按正确的拆分原则,“型”字被拆分出4个字根“一,艹,刂,土”。由于“型”字只有4个字根。因此只需按顺序输入。即输入“QVFP”
(2) 三元字的编码规则
含有3个字根的汉字称为三元字。其编码规则为:
编码=字根码1+字根码2+字根码3+识别码
例如,输入汉字“串”,先取“囗,囗,丨”,再输入识别码为K
(3) 二元字的编码规则
含有两个字根的汉字称为二元字,其编码为:
编码=字根码1+字根码2+识别码+空格
例如:;输入汉字“吧”和“邑”它们均可拆分为“口,巴”,如果此时只输入这两个编码,就不能区分出所要输入的汉字是哪一个,因此在输入所有的字根编码后,还必须输入识别码。“吧和邑”的最后一笔均为“折”,识别码的区号都是“5 ”,由于这两个汉字的结构不同,“吧”为左右结构,其识别码位号为
“1”。“邑”为上下结构,其识别码位号为“2”,因此。“吧”的输入编码为“KCN”,“邑”的输入编码为“KCB”。
6)重码处理
相对于其它的汉字输入法,五笔字型输入法含有较少的重码,当出现重码时,每一个重码汉字或词组之前对应一个数字,选择不同的数字,就能输入相应的汉字,就能够输入汉字或词组。
如果某一要输入的汉字或词组所对应的数字是“1”,则可以键入一个空格或
直接输入下面的汉字编码,迅速输入该汉字或词组。
例如:用户输入编码“FCU”,在屏幕下方提示行内将提示:
1去 2 支 3云
此时,如果要输入“去”,可按空格键或按“1”键;如果要输入“云”,则要;
输入对应的数字“2”
4简码输入
上面讲的汉字输入,是对应一个汉字的完整输入编码,即单字的全码,为了提高输入速度,将常用汉字只取其前面一个,二个,或三个字根构成简码。在五笔字型输入法中含有大量的简码,包括一级简码,二级简码,三级简码。
(1) 一级简码
从11~55共25个键位代码,根据每一键位上的字根特征,每键安排一
个最常用的高频汉字。这类汉字只要按键一次再加空格即可输入,如
表2。10示
(2)二级简码
二级简码由单字全码的前面两个字根代码组成,具有二级简码的汉字,只
要;全入其前面两个字根并按空格即可输入。如:理(GJ)革(AF)等。
(3)三级简码
三级简码的输入方法是:先;输入该字的前3个字根码,然后输入一个空
格。三级简码由于省略了末笔字根交叉码的判断,所以尽管它没有减少击键次
数。但也可得高输入速度,例如:简(TUJ)填(FFH)等。
在五笔字型方案中,由于具有各级简码的汉字总数已有5000多个,它们已
占了常用汉字中绝大多数,从而使得编码输入变得简单直观,初学者在学习五笔字型时,应尽量使用简码进行输入。
同一个汉字有时存在几种简码,例如:“在”既是一级简码,也是三级简码:
⊿ “在”的一级简码为D
5词汇编码
利用五笔字型输入法,不仅可以高速输入单个汉字,对于词组,也只需要击键4下即可 根据词组所含汉字的数目,可分为双字词,三字词,四字词和多字词,对于它们的编码 规则有如下规定。
(1) 双字词
输入双字词,只要顺序地输入词组中每一汉字的前两位,组成4位编码,例如“汉字”(ICPB),速度(GKYA)
(2) 三字词
按顺序输入第一第二个汉字编码的第一位和最后一个汉字的头两位,一共四位,例如:联合会(BWWF)解放军(QYPL)
(3) 四字词
按顺序输入每个汉字编码的第一位,组成四位编码,例如:程序设计(TYYY)艰苦奋斗(CADU)
(4) 多字词
按顺序输入前3个字编码的第一位和最后一个汉字输入编码的第一位,组成四位编码,例如:中华人民共和国(KWWL)。