声笔简码

1 概述

声笔简码通过巧妙的顶功编码技术,在保持输入法极度简单的情况下,取得了输入的高效率,达到了「比全拼还易学,比五笔更高效」的理想目标,而且能够以最小的代价克服「提笔忘字和见字忘音」的难题,是广大一般用户输入中文的最佳选择。

2 优势

声笔简码的优势可以总结为:简单性、高效性和知识性。它比拼音更简单,比五笔更高效,还有利于人们巩固语文知识。

2.1 比拼音更简单

声笔简码非常简单,具有易学、易用的优点,只需要知道用v表示零声母,用aeuio分别表示折、横、撇、竖、捺五种笔画,便可以上手使用了。与搜狗拼音、百度拼音等拼音输入法相比,它不用区分平、翘舌,不需要知道韵母,没有区分前、后鼻音等的烦恼。

根据王力德《汉字编码的普及目标体系与编码实例》的研究,在各种汉字属性中,声母和笔顺在必修系数、规范系数、简单系数和记忆系数四大方面得分都是最高的,如下表所示。

汉字属性 必修系数 规范系数 简单系数 记忆系数 合计
部首 1 0.5 0.5 0 2
字根 1 0 0 0 1
角形 0 0.5 0.5 1 2
字型结构 1 0.5 0.5 1 3
笔顺 1 1 1 1 4
笔画数 1 1 0 0 2
声母 1 1 1 1 4
韵母 1 1 0.5 1 3.5
声调 1 1 0.5 1 3.5

表中,必修系数为某汉字属性对“中小学语文课所必修”的隶属度,必修者为1,非必修者为0。规范系数为某汉字属性对规范性的隶属度;完全明确且有公认的统一标准,不产生歧义者为1;基本有公认标准,但使用时存在比较大的模糊性为0.5;没有公认标准,无论范围或分类全部都是各家任意规定,模糊性相当严重者为0。简单系数为某汉字属性对简单性的隶属度;简单、直观、易掌握者为1,有一定难度者为0.5,难学者为0。记忆系数为某汉字属性对记忆性的隶属度;某属性种类少,记忆量少,无须强制记忆,回生率低则为1;反之为0;介于两者间的为0.5。

声笔简码仅仅使用了不分平翘舌的声母和按书写顺序的笔画,所以它在必修系数、规范系数、简单系数和记忆系数四个方面都是最好的。不仅如此,汉字的笔画信息还十分丰富,给编码带来了巨大的灵活性,可以做到伸缩自如。

2.2 比五笔更高效

声笔简码具有静态编码的126个简码字和441个简码二字词,对其它字词的码长还可以进行动态调整,并且可以自动造词、自动淘汰罕见词组,使其能不断地适应输入者的需要,逐步成为专门为用户量身定做的输入法,比以速度见长的五笔字型输入法的平均码长还短得多。

根据北京语言文化大学的大型字频率统计资料,抽取其中的GB2312汉字对几个输入法的单字输入效率所作的统计分析,在字均用键上进行比较的结果为:声笔简码(3.1678)<五笔字型(3.2658)<自然码(3.3061),均未计算标点符号。也就是说,声笔简码的单字输入效率比五笔字型提高了3.09%,比自然码提高了4.37%。对于大字符集(如GBK字符集和GB18030字符集),由于增加的都是不常见的汉字,所以对该统计结果基本上不会产生什么影响。不过,需要注意的是,统计是针对典型的汉字文本得出的,是在统计平均意义上的结果,并不排除有的文本会产生不同甚至相反的结果。

上面讨论的是完全用单字输入汉字且不进行动态码长调整的情况,而实际输过程中往往是字词混合输入的,而且码长是动态变化的。由于词组的数量非常庞大,而且不同的输入法所收的词组的数量和种类都不大一样,因此要根据词频表来统计字词混合输入时各种输入法的效率是非常困难的。不过,词组输入是声笔简码的强项,字词混输加动态码长调整时,声笔简码的字均码长仅为1.8左右,大大优于五笔字型,因为五笔字型的字均码长为2.1左右。

2.3 便于巩固中文

声笔简码还是帮助人们巩固语文知识的绝佳手段。为什么呢?

现在绝大多数人使用的拼音输入法完全没有字形的信息,长期使用拼音输入法以后,往往会产生「提笔忘字」的现象,有意无意地采用同音替代,如「突破」误为「图破」、「重点」误为「终点」等;而长期使用五笔字型之类纯形码,则常常会产生「见字忘音」的现象,打字时可能出现形似替代,如「紧」误为「紫」、「租赁」误为「租凭」等。音形结合的输入法,如自然码和小鹤音形,则有利于克服这种窘境,但是需要同时掌握双拼和拆分的双形,学习难度相当大,虽然可能比学习五笔字型的门槛要低点。

声笔简码也是一种音形结合的输入法,但是用的是音里面最简单的声母(而且不分平翘舌)和形里面最简单的笔画(而且按笔顺取),所以学习难度非常低。人们「提笔忘字」和「见字忘音」基本上都只是缺少联想线索而导致想不起来了,而不是忘得一干二净。只要稍加提示,比如提示声母或者首笔,就会「哦」的一下回忆起来。故而,声笔简码以最小的代价,帮助人们巩固了语文知识——汉字的读音和字形,而且笔画和笔顺是遵从国家标准的,不是五笔字型和其他音形码那种非标准的拆分。不规范的部件和拆分仅仅是为了满足汉字输入的需要,不但不具备知识性,而且还会有误导的作用。五笔在这方面比较突出,成为五笔被许多人诟病的原因之一。

实际上,纯音码输入法和纯形码输入法都是不完备的中文输入法。纯音码输入法遇到不知道读音的字就无法输入,所以拼音输入法提供了U模式,用笔画或部件来反查拼音。纯形码输入法遇到想不起字形或者不会拆分的字也无法输入,所以就会「卡壳」,需要通过拼音来反查字形,比如有的五笔用户就干脆用「五笔拼音」混打模式,以便快速反查。所以,在实际使用过程中,纯音码也是离不开形的,而纯形码也是离不开音的。

3 快速入门

声笔简码极其简单,没有什么学习门坎,可以用一句话概括它的内容:用v表示零声母,用aeuio分别表示折、横、撇、竖、点五种笔画,采用简拼加笔画编码。

虽然声笔简码已经非常简单了,但是为了进一步减轻初学者的记忆负担,在手机上提供了助记皮肤,可以长按N键打开或者关闭助记。在打开时,给出了笔画和零声母用键(aeuiov)的提示,如下图所示。如果是在电脑上,则可以把该图放在电脑桌面上,在打字的时候帮助记忆,一般几分钟就记住了。

img

3.1 基本编码

声笔简码的编码规则和示例如下。其中,s表示声母(不区分平翘舌),b表示笔画。b为元音字母aeuio,s为剩下的21个辅音字母。

  • 单字:sbbb,即声母加前三个笔画。例如,就joei 从cuou 机jeiu 接jeie 源yooe
  • 二字词:ssbb,即各字的声母加第二字的前两个笔画。例如,关系gxua 高兴gxoo 导演dyoo 理想lxei
  • 三字词:sssb,即各字的声母加第三字的首笔。例如,计算机jsje 输入法srfo
  • 多字词:ssss,即前三字的声母加末字的声母。例如,爱因斯坦vyst 中华人民共和国zhrg

当一个字有多种不同的读音且声母不同时,则可以用多种方法输入该字。例如,「盛」对应的拼音有chengsheng,对应了c和s两个不同的声母,因而它在声笔简码中也会有两个编码,分别是ceuaseua

对于非成字偏旁部首,一般取其名称首字的声母作为它的声母进行编码。例如,「亻」的名称为单人旁,取「单」字的声母d作为「亻」的声母,可以用duii输入「亻」。不知道非成字偏旁部首的名称也没有关系,因始终可以用纯笔画的方式输入。比如,「亻」可以用uiiii输入。

对于笔画不是很熟悉的人来说,有个别汉字和偏旁部首的笔顺容易弄错,在声笔基础的附录二中罗列了出来,建议对不熟习笔画的人专门注意一下。熟练掌握正确的汉字笔画,不仅是学习中文的目标之一,也是用好声笔简码和声笔其它输入方案的前提条件,必须高度重视。因为笔画和笔顺是一种语文知识,所以系统没有为其提供容错码,即用户必须使用正确的笔画和笔顺才能输入,纠正错误的过程也是学习知识的过程。

3.2 缩减编码

声笔简码中的缩减编码(又称为缩减码),可以缩短字词的输入码,类似于搜狗拼音中的固顶字词或者五笔字型中的简码字(或称简码)。

声笔简码的单字有一、二、三级简码,分别称为一简字、二简字和三简字。一简字的例子有就j 我w 没m。二简字的例子有从cu 此ci 起qe 来le。三简字的例子有机jei 威weu 凝noe 关gou

声笔简码的二字词有二、三级简码。二简二字词的例子有关系gx 参加cj 东西dx 会议hy。三简二字词的例子有高兴gxo 设计sjo 模范mfe 决定jdo

声笔简码的三字词和多字词都没有缩减编码。

在使用声笔简码时,要尽量使用单字和二字词的缩减编码,对输入效率的提升帮助很大,因为缩减码不但码长短,而且是静态编码,不会发生改变,便于形成条件反射。

另外,声笔简码在三简的码位安排了二简词和一简字的组合,也可以节约用键,要尽量使用。例如,我们的wmd 他们是tms 进行了jxl。这种设计确定性高,比安排大量的三字词简码更容易掌握,而且不少组合使用频率还是很高的。

3.3 扩展编码

声笔简码中,单字和二字词的的四码空间很小。单字的sbbb四码空间只有21×5×5×5 = 2,625个码位。二字词的ssbb四码空间只有21×21×5×5 = 11,025

三字词的sssb四码空间也不大,为21×21×21×5 = 46,305个码位,好在三字词的数量比较少。多字词专用的ssss四码空间相对比较大,为21×21×21×21 = 194,481个码位。

与上述四码空间形成鲜明对照的是,声笔简码收录了GBK字集超过两万的汉字,收录的词组数量有48万多,其中二字词有近20万。所以,无论是单字还是词组,四码时的重码现象都很严重。特别是单字和二字词,即使比较常用的都有可能需要翻页,甚至数次翻页来输入。翻页查找属于强交互的操作,每页都需要用眼睛扫瞄六个选项,是非常耗费时间的,会大大降低输入效率,而且容易看花眼而出错。

声笔简码首创了扩展编码,利用其编码的顶功特性,通过追加两个笔画就能迅速将编码空间扩大25倍,可以快速筛选出所需的重码字词。结合后述动态码长的使用,完美地兼顾了编码空间与输入效率,既能享有巨大的编码空间,又能具有很短的平均码长,两全其美。

比如,「揪」字在第一次输入时,在输入jeie后需要按三次翻页键,然后再用a选择,如下图所示。每翻一页,都需要用眼睛扫视 6 个选项,人机交互频繁,既费眼又累心,效率很低。

声笔简码Jiu

然而,如果再追加两个笔画的话,「揪」字就成了第一选项,如下图所示。

声笔简码Jiu2

可见,在输入罕见字时,通过追加两个笔画,会大大地提高输入效率。声笔简码将四码选重和扩展编码有机结合,是一大创新,既能照顾初学者的传统输入习惯,又能让高级用户采用更快速的输入方法,做到在日常的输入过程中几乎不进行翻页操作。

搜狗拼音在输入罕见字时,也可以追加笔画或者部件编码来减少重码,但是需要用 TAB 键手动触发加码模式,同时需要空格或者数字键上屏,显得非常笨拙。例如,输入「揪」字时,要用 jiuTABpz2TAB键和数字键比aeoiu难操作得多。

声笔简码在输入词组的时候,也可以追加笔画来对付重码的重灾区,不过是回头追加的首字前两笔,而不是末字的后续笔画,这是为了增强笔画去重的能力,也是为了统一词组的扩展编码方式。

例如,「转正」一词在第一次输入时,在输入zzei后需要按七次翻页键,即出现在第八页上,然后再用a选择,如下图所示。每一页,都需要用眼睛扫视 6 个选项,人机交互频繁,效率很低。

声笔简码Zzei

然而,如果再追加第一字前两个笔画的话,「转正」就出现在第一页上,只需用e选择上屏就可以了,如下图所示。

声笔简码Zzeiea

可见,在输入重码太多的二字词时,通过追加首字头两个笔画,会大大地提高输入效率。

三字词和多字词也可以类似地使用扩展编码。比如,「旧石器」一词在第一次输入时,在输入jsqi后需要按多次翻页键,然后再进行选择,效率比较低,但是在追加首字的前两笔ii后它就出现在第一页上了。再如,「结绳记事」在第一次输入时,输入jsjs后需要按多次翻页键才能找到,而在加上首字的前两笔aa后就出来了。

3.4 编码反查

在使用简码时,特别是在学习简码之初,有时会遇到不会打的字。怎么办呢?系统提供了用笔画或拼音来反查编码的手段。在不知道读音的时候直接用aeuio按顺序输入笔画进行反查,在不知道笔画时用a引导拼音反查(注意零声母要用v)。

以下是几个反查的例子。上面是笔画反查的例子,下面是拼音反查的例子。在笔画反查的例子中,直接输入uuao后,出现了以这四个笔画开头的字;第一项是反fuuaoo,表示「反」字的编码为fuuaoo;第二项为般buuaoe puuaoe,说明「般」是个多音字,有两个编码。在拼音反查的例子中,是用字母a引导的,所以实际的输入为afang和avan,只是没有显示引导字母而已,其中an前还加了v,因为an是零声母音。

简码反查

另外,通过i引导的拼音还支持用字海两分法来进行反查, 支持查找八万多汉字,一般用于难读而易于两分的字进行反查或者GBK以外字的输入。GBK以外的字,声笔简码不提供正常编码,不能按正常方式输入,只能在两分查找到后选择输入。

下面是字海两分法查找的例子。第一个例子是想通过输入两个long来反查或者输入「龖」字。第二个例子,是通过输入「尸」和「水」的拼音来反查「尿」的编码。

image-20220326080353089

image-20220326080418448

4 技能提升

4.1 续码顶屏

在传统字词型输入法如五笔字型中,当字词的码长不足四时,需要用空格上屏,只有码长为四时的首选字词才能省略空格。在声笔简码中输入单字和词组时,只要加了笔画,在后续声母时都可以被顶上屏幕,无论是否达到最大码长都可以节约空格。所以说,声笔简码具有「顶功」,可以大大地提高输入效率。

例如,五笔字型的二码字「吧kc 给xw」和三码字「华wxf 动fcl」在后接首码时都是需要空格上屏的。声笔简码中的二码字,如「从cu 此ci」和三码字「机jei 威weu」,在后接声母时都是不需要空格的。另外,声笔简码中的三码二字词,如「关心gxo 接受jsu」,也是不需要空格的。

再如,同样是用纯单字输入「中国人民站起来了。」这句话。用五笔字型输入时的用键为k_l_w_n_uh_fhn_go_b.,共使用了 20 键。用声笔简码输入时的用键为zigir_mazoeqelel.,共使用了 17 键,其中「站」字也有可能是用 4、5 键,因为大于二码的字输入码不是固定的。用搜狗拼音输入时,则完全没有固定的输入方法,它所有字的编码默认都是动态变化的,所以它的用键会在 17 到数十键不等。

正是由于续码顶屏的优势,使得声笔简码的纯单字输入平均码长在没有动态码长调整的情况下也只有3.1678,低于五笔字型的3.2658。这是一个让人吃惊的结果,因为声笔简码的单字输入是其弱项,居然比历史上以快速著称的五笔字型单字码长还短。

4.2 字母选重

传统输入法通常都是用数字键来选择重码字词。由于击打数字键需要跨行进行,手指移动距离远,容易产生误击,一般人都无法盲打,所以会严重影响输入速度。搜狗拼音虽然可以设置用字母选择重码字词,但是必须先用空格键引导,效果大打折扣。

拼音用户对数字键的依赖程度比五笔用户高得多,熟练的五笔用户只在输入四码后出现重码时,才会使用数字键选择,有的甚至通过左右 Shift 键选择 1、2 重码来避免使用数字键,以便提高击键率,降低误击率。搜狗拼音的重码很多,前后翻页的操作很频繁,所以它把逗号和句号键作为默认的前后翻页键,以便快速、准确地翻页。但是,这样做又使得在输入逗号和句号这两个常见标点符号时无法进行顶屏而实现快速输入。

在声笔简码中,当输入的编码达到四码时,如果有重码字词,那么就用aeuio兼做重码选择键。这时,提示行重码字前显示的aeuio并不代表笔画,仅仅表示出现的顺序,其作用和传统输入法的数字选择键完全一样。不过,用户在击打aeuio时要比击打数字键方便、快速得多。

例如,搜狗拼音输入jiao时,会出现很多同音字供用数字键选择,可能的选项如下,因动态调频的原因,结果会有出入。

搜狗jiao

声笔简码则不一样,在输入juau时,出现的重码字则是用aeuio选择,可能的选项也会因动态调频而发生变化。

image-20220714071956363

再如,搜狗拼音输入shij时,会出现很多同音词,需要用数字键选择,可能的选项如下,因动态调频的原因,您的结果可能会有出入,如下所示:

搜狗Shij

而在声笔简码中,输入sjoo后,可能的结果如下。

image-20220714071713637

此时,如果要输入「视觉」一词,则用e进行选择;如果要输入「商家」一词,则用u进行选择。

4.3 动态码长

如果某个字词首次输入的时候采用了扩展编码,那么下次输入可能就只需要四键了。这就是所谓的动态码长调整,可以适应用户的使用习惯,从而提高其输入效率。

比如, 「揪」 字,在用jeieue 输入后,下次输入时可能就只需要用jeie就可以了。当然,如果此后jeie又因自动码长调整被别的单字所用的话,「揪」字就会被向后推到重码字的后面去。

image-20220707001907829

再如, 「转折」一词,在用zzeiea 输入后,下次输入时可能就只需要用zzea就可以了。

image-20220707002222056

4.4 自动词组

声笔简码具有自动词组功能。也就是说,它能够利用用户之前输入的字词来自动创造新的词组,同时也能够将用户几乎不使用的新造词组自动清除。对于少量暂时还未被清理的废词,用户不必理会,到时限后就会被自动删除。在必要的时候,如用户错误地确认了临时词组,系统也提供了手动删除的手段,方法是先将光标移动到该词上面,再按Control + Delete键来删除。注意,如果是非临时词组,需要删除两次才能删除。第一次删除时只是把它变成了临时词组。在安卓手机上的删除方法是,用左右滑动空格定位词组,再用删词键来删除。

例如,如果要造「声笔」一词,可以先按单字方式输入声和笔。然后,按词组方式输入sbue,由于系统词的重码已经超过一页,需要翻页找到声笔一词,或者追加「声」的前两笔ei来快速过滤重码,快速找到造好的词组,或者用Shift+Tab快速定位到重码词的末尾。在选择输入一次新造的「声笔」后,它的码长就会动态地缩短,下次输入的时候可能就只需要sbue了。

再如,要造「声笔码」的话,若前面已经造好了「声笔」,所以可以拆成「声笔」和「码」来输入。然后,按三字词方式输入sbme,按Shift+Tab快速定位新词,可见临时词组「声笔码」已经造好了。选择上屏一次后,「声笔码」就会成为正常的词组。

最后,如果要造「声笔简码」一词,可以先输入「声笔」和「简码」。下次按多字词方式输入sbjm时就有「声笔简码」 一词了。

当然,在用户不知道系统中有某个词组的时候,如果按照词组的方式来输入,就可能因为系统没有该词而找不到想要的词组,即发生所谓打空的情况。此时,建议用ESC键一次清楚编码,拆开打一次就能够自动造出想要的词组,供下次使用。

需要注意的是,为了避免发生组合爆炸,产生太多的垃圾词组,系统默认限制了自动造词的最大长度为5,且不能有非汉字字符。另外,在进行枚举式自动造词的时候,是以编码对应的字、词为单位来进行组合的,并不是以单字为单位的。例如,在输入声笔sbu 系列xleu 码meu后,生成的词组为「声笔系列码」「声笔系列」「系列码」,而不会生成「声笔系」「笔系列」「列码」等。另外,如果造词之后马上使用了退格键,系统就会自动删除所造的词组;中间夹杂有非汉字的话,也会中断造词。

4.5 以字代词

在设计声笔简码的缩减码时,有意未考虑一、二简字组成的二字词。所以,「经过」「没有」「大家」这些常用二字词都是没有缩减码的,只能用正常编码输入,但是二字词的四码重码很多,选择重码会降低输入效率。所以,输入这类词组的最好办法是拆开成为单字来输入。这样不但可以减少重码,而且还能够提高击键速度,当然前提是用户已经记住了一、二简字,最好是形成了条件反射。声笔简码的一简字只有21个,二简字也只有105个,并且是使用频率极高的字,经过一段时间的使用,自然而然地就会形成条件反射。只是需要用户对这类词形成拆开打的习惯。

例如:「经过」作为词组来输入的话,在四码的时候,就会与很多常用二字词如「结构」「价格」等重码。而拆开用打单字也只需要四键,然而因为没有重码,在记住后是可以盲打的,速度要快得多。同时,还可以将首选位让给常用词。

image-20220402140625561

4.6 编码变换

为了在输入中文时节约用键和避免回改,声笔简码提供了巧妙的编码变换方法,主要通过 Enter 键(回车键)和 Tab 键(制表键)来实现。这样做,实际上也分化了重码,增加了确定性。大量不是词的组合都可以通过这种方式来进行输入,从而有效地利用编码空间。注意,这个时候是没有提示的,需要用户对简字和简词非常熟习才行。在同时支持回车和Tab时,可以选择互键更好的方式来输入。

  • 两个一简字的组合,可以用两字的声母加回车或者Tab来输入。例如,「就是」[一下]「出发」「我是」「发就」等等都可以这样输入。
  • 一简字加二简词的组合,可以用三字的声母加回车或者Tab来输入。例如,「是一样」「的时候」等等。
  • 两个二简词的组合,可以用四个字的声母加回车来输入。例如,「需要多久」「麻烦你们」等等。

5 大写顶屏

声笔简码在有的情况下,可以用大写来避免使用空格或者避免回改,称之为大写顶屏。

在一、二、三码之后,可以用大写来输入后续字词的首码并省略空格。例如,输入「幸福的生活」,一般的用键是xf_d_sho,而采用大写顶屏后,用键就变成xfDSho。当然,在这种情况下大写的使用仅仅是一个不关痛痒的选项,用不惯的用户可以忽略不用就是了。

在四码之后,可以用大写将前两码对应的二简词上屏,并与后两码一起形成新的三码。这一方面可以节约空格,另一方面,也可以避免回改。例如,在dsky后输入s时,会将ds对应的二简词「但是」顶上屏幕,同时剩下kys三码。在不用大写顶屏的时候,就需要先在ds后用空格将「但是」上屏,而若忘记了输入空格,在没有大写顶屏时就得先用退格键删除ky,再补上空格,回改的成本非常高。

附录:声笔简码的编码格式

为了便于用户总结和记忆声笔简码的基本内容,现将在默认设置时的字词编码格式以浓缩的表达式方式总结如下。

  • 单字:sb^bb'(bb),即声母加前三个笔画,可选地加第四、五笔。
  • 二字词:s1s2b2^b2'(b1b1),即两字的声母加第二字的前两个笔画,可选地加首字的第一、二笔。
  • 三字词:s1s2s3b3^''(b1b1),即三字的声母加第三字的首笔,可选地加首字的第一、二笔。
  • 多字词:s1s2s3s0^'(b1b1),即前三字的声母加末字的声母,可选地加首字的第一、二笔,然后选择重码。

其中,s表示声母(不区分平翘舌),b表示笔画。b用元音字母aeuio表示,s用21个辅音字母字母表示。数字表示第几字(其中0表示末字),^表示起始顶屏码位,’表示起始码长调整位。