声笔拼音

目前,在输入中文时,绝大多数人使用的都是全拼输入法,主要由搜狗、百度和讯飞几家大公司提供,在功能上大同小异,都是智能整句输入法。虽然随着技术的发展,全拼输入法已经取得了长足的进步,但是仍然存在以下严重问题。

  • 音节界线不清
  • 拼写形式过长
  • 字词重码过多
  • 回溯修改麻烦

通常,为了在使用拼音的情况克服以上问题,人们首先想到的可能就是采用双拼。但是,双拼的门槛还是不低,需要记住30来个韵母、3个翘舌声母和零声母的表示形式,而且仍然不能解决重码多的问题。

声笔拼音则另辟蹊径,以全拼为基础,进行适当的变形,只需花费比双拼小得多的代价,就可以取得相当于或者高于双拼的输入效率。声笔拼音是一种非常「奇特」的拼音输入法,它完全颠覆了人们对拼音输入法的认识,平均码长和重码大幅度减少,翻页键很少用得着,输入效率大大提升。

声笔拼音适合什么样的人使用呢?声笔拼音是对现有拼音输入法的优化和改进,所以它适用于正在用拼音输入中文的所有人,可以仅花费极小的代价就获得高得多的中文输入效率,而不必花更多的时间和精力去学习双拼甚至五笔等。声笔拼音将彻底改变人们对拼音输入时重码多、效率低的刻板印象,是最佳的拼音输入法升级方案。

如果您的拼音非常糟糕,对韵母的掌握一塌糊涂,声母也分不清平翘舌什么的,同时又想有一个简单高效的输入方案,那么强烈建议您使用声笔系列码中的声笔简码,它仅使用不分平翘舌的声母和五个笔画,就能取得比声笔拼音还高的输入效率。

本文只涉及声笔系列码中的声笔拼音。有关声笔系列码的总体情况请参见总体介绍。有关下载、安装和配置的方法,请参见安装配置。有关声笔系列码的发展历史,请参见发展历程。对于一些常见问题的解答,请参见常见问题。声笔系列码的其它输入方案详见各自的专题。

1 预备知识

本节介绍声笔拼音所使用的编码元素,即用汉字的什么要素来编码;编码的方法是什么;在不知道编码的时候怎么样快速反查出编码;编码在实际输入的时候是怎么运用的。

1.1 编码元素

声笔拼音的编码元素为声母、韵母和笔画,具体表示方法与现行拼音输入法有一定的差异,请注意以下几点。

  • 用v表示零声母,即作为以a e o开头的音节在形式上的声母。例如,ai ei ou就变成了vai vei vou。
  • 不区分平、翘舌音,即省略zh ch sh中的h。例如,zhou chao shi就变成了zou cao si。
  • 不区分前后鼻音,即省略ng中的g。例如,bang zong就变成了ban zon。
  • 在声韵相拼的时候,声母 j、q、x 后接以ia、ie、io开头的韵母如 ia、ie、iao、ian、iang、iong 时,要省略 i。例如,传统拼音里的 jie qiong xiang 在声笔拼音里则变成 je qon xan。
  • 将韵母 er 合并到 e,ü 合并到 u,ê 合并到 e。例如,er 变成 ve,nü 变成 nu,而ê变成ve。特别注意,ü 没有像传统拼音输入法那样用 v 来代替。
  • 音节长度超过3时,则截断为3。例如,biao变成bia,而guan变成gua。
  • 在笔画方面,同其它声笔方案一样,横竖撇捺折五个笔画用eiuoa来表示,而不是传统上的12345或者hspnz。

通过以上简单的改造,就可以取得以下奇特的效果。

  • 音节之间界限更加明确,在连续拼写的时候基本上不再需要使用隔音符排除歧义。例如,xi’anshi变成了xivansi。
  • 降低了学习门槛,不再需要区分平翘舌和前后鼻音。虽然现有拼音输入法也可以设置模糊音,但是会影响汉字转换的准确性,而在声笔拼音中不会有这个问题,因为声笔拼音中不再保留翘舌音和后鼻音的拼式。
  • 拼写形式得到了缩短。例如,zhuang变成了zua,miao变成了mia。这种对音节形式的压缩方式虽然会产生一些归并重码,但是声笔拼音可以通过直接追加笔画的方式来进行快速筛选,所以并不会成为一个问题。

1.2 编码方法

在声笔拼音中,单字的编码规则很简单,就是拼音加笔画,全码为6码,笔画不足时重复末笔来补足。例如,「笔」的拼音为bi,追加前4个笔画后编码为biueou。又如,「将」的音节编码为jan,追加前三个笔画后单字的编码为janoei。再如,「乙」的音节编码为yi,而「乙」只有一个笔画,所以要重复三次才能形成单字编码yiaaaa。

需要注意的是,在实际输入的时候,一般是不用6位全码的。

1.3 编码反查

在输入过程中,往往会遇到不认识的字,这时反查功能就派上大用场了。如果每当这种时候都要去百度的话,那就太耽误时间了。声笔拼音提供了多种快捷的反查手段,大大加快了查找编码的速度。

在不知道读音的时候直接用aeuio按顺序输入笔画进行反查。在不知道笔画时用a引导拼音反查,但要注意零声母要用v开头。

以下是几个编码反查的例子。上面是笔画反查的例子,下面是拼音反查的例子。在笔画反查的例子中,直接输入uuao后,出现了以这四个笔画开头的字;第一项是反fanuua,表示「反」字的编码为fanuua;第二项为般banuua bouuao panuua,说明「般」是个多音字,有三个编码。在拼音反查的例子中,是用字母a引导的,所以实际的输入为afang和avan,只是没有显示引导字母而已,其中an前还加了v,因为an是零声母音。

笔画拼音反查

另外,通过i引导的拼音还支持用字海两分法来进行反查, 支持查找八万多汉字。两分反查一般用于反查难读而易于两分的字。对于GBK以外的字,声笔拼音不提供正常编码,不能按正常方式输入,只能在两分查找到后选择输入。

下面是字海两分法查找的例子。第一个例子是想通过输入两个long来反查或者输入「龖」字。第二个例子,是通过输入「尸」和「水」的拼音来反查「尿」的编码。

image-20220326083229367

image-20220402090102648

1.4 助记方法

虽然声笔拼音已经简单,基本上没有什么学习门槛,但是为了进一步减轻初学者的记忆负担,在手机上提供了助记皮肤,可以长按N键打开或者关闭助记。在打开时,给出了笔画和零声母用键(aeuiov)的提示,如下图所示。如果是在电脑上,则可以把该图放在电脑桌面上,在打字的时候帮助记忆,一般几分钟就记住了。

QQ图片20220730194223

2 单字的输入

在中文里,有数以万计的汉字,而拼音音节只有400来个,所以同音字是非常多的。故而,单字的输入,对于传统拼音输入法来说,是一个非常头痛和痛苦的事情,可以说是想尽了一切办法企图来解决这个问题。

搜狗和百度之类的拼音输入法利用巨型互联网词库,在输入一般性的文本时,可以大大减少对单字输入的依赖。但是,单字的输入始终是不可避免的,在有的场合还用得比较多。这时,绝大多数人是通过翻页查找的方式来定位和选择同音字。在遇到输入同音现象严重的罕见字时,往往需要翻页数次,每页都要查看多个选项,严重影响输入效率。少数有经验的人,可能知道通过以词定字的方式来输入单字,或者通过加TAB后追加笔画或者部件来筛选重码字。然而,以词定字只是一种权宜之计,不是普适性的,有时候根本想不到适合的词。TAB后加码的方式是具有普适性的,但是操作很不方便,而且还增加了码长。另外,由于这些手段用得很少,偶而使用的时候,显得很生疏,无法做到快速操作。

2.1 重码问题

例如,在用搜狗拼音输入「疫」字时,可以在输入yi以后按TAB键再输入笔画dhpn,「疫」字就出现在当页的选项中了。

image-20211120064658859

现在,对比一下声笔拼音在输入「疫」字时的情况。在输入yi后,无需用难操作的TAB而是直接输入笔画oeu,「疫」字就出现在当页选项中。而且,在声笔拼音中,笔画的使用是非常频繁的,用户容易对aeuio表示的笔画形成条件反射,从而加快操作速度。

image-20211120065358587

把单字重码问题暴露得最充分的,当数赵元任先生的「施氏食狮史」了,以下分别用搜狗拼音和声笔拼音将标题里的这五个字输入一下,进行对比,以目标字出现在首页为度。

image-20211121161656105

image-20211121161951102

显然,声笔拼音(下图)比搜狗拼音(上图)要便捷得多,特别是每个字都节约了难操作的TAB键。合并平翘舌音后不但降低了学习难度,而且还缩短了码长,因为归并重音而产生的重码被追加的笔画有效地离散开了,并没有增加选择重码的负担。

2.2 码长问题

搜狗拼音输入「幢」字时,在输入zhuang后按TAB再输入该字的首笔竖,可以把它定位在首页。然而,zhuang这个音节有6个字母之多,加上额外的TAB键,码长非常不理想。

image-20211120071430095

相比之下,用声笔拼音输入「幢」字的话,只需在zua之后直接追加该字的首笔竖,就可以把它定位在首页。可见,从码长上来说,节约了四键,效率的提升是极为显著的。

image-20211120071538558

2.3 固顶问题

在现代拼音输入法中,所有字的编码都是动态变化的。这样的好处是,可以适应用户的使用习惯来尽量缩短码长,减少用键。

例如,使用百度拼音输入了g后,本来的选项如下:

image-20211121084635743

这时,如果继续输入gao后,选项如下:

image-20211121084714538

在用空格上屏「高」字后(有时需要输入多次),再输入g的话,选项就可能变成:

image-20211121084752630

但是,这只是问题的一个方面。问题的另一个方面是,人作为生物是具有记忆特性的,经常重复的行为,就会形成条件反射。如果在首码上固定了某个高频字,那么经过一段时间的使用,用户就可以不假思索地将该字打出来,而不必观察提示行,这样就减少了人机交互时间,提高了击键速度,从而提高了打字效率。在码长和键速之间如何进行选择?这是输入法设计随时都会遇到的问题。不同的输入方案会有不同的选择。但是,长期的实践证明,对于拼音输入法来说,首码高频字是肯定应该固定的,就是对于一般用户来讲,得到的击键提升都比码长的节约有划算。

所以,在声笔拼音中,首码高频字(又称一简字)是固定的。这些字一共有21个,它们是:b不 p平 m没 f发 d的 t他 n你 l了 g个 k可 h和 j就 q去 x下 z在 c出 s是 r人 y一 w我 v而。这些字在输入的时候,其码长不会出现在百度拼音里那种震荡现象,便于对它们实现盲打。

2.4 模糊问题

在拼音输入法中,一般都有模糊拼音设置。比如,在搜狗拼音中,模糊拼音的设置如下:

image-20211121102356125

对于南方人来说,很多都会设置为模糊前面三对平翘舌音,因为他们的普通话可能不太标准。前后鼻音的区分,对不少人来说,也是个大问题了。设置模糊音后,不管输入哪一个音都能够打出来,相对于降低了学习门槛。但是,这样做也有副作用,那就是牺牲了编码空间,同时也增多了重码。

在声笔拼音中,也采用了模糊音,但是其目的不仅仅至于降低学习门槛,而且还在于提高输入效率,所以它的模糊是强制的。声笔拼音对韵母的模糊更加激进,不仅仅是不区分前后鼻音,而且韵母的长度不会超过2。例如,biao会截断为bia,xiong会变为xon,shuang会不变为sua。不过,l与n,f与h,r与l,这几对是没有模糊的。另外,在输入编码的时候会显示出前缀相同的所有字。例如,输入bi后,还可能出现bian、bie、bing等发音的字。这有利于缩短常用字的码长。

当然,这样的模糊拼音会产生不少的同音字词,但是由于声笔拼音有直接追加笔画的手段,可以有效地抵消同音重码的副作用。

image-20211121104729491

而在搜狗拼音中,输入bi后只会出现发音相同的字,而有的字并不一定常见。

image-20211121105341246

3 二字词的输入

二字词在现代中文里是最常见的。根据北京航空航天大学等单位承担的“七五”国家重点科技攻关项目“现代汉语词频统计”所得的结果,二字词所占累计字数比例超过了一半,高达53.32%。

image-20211120103634307

在使用全拼的情况下,由于汉语的音节只有400来个,所以二字词的编码空间大概有400×400=160,000个码位。这个空间看起来还是不小了,但是因为分布极不均匀,因而重码现象也是相当严重的。随着收词数量的增加,当量级到达数十万甚至上百万时,重码现象还会越来越严重。

3.1 重码问题

例如,用搜狗拼音输入「时势」,会出现在第五页的最后一项。由于重码词的顺序会有动态调整,不同的用户的结果可能会有所差异,但是不会影响我们理解这个事实的存在。

image-20211120114341884

为了避免多次翻页查找,搜狗拼音提供了一种通过笔画过滤重码的方法,即先用TAB引导,再输入首字的笔画,这样可以将「时势」提前到首页,如下所示。

image-20211120115857337

这种过滤重码的方式比起翻页查找要好得多,但是仍然不理想,因为TAB不好操作,而且增加了一次击键。另外,如果重码词首字的前几个笔画是一样的话,过滤效果就不好。

反观声笔拼音。如果不增加笔画的话,重码现象会更加严重,因为它是不分平翘舌的,「时势」一词会出现在第七页的第二项。当然声笔拼音的重码顺序也是动态变化的,可能你的结果会有差异,但是不会影响我们对原理的理解。

image-20211121070053129

正是因为有了极为方便的直接笔画筛选功能,才使得声笔拼音无需为重码而发愁,而且码长更短。它在筛选重码加笔画时,无需TAB引导,而且既可加在首字后面,也可加在末字后面,还可以同时加在首字和末字后面,非常灵活方便和快捷,如下所示。

image-20211120123304742

image-20211120123516711

image-20211120123707423

3.2 输入格式

拼音输入法在输入二字词的时候,格式可以非常灵活,可以都用全拼,可以简拼加全拼,可以全拼加简拼,也可以都用简拼。下面,以输入「创新」一词为例来说明这个问题。

在搜狗拼音中,至少可以用以下几种格式来输入。注意,用cx时的结果是经过一次翻页的。

image-20211121111457117

image-20211121111541724

image-20211121111633345

image-20211121111740791

在声笔拼音中,由于能在任意字后添加笔画,任意字都可以使用1至6码,所以可用的格式就更加丰富了。值得注意的是,由于声笔拼音对拼式进行了压缩,产生了归并重码,所以使用不当的话,会需要更多的翻页查找。

image-20220402090920975

image-20220402091311449

image-20220402091442319

image-20211121125326321

image-20211121125516620

那么,问题来了。面对如此灵活的输入格式,有的高效,有的低效,用户该怎么选择运用呢?通过对拼音输入法用户使用方法的长期观察和总结,可以归纳出以下启发式的原则。

首先预判待输入二字词的常用程度。如果是很常用的词,那么就先输入两字的首码,即全用简拼。如果当页命中就选择上屏,否则继续输入第二字的韵母。例如,要输入「才行」一词,预判觉得它挺常用的,但首页没有,需要继续输入韵母。

在搜狗拼音中,输入的情况如下。在加入韵母后,「才行」出现在首页的首位了。

image-20211121132440814

image-20211121132515467

但是,如果想要输入的是「畅行」而不是「才行」的话,就需要翻页几次才能找到了。

image-20211121134502442

image-20211121134538622

image-20211121135551615

image-20211121135634005

image-20211121135717689

所以,预判不准的代价有时候是比较大的。不过,在声笔拼音,可以有更多的办法,输入韵母后还可以再追加笔画,如下所示。

image-20211121134946472

image-20220402091311449

image-20220402093455375

运气好的话,可能加一个笔画就出来了。但是,运气不好的时候,还是需要多加笔画,此后都可能还是需要多次翻页。预判不准的成本仍然是很高的。

因而,除非特别有把握,一般的人倾向于先输入首字全拼加第二字简拼。如果当页命中就选择上屏,否则继续输入第二字的韵母。这样的话,可以大大地提高命中率,但是付出了增加码长的代价。现在,以输入「双唇」一词为例说明一下。

在搜狗拼音中,输入的情况如下。在加入韵母后,「双唇」出现在首页的首位了。

image-20211121141401327

image-20211121141540096

在声笔拼音中,情况是类似的。

image-20211121141715202

image-20211121141734235

但是,可以看出,声笔拼音的码长短了很多。这得益于声笔拼音采用的压缩编码和前缀模糊特性。

即使是不常见的二字词,如果刚按照上述方式输入过了,那么在当前的局部语境下,仍然可以采用先输入简拼的形式来输入,能够节约用键。比如,上例中的「双唇」,在最近输入过以后,只用sc就可以了。

image-20211121155222082

3.3 模糊问题

模糊拼音的作用在词组中的体现比在单字中更加充分。在声笔拼音中,不仅可以像一般拼音输入法那样模糊平翘舌声母和前后鼻音,而且是强制性的,必须模糊,以便提高编码空间的利用率,也便于简化输入规则。更进一步,声笔拼音采用了激进的前缀模糊法,即每个字输入1-6码都可以,远比一般拼音输入法灵活多样。

例如,输入「疫情」一词时,采用的输入码形式最多可以有6×6=36种之多,包括yq yqin yiq yiqin yiqi yioq等等。但是,并不是任何一种形式在任何情况下都是同等的有效。弄清楚在哪种形式下适合采用哪种形式,是一个非常关键的问题。建议采用上一小节介绍的启发式原则,结合自己的使用经验来加以灵活运用。对于「疫情」一词来说,第一次输入的时候,采用yioq是最有效的。

image-20211123073141246

而采用类似全拼的yiqii输入则会有很多重码,重码的第三页才有「疫情」出现。

image-20220402093931713

image-20220402094010809

image-20220402094040298

不过,这时声笔拼音仍然比一般拼音有更加便利的手段来挽救,因为可以再追加一个末字的笔画,就可以把「疫情」提前到首页。这就是前缀模糊法的强大之处。除此之外,还可以通过2.2.5小节讲的定位修改来纠正。

image-20220402094329366

3.4 隔音问题

在一般拼音输入法中,有的拼写形式是有歧义的。为了明确音节界线,在电脑上需要加隔音符',在手机上则需要用专门的分词键。

例如,在全拼的时候xian还可能是xi'an。使用搜狗拼音时的输入情况入下:

image-20211124064402027

image-20211124064454676

如果上例采用混合显示也基本上能解决问题的话,那么下例就完全不管用了。这两例都是用的搜狗拼音,图中上面的是没手动加分隔符的,下面的是手动加了的。没有手动加分隔符时,简拼就失效了。

image-20211124064915359

image-20211124064955179

我们分析一下就知道,上文前一个例子的音节歧义是由零声母音引起的,而后一个例子的音节歧义是由翘舌音引起的。如何才能分清音节界限呢?声笔拼音的解决办法是,用v来表示零声母,同时将翘舌音归并到平舌音,即zh ch sh分别归并到z c s。这样以上两例的输入将变为如下图所示,在输入的时候就一定明确了音节界限,无论是全拼还是简拼都是这样。

image-20220402094612460

image-20220402094631305

image-20211124065628381

3.5 定位修改

在发生输入错误而需要定位修改时,一般拼音输入法是通过用箭头键移动光标或者Ctrl+音节首字母来定位的,但是这些方法效率低、操作难度大。声笔拼音提供了一种快速、方便的定位方法,可以利用数字 1234 将光标一次性地定位到待定的第 1 至 4 个音节之前,用 5 将光标定位到最后,而 TAB 可以快速从当前位置向前逐个音节移动。

例如:如果本来想输入「御用」,但是输成了yiyon,发现有错,用退格键删除四个字母后进行修改的话成本太高,用Esc键清提示行重新输入也不划算。

image-20220402094750240

于是按2定位到第2音节yon之前(即第1音节yi之后)。

image-20220402094834704

接着,按一次退格键删除i,再输入uu。为什么多加一个u,这是因为考虑到「御用」一词不常见。

image-20220402095308409

最后,按5定位到编码的末尾,就完成了修改。

image-20220402095402889

4 三字词的输入

使用拼音输入三字词时,与输入单字和二字词相比,面临着很不一样的问题。

4.1 重码问题

对于三字词而言,如果采用全拼,那么编码信息已经足够丰富了,重码已经不是一个问题。这时,问题的症结在于码长太长而导致的效率低下。

例如,「互联网」一词,用搜狗全拼的话,需要10码,加上空格的话需要11键才能上屏。

image-20211124072703027

即使采用声笔拼音,拼写形式得到了一些压缩,仍然需要8码。

image-20220402100103511

所以,为了提高三字词的输入效率,人们在实践中往往采用其它输入格式来缩短码长。

4.2 输入格式

声笔拼音输入三字词时的格式可以多达6×6×6=216种,采用哪种格式最好呢?推荐的方法是,先采用全简拼输入。查看当前页的候选项是否命中,没有则逐码追加末字的编码并观察候选项的变化。有则选择上屏,若已有二字词或单字候选项出现,那么说明系统中没有该词。这时,要用2或3定位到第二、三字前,对前一、二字进行修改,补充编码以输入正确的字词,选择上屏后,光标回到末字后。重复以上操作直至完全正确为止。

例如,要输入「计算机」一词,一般只需要输入jsj,该词就会出现在首位或者当前候选页,可以用数字键选择上屏。

Snipaste_2021-11-27_06-58-13

但是,若要输入的是「教书匠」,输入jsj后在当页候选中没有。这时,再补充一码,该词就出现了,可以用9选择上屏。

Snipaste_2021-11-28_12-11-54

可是,再假设要输入的是「鉴赏家」,输入jsja后在当页候选中仍然没有。这时,再补充一码末字的首笔,该词就出现了,可以用7选择上屏。

Snipaste_2021-11-28_12-19-28

然而,如果要输入的是「建设奖」,输入到jsjaao后在当页候选中仍然没有。这时,判断前两字是一个常见的二字词,于是用3定位到第三字前,准备修改前两字。

image-20220402100250103

image-20220402100319017

接着在jj后追加「设」字的韵母e,前两字就便成了「建设」。

image-20220402100351744

此时,「奖」已经在当前页,用8选择上屏即可。这样,也就同时造好了这个系统中原本不存在的三字词。

image-20220402100429528

以后,接下来用jsj就可以输入「建设奖」了。

Snipaste_2021-11-28_12-51-25

4.3 模糊问题

声笔拼音特有的前缀模糊法在上一小节追加末字编码时已经有所运用。前缀模糊在输入三字词时的另一种用途是,当觉得重码可能会很多,可能会不出现在首页时,首字可以用2、3码,而不是1码。

比如,声笔拼音输入「军事家」可以只用jusj,其中「军」的拼式只有前面两码,同样提示了这个词。

Snipaste_2021-11-28_16-43-47

但是,对于搜狗拼音来说,前缀模糊在多数情况下是不管用的,输入jusj后,不能提示「军事家」。

Snipaste_2021-11-28_17-03-25

只有在输入完整的拼式jun后,才会提示「军事家」,如下所示。

Snipaste_2021-11-28_17-04-25

4.4 隔音问题

声笔拼音的音节界线是完全确定、毫不含糊的,它的韵母没有辅音字母,而且零声母必须用v来表示,不会产生音节混淆的问题,因此也就用不着使用隔音符。

比如,声笔拼音输入「公安局」,用简拼为gvj,清晰明了。

Snipaste_2021-11-28_17-12-01

然而,在百度拼音中,是无法用简拼gaj来输入「公安局」的。

Snipaste_2021-11-28_17-11-18

必须在a之前手动地加入隔音符’,而且「安」字的拼式要输入完整,才能提示「公安局」一词。

image-20211204074051291

4.5 定位修改

对于三字词来说,定位修改除了用于出错时而外,还常常用于预估系统中没有将要输入的三字词时。这时,最好是三个字都用全拼。比如,假设知道系统中没有「三字词」,就可以先使用这三个字的全拼。

image-20220402100553170

由于系统确实没有需要的词组,于是按2定位到「支持」之前。

image-20220402100642215

按空格选择「三」字上屏后,光标回到末字后面。

Snipaste_2021-11-28_16-20-43

再追加前两笔,首选项即变成了「字词」,于是用空格上屏就完成了新词的输入。

image-20220402100820595

5 多字词的输入

5.1 重码问题

对于四及以上字构成的多字词而言,如果采用全拼,那么编码信息比三字词更加丰富,几乎没有重码问题。但是,码长太长而导致的效率低下问题则突显了出来。

例如,输入「风光无限」,若使用全拼,肯定是没有重码的,但是即使用声笔拼音也需要11码之多,效率堪忧。

image-20220402100958353

所以,这时要考虑要更紧凑的输入格式来提高输入效率才行。

5.2 输入格式

在输入已知的多字词时,应首先考虑用简拼格式来进行输入。同样是输入「风光无限」一词,使用简拼的话,四码就够了。

image-20211204081910993

5.3 模糊问题

对于多字词来说,采用前缀模糊来输入的意义不大,用键仍然过多,对增加确定性的作用也不大。

image-20211204083554148

5.4 隔音问题

由于多字词一般采用简拼来输入,声笔拼音拼式的明确性体现的优势就特别明显。

例如,「斗志昂扬」一词,用声笔拼音的简拼是没有歧义的。

image-20211204084127418

而使用百度拼音时,则成了下面这样了。只能通过在a之前加隔音符来解决,但是有时候会忘记加隔音符,回改起来很麻烦。

image-20211204084243800

5.5 定位修改

在输入新的多字词时,经常会用到定位修改。这时一般先用全拼输入,如果转换不正确,再进行修改。

例如,首次输入「声笔拼音」时,按照全拼试输,发现末字只输入y就行了。

image-20220402101122144

用2定位在首字之后,用8将可以选择「声」上屏。

image-20220402101157657

光标回到编码的末尾。

image-20211204085115409

再用2定位到第一个未转换的音节之后,补充「笔」字的首笔u(撇)。

image-20211204085235153

用空格上屏「笔」字后,「声笔拼音」一词就确定了,再次可用空格整体上屏。

image-20220402101306248

6 语句的输入

现代拼音输入法设计的初衷就是希望能以语句为单位进行输入,所以又称为整句输入法。虽然现在有大数据的支撑和人工智能的助力,在效果上有确实也很大的进步,但是真正的整句输入仍然面临巨大的问题,以至于绝大多数人还是以字词为单位在使用整句输入法。为什么会如此呢?究其原因,有以下几个方面。

(1) 编码效率低

拼音作为编码来说,其效率太低,导致平均码长过长,超过了三码。汉语拼音的设计初衷是用于注音识读,所以遵循了音素化和国际化的原则。在这些原则的指导下,由于普通话自身的特点,使得拼音字母的利用效率很低,存在大量冗余。从编码的角度来说,用 26 个字母表达 400 个音节,每个音节只需要不到 2 个字母,因为 26×26=676,可用的编码空间远远大于 400,而汉语拼音却用了超过 3 个字母,所以编码效率会低。

(2) 确认成本高

整句的转换结果在输入的过程中可能会不断地发生变化,所以不到输入结束是不能判断其正误的,能够判断正误的只有输入的拼音串,拼音串不会发生变化。然而拼音并不是文字,人们对它的识读能力是很弱的,最多只能快速找出刚才输入的一两个音节的错误。因此,在输入过程中,最多只能做到输入的拼音串尽量不要出错。在一句话输入完成后,用户不通读一遍转换结果,是无法知道对错的,即使结果完全正确,这一步都是少不了的,而且句子越长判别正误的成本越高。

(3) 回改成本高

如果在上屏前确认时发现了错误,就需要进行回改。错误可能发生在一句话的任何位置,可能是转换结果有错,也可能是输入的拼音串有错。发现错误的位置后,需要先定位才能修改,其定位方法一般是用左箭头键逐个音节向前移动,用右箭头键逐个字母向后移动。箭头键的位置远离本位键,操作跨度大,缓慢、费时。还有一个很少人知道的方法是用 Ctrl 加字母键来定位,其特点是用键次数少,但是操作难度大。

(4) 残错概率大

不少人习惯于在输入过程中监视转换结果,在输入最后一个字词时就不再观察转换结果,然而可能会正是这最后一个字词又导致前面已有的结果发生变化,导致错误。这种错误,用户往往不容易发现,使得残错率升高,因为他不自觉地会认为,前面是正确的,最后一个选择也正确的话,就不会有错了。另一种情况是,明明知道还有错误,但是因为觉得修改太麻烦了,就不愿意修改而直接上屏了;这在打字比赛之类的紧急场合和聊天之类的不严肃场合是很常见的。

声笔拼音通过巧妙的编码设计,对拼音进行了大幅度的压缩,同时可以利用快速的数字定位修改来降低回改的成本,但是仍然不能彻底解决以语句为单位进行输入时面临的严重挑战。

image-20211204093807608

image-20220402101436108

同样是输入「中国文化真是博大精深」,声笔拼音比搜狗拼音节约了一些用键,但是码长太长导致的效率低下问题仍然存在。相比下面的以词为单位的输入,使用了太多的按键。

image-20211204094429082

image-20220402101517714

image-20211204094505228

所以,在使用声笔拼音的时候,建议用户采用分词的方式进行输入,而不要以语句为单位来输入。