我學中文輸入法（二）——嘸蝦米－拓碑林

　原文刊於《刻石錄》：http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_二

　我先從輸入法的理論、系統、設計着手，學習多種正體中文用者間常見的輸入法。結果，我最快放棄嘸蝦米。主要原因是：它的字根設計得太亂、太無理。請留意，我不是嫌它341個基本字根、156個簡速字根¹⁾太多。嘸蝦米是大根輸入法，字根多是難免的，但它把字根歸類得很沒有系統，這才是致命傷。

　蝦米族當然會不同意這觀點。他們會說，字根雖多，但歸類得很易記，只不過是取形、音、義相關而已。可是，哪些字根取形，哪些取音，哪些取義？官方說「只要唸得出聲音來，大部份都取其音」，卻有大量例外，例如取形的「力、工、言、口、亞、田」和取義的「人、車、中、央、屯、曲」等，都明顯唸得出來。蝦米族說只要「多看多練」就可。不過，有哪種輸入法不是這樣的？對我這種講究道理的人來說，這不是答案。能看出規律、練出法門嗎？還是要走馬看花般看，囫圇吞棗地練，學得迷糊含混？尤其是嘸蝦米所謂取義的字根，又包含了像「曲、㣺、巴、虫、冘、旡」等並不是取義的²⁾；所謂取音的字根，也包含了像「亡、辛、牛、云、且、聿」等不是取音的；所謂取形（與英文字母象形）的字根，也包含了像「（D）、扌（J）、彡（M）、マ（T）、亞（O）、辶(W)、（H）」等難以聯想的。

　再說，取音是取聲母、韻母、英文字母諧音，還是哪種？「不、方、立、皮、竹」取聲母，「也」取韻母，「耳、爾、寅」取韻尾，「西、夕、雨、魚、于」取英文字母諧音，「月、又」取聲母和介音的英文字母諧音，「尹³⁾、永」取去掉韻尾的英文字母諧音，「酉、與、髟」等聲稱取音卻不知取甚麼音，怎唸都不像⁴⁾！「小、少、身、生、世」取聲母歸「S」，但「食、氏、升」卻歸「X」；「方、丰、飛」歸「F」，但「弗」歸「V」；「瓜、甘」歸「G」，但「弓、冎」歸「Q」。更離譜的是，「卜」取聲母卻歸「P」而非「B」；「臼」歸「G」而非「J（北語）」或「K（粵語）」；「戶」歸「F」而非「H（北語）」或「W（粵語）」（但「乎」則正常地依北語歸「H」）；「黽」讀「敏」，卻取「繩」音歸「X」；「虍」唸「呼」，卻依「據」音歸「Z」（但「據」的漢拼爲「jù」。此外，「Z」、「J」的取音輔根也歸得一片凌亂。）；「糸」一般讀「覓」，卻似乎被當作「絲」音歸「S」。這次第，怎一個「亂」字了得！

　況且它取音的字根，也以北語（包括大陸普通話、臺灣華語）爲主。如「午、瓦、文、巫」歸「W」，但前兩者粵語讀「ng」聲母，後二字粵語唸「m」聲母。還有一些字根，因爲與北語的註音符號同形，就按註音符號而歸鍵。這些歸鍵，都不易讓香港人（或其他非操北語的漢語用者）習慣，增加了非臺灣用者的學習難度。一個拆字輸入法，本應單純以字形出發，不論其音，跨越各種漢語語言發音相異之屏障的。但嘸蝦米在設計字根系統時，就已高高築起這種屏障。

　但我還未說到戲肉。嘸蝦米歸形的字根中，竟有一部份是依靠簡化漢字作聯繫的！留意，我並不是反對形碼輸入法兼及簡體字拆碼，讓簡體用者以同一套字根、規則去打出簡化漢字。能夠輸入所需的字，不致於有字無碼，始終是件好事。但我要指出的是，嘸蝦米有些輔根的歸形，以正簡轉換作聯繫。用者要先懂得那字根的正、簡兩種寫法，才能把該輔根聯繫起來。你得先懂得「婁」簡體寫作「娄」，才知道「婁省掉女」這輔根歸入「米」根；你得知道「堅」簡體寫作「坚」，才知道「臣」這輔根歸入「〢」根。請問我可以只學輸入法，而不必學簡化漢字嗎？可以嗎？可以嗎？！更莫說「臣」變「〢」並不符合簡化漢字的推類規則。

　順帶一提，嘸蝦米的官方字根表中，其實漏掉了好些形狀相似的形塊，即是有若干實際應用上會碰到的字根沒有列出來。這不是嘸蝦米獨有的問題，不少輸入法的字根列表，也會這樣省掉一些形狀相似的形塊，例如只列「食」而省掉「飠（食偏旁）」，只列「金」而省掉「釒」等。要是省略得合理，一般人靠列出的根都能關聯到省去的根，也不疑事。但嘸蝦米只列出「夂」而省掉「攵」，只列出「佳」而省掉「隹」，未免太超過了吧？這些形塊雖然外貌相似，但絕大多數人都知道是不同的字或部件。不一併列出來，難免會令人困惑。又像只列出「歹」而省掉「」，用者要拆「互」字時就難免抓破頭顱。更弊的是，一向強調容錯碼很多的嘸蝦米，偏偏不替「互」字設任何容錯碼。只列出「」而省掉「」，也使「留」的拆碼變得難記。

　嘸蝦米還有一堆簡速字根，可是簡速字根又如何歸類？繼續取形、音、義？「俞」可能取形，「並」可能取音，但有很多也不知何解，官方亦隻字不提，沒有人解釋到是依甚麼系統。蝦米族說，簡速字根可以不記，用本來的字根也可以輸入漢字，不記得就不用簡速字根。但蝦米族也說簡速字根是提升速度和減低重碼的關鍵。迴避它們，始終不是我要聽到的答案。

　輸入法規則設計上，嘸蝦米的「補短」規則也很挫敗人。一個字的末根既已取了，還要再把它「反芻」，再拆開它的尾部，取出眞末根。這種「反芻拆出眞末根」的做法，唯一好處是減低重碼率。同一鍵背負太多字根，重碼率自然高。例如說，把「少、身、生、世」都歸在「S」鍵，那麼「鈔、銵、鉎、鉪」就會重碼。但因爲要反芻再取眞末根，「鈔」的眞實取碼就是「金少ノ（ASP）」，「銵」的眞實取碼就是「金身ナ⁵⁾（ASX）」，「鉎」的眞實取碼就是「金生一（ASE）」，「鉪」的眞實取碼就是「金世∟⁶⁾（ASL）」，它們就不重碼了。然而，要是輸入法設計者在定義字根時，就已經把這些形狀裁小，分拆成兩個字根，也能達致相同效果。那麼爲何要定義這片大形塊作字根，不把它拆開，變成兩塊較細小的字根？

　「反芻拆出眞末根」的設計是很不必要的。這做法令用者在拆字過程上，並不是一直線順着去。拆字思路流程會變得不順暢。有時眞末根甚至不是原末根的一部份，而是全部，就更令人無言。比如「卒」字取「十十（JJJ）」，原末根「十」反芻，再取眞末根「十」，結果「十」這部件就被取了兩次。「口」和「囗」二字都取「口口（OO）」，整個字都反芻取兩次碼。「回」字取「口口口（OOO）」，第一個「口」是外框，第二個「口」是裏面的原末根，它反芻再取出眞末根「口」，內裏的「口」部件又取了兩次，還跟「品」重碼。（「品」字本身已取了三碼或已上，不用補末根，因此不是「口口口口（OOOO）」。）

　有時同一個部件或形塊，要補甚麼末根，也是隨機的！例如「八」字作右偏旁的字。當中「扒」字在甚麼模式都能補「㇏（N）」或「丶（A）」。「叭」字在正體中文模式只能補「㇏（N）」，在簡體模式卻可補「㇏（N）」或「丶（A）」。「汃」、「釟」、「朳」中則只能補「㇏（N）」。如果說「扒」字補「丶（A）」是容錯，爲甚麼「叭」字只在簡體模式才需要容錯？而另一些「八」偏旁的字就不用容錯嗎？

　再說，嘸蝦米即使用這方法，重碼率仍然相當高⁷⁾，它的用者可以勝出輸入速度比賽，靠的是簡速編碼。除了上方提及的簡速字根，還有個別漢字的簡速碼，例如一碼字、兩碼字、兩碼字借作字根（但有些兩碼字則不能）、加V鍵快速字等。就如上述的「回」與「品」重碼，「回」可以用「OOV」或「OOOV」出字，「品」可以用「OV」出字。這輸入法靠這些正常規則以外的特殊編碼，去簡化按鍵數目，提升速度和支援盲打。

　但這種簡速碼，根本就是開外掛。要記這些簡速編碼，基本上都要逐字去記，每個字有個別的、不同的簡速編碼，很難說得上有甚麼系統、甚麼解釋。就像我唸高中時的那個化學科老師，不仔細說清化學原理的系統、解釋，只管一味說甚麼地方公開試必出，這裏那裏多少條化學公式要死背，甚麼關鍵字不可缺少或串錯，不能用同義詞代替，原因是：「你猜改卷的評分員，會有時間逐字去嗅你的萬言論文麼？哪管你寫得狗屁不通，意思相反了，只要看到有這些關鍵字，一個都不少、不算錯，就給你滿分。」有些同學很受落這套類近補習社式的敎法，但我因此而完全讀不進腦。若要靠死背去開外掛，爲何不把這些時間花在理解正式原理、規則之上？反正都是要花時間去記、去熟習，要是去記一些表面上略爲複雜的規則，我可以一理通，百理明。要是去記這些因字而異的簡速編碼，囫圇吞棗地爲拿分、爲高速而死背死記，不求甚解，我受不了。

　官方開外掛，靠外掛才可以贏，其實在一定程度上，也反映本身的拆字系統設計並不夠理想。而且，其他輸入法也可以用同類方法開外掛。倉頡輸入法開了外掛，進化成快倉或大新倉頡，也有同樣效果，速度上更勝嘸蝦米。要單純追求速度的話，學嘸蝦米不如用大新倉頡或快倉。至於一般用者，根本就不應額外去記去背一大堆簡速碼，應該用正規的拆碼規則，取得不錯的、足夠日常應用有餘的速度，這已很好。

　誠然，蝦米族的擁躉也有不少，這種輸入法雖然不適合我，卻適合不少人。百貨應百客，我絕對尊重蝦米族對嘸蝦米輸入法的喜愛。不過看到嘸蝦米官方不時熱衷於踩倉抬嘸，有些蝦米族也中了這毒，例如把自己爭取到學校中文打字課程棄倉投嘸，視爲人生的功績⁸⁾，我想我也有必要表達另一邊的感受和觀點。要記數量龐大卻雜亂無章的字根與編碼組合——341個基本字根、156個簡速字根，472個兩碼字⁹⁾，還有加V鍵快速字、兩碼字能借作字根的部份，諸如此類，不勝枚擧。甚至有些字，擁躉還建議靠簡體拆碼來打才會有效率¹⁰⁾，要我在輸入正體字時想着簡體形狀。不論蝦米族如何緊跟官方說法，四處拿着大聲公高喊「一點也不難」，對好些人來說就是難，就是亂，就是沒條理，就是不適合。所謂的「多看多練」、「看個幾次就會了，不用背啦」，只不過是任何輸入法皆可高擧的宣傳口號。蝦米族說兩三個月內（甚至說一個月內、數週內、一週內）一定學會，但是有用者就是學不會。栽在嘸蝦米凌亂的設計和字根中，以及官方外掛裏的學習者，是大有人在的。

♪ 本作品以Creative Commons 署名-非商業性-相同方式共享 3.0授權條款授權。如欲回應，請移玉步至《刻石錄》原文。

¹⁾ 我依官網基本字根表和官網簡速字根表數的。執筆時，維基百科「字根」條目說「嘸蝦米輸入法的基本字根總共有290個」，「有79個簡速字根」，皆欺詐也。2018年晚夏再査，其說已修正。我數的時候，已沒有補上「隹」、「攵」這類被官方省掉卻會應用到的形似字根，因此實際字根數量會更多。

²⁾ 爲了節省篇幅，我已不在正文裏質疑屬於取義但取得怪的字根了。好像「佳」取「very good」歸入「V」鍵，但明明「佳」只是「good」；「斤」取「kilo」歸入「K」鍵，但明明「kilo」只是「千」。至於「日」爲何是「day」不是較直接的「sun」，「木」爲何是「tree」不是較直接的「wood」，反正不是說不通，我就由它了……

³⁾ 可是在北語裏，「尹」與「寅」是同聲同韻的，都唸yin。結果「寅」只取韻尾歸「N」，「尹」卻去掉韻尾，歸英文字母諧音「E」。氣煞人也！

⁴⁾ 在北語裏，「酉」與「又」同聲同韻，都唸you，「又」歸「U」，「酉」卻歸風馬牛不相及的「E」；「與」跟「雨、魚、于」同聲同韻，都讀yu，「雨、魚、于」歸「U」，「與」卻莫名其妙地歸「E」。還有，「髟」讀biāo，清清楚楚是重脣聲母，一點兒也不輕脣，卻歸了「V」，簡直是亂來！且莫說輕脣也應歸「F」而非「V」。

⁵⁾ 這眞末根是「斜交」。

⁶⁾ 官方只列「乚」而省掉「∟」。

⁷⁾ 嘸蝦米官方網站說這輸入法「選字率低」，但輸入法研究者泰瑞分析過，嘸蝦米重碼率是數種常見形碼輸入法之冠，在一萬三千多個Big5碼漢字中，竟有五成以上、近七千個漢字重碼！

⁸⁾ 見楊曜檜：〈經驗談〉。

⁹⁾ 依蝦米族樂園所說，已扣除標準字根中的兩碼字、簡速字根中的兩碼字、佔兩位置的兩碼字、標點符號的兩碼字。這數字準確否？抱歉，我已沒有精力去細數求證了……

¹⁰⁾ 見蝦米族樂園：〈嘸蝦米與簡體字〉、林董：〈老掉牙的中文輸入法感想〉。