拓碑林

10月 26 週三 201617:41
狗肉字根我不受

　原文刊於《刻石錄》：http://founder.acgvlyric.org/iu/doku.php/輸入:狗肉字根我不受
　中共治下的大陸，曾有一輸入法，名曰「認知碼」，是甚麼「國家『八五』重點科技攻關項目926工程」的成果之一。嘩，好不巴閉，小鳳姐云：「齊鼓掌！」啪啪啪。雖然大家根本不明白一個輸入法有甚麼「重點」的科技要「攻」甚麼「關」做甚麼「工程」，甚至不知道甚麼「八五」甚麼「926」是年份月份日子項目數量還是甚麼瞎扯吹牛皮。它曾通過國家敎委的技術鑑定，曾在廣東、天津和北京一批學校裏試驗，還聲稱「效果很好」，打算在一九九五年推向全國中小學。然而，據中文維基百科記載，當時有硏究者在《計算機世界》撰文批評過它，以大量分析和數據指出它不宜推廣。後來，它像綠壩娘那般，在花了國家不知多少錢後就無疾而終，人間蒸發。
　認知碼的字根系統是怎樣的？據資料，它有四百個多字根，比大陸許多形碼輸入法都要多。硏究者撰文批評它時，就列出多數輸入法的字根數目作對比，直接指出字根越多越難記難學。不但學習者難以全部熟記，甚至連發明人也出糗。明明設了「朱」這個字根，但連發明人自己都忘記，把「朱」的編碼設定爲「ノ、未」，其他「朱」部件的字也是如此，「朱」這字根就變成沒有用的垃圾。而且這不是孤例，認知碼的許多字根，都像「朱」一樣可以再分拆作兩個或多個字根。當中有些字根使用率不高，萬一眞的碰到它，用者就很難搞清楚到底要再拆開，還是不要再拆。例如在「鼠」、「黑」、「骨」要拆開的同時，「俞」、「愛」竟然不用再拆，這點就被撰文的硏究者擧出來批評。
　認知碼歸鍵方法，是看字根在北語中唸甚麼聲母。例如「韓」字拆做「十」、「早」、「韋」，「十」是「shi」，「早」是「zao」，「韋」是「wei」，於是要打「SZW」。如是者，明明是取形的輸入法，思維卻要同時花在發音上。有好些字根，由於並不成字，發明人還人爲地賦予它們讀音，增加學習困難。同一鍵上也有太多字根，用者連想用鍵盤貼紙來幫助學習都不能。
　硏究者還批評，認知碼重碼率高，簡碼的使用不科學。
　現在認知碼皮已收。這絕對不是壞事，因爲它只是是個負面示範，讓人看到設計不良的輸入法會是甚麼樣子。可是，有種輸入法的字根系統，問題跟認知碼「不相伯仲」，甚至「不甘後人」，卻在其敎徒傳銷下大行其市。這種輸入法，名叫嘸蝦米。

　嘸蝦米，官方在「字根『總』表」上列出三百四十一個字根，然後又在「簡速字根總表」上多添一百五十六個，共計四百九十七個字根，比認知碼還要多近一百個。當然也難以使用鍵盤貼紙。
　嘸蝦米的字根中，不論普通字根還是簡速字根，都有許多大形塊，與認知碼相同。若屬於簡速字根，你最好不再拆開它，但也可以再拆。它與認知碼一樣，在「鼠」、「黑」、「骨」必須拆開的同時，「俞」、「愛」就不用再拆，可以整塊輸入。不過，因爲「俞」、「愛」屬簡速字根，要是再拆了，也可以的。
　至於普通字根，原則上不可以再拆，要取大根。但偶爾又會有容錯碼，錯誤地再拆了也可以輸入，卻不一定有。例如「微」字，「兩撇一座山再加一橫」竟然是一塊字根，要先取。接着取左下角的「〡」，中下方的「儿」，和最右旁的「攵」。不過若拆細了，變成「兩撇」、「〡」、「山」，再加最右旁的「攵」，也容許的。但如「髟」字，就不可以再拆，視爲一塊字根，而且沒有容錯，拆細了就無法輸入。
　簡速字根最好直接輸入，但也可以再拆細。普通字根原則上不可以再拆細。不過部份字設了容錯碼，誤拆了普通字根仍可輸入。用者不但要記住哪些是字根，哪些不是，還要記住哪些字根屬於簡速者，哪些卻只是普通字根，然後才可以知道，他應不應、可不可以再拆細。這比認知碼還複雜，要記住的東西比認知碼還多、還亂。
　嘸蝦米的字根歸鍵，當中有一堆都與認知碼一樣，視乎其北語讀音。卻不一定像認知碼般按其聲母。也許按其韻母、韻腹、韻尾、整體諧音，甚至不知甚麼音來歸鍵。跟認知碼一樣，它亦包含了不成字部件的人爲造音。例如上方說過的「髟」，它在北語裏明明讀「biāo」，卻人爲地替它造了個不存在的「v」音。而北語「b」聲母的「卜」字，卻歸到「P」鍵裏。讀音相同的字，或者只有聲調不同的字，不時會歸到不同的鍵裏。有時還好像摻雜閩南語（但一郎不懂閩南語，無法肯定）。
　但同一時間，嘸蝦米又有不少能唸出來的部件，不依發音，而依跟英文字母形似，或者跟其他字根形似，或者跟英譯的首字母等關係來歸鍵。到底一個字根，甚麼時候依音，甚麼時候按形，甚麼時候取英譯，根本任發明人是但噏，沒有準繩可從。學習者即使知道某個形塊是字根，也未必能記住它到底是以形、音還是義來聯想，不同的聯想方法會互相干擾，徒添混亂。而且這些形似或英譯，又不乏甚爲牽強者。諸如說「亞」形似「O」，說「巾」形似「N」，說「辶」形似「W」，說「佳」譯作「very good」而不是「good」等等。
　嘸蝦米字根還有兩大問題。首先，正常分拆漢字時，許多人都會拆到的形塊，如「艹」、「罒」、「コ」、「攵」、「隹」等，都不在字根表裏。那即是要再拆細，例如把「艹」拆成「十十」嗎？原來不是，而是要借用表上另一個字根「廾」！「罒」要借用「皿」，「コ」要借用「ユ」，「攵」要借用「夂」，「隹」要借用「佳」！中文維基百科的「嘸蝦米輸入法」條目，說「如果沒有該字根，在拆字時要借用樣貌相似的字根」，還稱這是「潛規則」——官方沒說出來，但在分解漢字時實際上會用到。這個所謂「潛規則」的說法已近乎替官方狡辯！這完完全全是一郎在上一篇文章中所說，用者要煲周打蜆湯，卻無法找到蜆，要硬着頭皮用蠔來權充！那麼煮出來的，還是周打「蜆」湯嗎？
　而且用者若養成了習慣，以差不多先生的心態對待字根形狀，有時又會中伏。比如「犂」的右上角，嘸蝦米編碼是視作字根表上的「ㄉ」，把兩筆的「勹」與一筆的「ㄅ」相混。若用者習慣了，看到「勹」時都視爲字根表上的「ㄅ」，那就踩地雷了。兩筆的「勹」與一筆的「ㄅ」是否要區分，連官方字根表都自相矛盾。又如表上沒有「无」這字根，用者若眞的在字根表上找貌似的「旡」字根借用，又中伏了。這次「无」要拆細作「一、尢」。甚麼時候借用貌似字根，甚麼時候細拆，根本無所適從。有好些字根，甚至完全沒有在字根表上列出，嘸蝦米査碼程式的製作者還在blog上沾沾自喜，將之稱作「隱藏字根」，叫用者用査碼程式找出來¹⁾。這明明不是甚麼光彩的事！
　其次，嘸蝦米字根雖多，卻往往無法區分近形的字。例如「干」字、「千」字、「干」字豎筆變撇、「千」字豎筆變撇，四者都歸在同一鍵上。因此「干」和「千」重碼，「天」和「夭」也重碼。嘸蝦米官方還特別說，把字根設定成這樣，「刊」和異體「刋」就不用編成不同的碼，如此云云。謬矣哉！「刊」讀「看」平聲，指刊刻或書冊；「刋」唸「千」去聲，解作切。昔日執字笠時代，曾有報章誤用，以「刋」代「刊」，還遭讀者投函指正。兩字雖是近形，卻不是異體，其區分的關鍵正正在首筆。有些字有異體寫法，爲異體多設一組編碼，技術上不難，嘸蝦米本身也有不少異體碼。但要有效區分形似異字，才眞正考輸入法設計者功夫。爲了很容易解決的支援異體問題，令眞正需要分辨的關鍵差異無法區分，造成「結構性」的重碼——即是有一些常用偏旁重碼，導致含有該偏旁的一系列字都會重碼。這樣的字根系統怎可能給高分呢？
　只要肯睜開眼睛，大家都可以看到，嘸蝦米字根系統凌亂無章，自相矛盾。這點是客觀事實。差在看倌在主觀感情方面是否願意承認。早陣子在百度倉頡帖吧上，有人在網上推薦嘸蝦米給別人，就推銷它「非常易學」，聲稱自己只花了四小時去背嘸蝦米字根，說：「嘸蝦米字根是亂，但真的好背！」如此云云。誠然，有些人記憶力好，給他一堆凌亂的東西，只要說明必須記住，他就自己會找方法牢記。但不可以因他的能力高，就認爲其他人也可以記住，也可以接受如此凌亂無章的字根系統！正如一郎唸中學時，化學老師以補習社式的雞精敎法，不好好解釋化學現象背後的細緻科學原理，一味說甚麼化學公式要背，還眞的要我默書般背默；一味說甚麼關鍵字是重點，考試時必須寫出來不可串錯，但當中的過程可以亂寫：「沒有人會理會，你以爲改卷佬有閒情嗅你的解說麼？」有些同學很喜愛這種補習社式的敎法，但我在他敎導下，無法眞正了解背後的原理、操作，初時依他所說不斷死背，還勉強低空略過，後來東西多起來，就墜機了。
　除了我自己，我也從網上接觸到好些人，覺得嘸蝦米字根系統雜亂非常，甚或認爲它是「渣」。當中有已使用嘸蝦米多年的朋友。然而，如果你在搜尋引擎上找，或者瀏覽一些台灣的輸入法討論板塊，卻甚少看到這種聲音，相反，有許多人都不斷說嘸蝦米很好學、字根很好記。說得動聽點，這叫傳銷做得好，說得難聽點，這叫三人成虎。傳銷時掛着「字根很好學」的羊頭，販賣凌亂的、貨不對辦的狗肉字根系統。誠然，有朋友記性好，或其他原因，了解過以後，自己選擇去接受、去學習這套字根系統，我絕對尊重。不過若有人罔顧事實，散播「嘸蝦米字根很好學」這種失實傳銷口號，我自問沒有容下指鹿爲馬的能力，接受不了。
　還有一種叫快碼的商業輸入法，跟嘸蝦米一樣愛以謊言吹捧自己，並攻擊其他輸入法。而它的字根系統，缺點也跟嘸蝦米相似。例如宣稱快碼字根與英文字母象形，卻不乏牽強者。例如說「同、內、用」像「M」而「月、肉、円」像「N」；說「國、田、甲、曲」像「U」而「山」像「V」；說「戈、戊、民、瓦、成」像「C」；說「可、勻、勿、司」「D」等。字根的歸鍵也混雜英譯等其他方法，例如「木」取「T」（tree）、「土」取「G」（ground），並不統一以形似來歸鍵。字根時常無法好好區分近形偏旁，導致「結構性」的重碼。比如「金」旁和「食」旁，「方」旁、「皮」旁和「反」旁，「未」旁、「朱」旁、「耒」旁和「乘」旁等，全都重碼，其字根比嘸蝦米區分能力更差得多！但字根系統着造成這麼多的重碼，基本上每組輸入碼的候選字都一大堆，快碼的發明人居然膽敢聲稱其重碼率只有約5%，即是比倉頡還低！快碼也聲稱它平均輸入2.1個鍵便可打出一個中文字，即是比速成還少！如此指鹿爲馬，掛羊頭賣狗肉，我們眞的要相信嗎？

(繼續閱讀...)

內木一郎發表在痞客邦留言(0) 人氣(112)

個人分類：輸入篇

▲top

10月 22 週六 201601:54
字根不良難煮字

　原文刊於《刻石錄》：http://founder.acgvlyric.org/iu/doku.php/輸入:字根不良難煮字
　夫烹飪，重者有二：一曰食材，二曰煮法。食材不佳，雖有神技難調美食；烹煮乏法，有鮮材亦烹不出佳餚。
　凡形碼輸入法，皆與烹飪同。其重者，一爲字根，二爲取碼規則。字根如食材，取碼規則猶煮法。二者之中，任一不良，亦難言好輸入法。今天先說字根。
　字根是形碼輸入法裏用以組字的元素。用者要組出一個漢字，先要掌握全套字根，了解它有甚麼形塊部件，選甚麼部件出來組字才正確，以及這些部件要按哪個鍵才可獲得。跟選擇正確食材，以及知道食材要到哪裏獲得，是同樣道理。
　若形塊部件沒有系統，用者難以全套熟記，就如同他本要煲周打蜆湯，卻尋遍不獲半隻蜆，只覓到蠔來權充。那麼，任他怎樣煮，都煲不出周打蜆湯。即是說，用者得不到正確的字根，結果組嵌不到要輸入的字。
　因此，把字根設計得有系統，令用者容易掌握，是輸入法設計者首要之務。字根系統的設計，是判定形碼輸入法好與壞的第一步。若設計得沒有系統，用者沒有章法可以好好掌握全套字根，記不住字根系統裏的每一個形塊部件，以及它的歸鍵，這輸入法就等於連地基都打不穩，是失敗中的失敗。
　爲使字根系統良好，不少形碼輸入法設計者都各出其謀。

　倉頡和大易用的都是視覺原理。它們的設計者，先確立約數十個基本字根，這些基本字根本身都是能獨立成字、能簡單地喊出來的。然後把另一些形狀上相關的字根，歸納到基本字根之下，成爲它們的輔根。
　例如倉頡字母「月」之下，就有「月」的外框「⺆」和變體「冂」、「冖」，以及把「月」形推斜的「」和稍加變形的「爫」。或者像大易的基本字根「糸」麾下，就擁有取其上方的「幺」和變體「乡」，以及取其下方的「小」。用者學習時，憑着字根之間的形狀關係，便可以一條龍地記憶字根。
　既然如此，學習這些形碼輸入法時，選擇把字根形狀清晰解說的敎材，就十分重要了。不良的敎材只會列出字根，或者只作解單的解釋，學習者難以掌握同鍵字根之間的形變關係，便會事倍功半。殊甚可惜！
　據一郎個人經驗，以視覺原理歸根，是最能令我熟記整套字根系統的好方法。拆字時，我首先想到漢字的形狀，接着便想到依規則要取哪兒的字根。這時，我在腦海中得到了字根的外形，怎樣可以迅速知道它屬於哪鍵？形狀上與主根相關，始終是最符合直覺、最易想到的方法。
　尤其是倉頡，連取碼的方法都按視覺原理，整個「烹調」過程都純以視覺原理來操作，對一郎來說就更得心應手。至於大易，則按書寫的筆順次序取碼，可能有些朋友會比較習慣這樣。
　撇除無理取鬧者，倉頡和大易的字根系統，唯一會有人批評的地方，是它沒有跟鍵盤上的英文字母從視覺上對應起來。於是有些輸入法便嘗試從英文字母字形着手，按鍵下的字根都跟英文字母形狀相關。然而，嘗試此道者大多失敗而回，無法只依英文形似這一個方法歸根，結果變成雜炒，摻進其他歸根方法，並不統一。能貫徹者，只有華象直覺等寥寥可數的輸入法，以普及率而言亦不算成功。無他，英文字母形狀本來跟中文組件十分不同。許多組字根本難以找到形狀相關的英文字母。設計者要麼強行歸納，牽強附會；要麼放棄那字根，要用者拿其他字根去組字。兩者俱得不償失。
　其實，中英系統殊異，要由英文字母牽着中文字根的鼻子走，違反漢字本道矣。且英文鍵盤除Qwerty外，還有多種樣式，字母會換位。若中文字根都要跟着易位，豈算良策？不如直接記下中文主根的鍵位，輸入漢字時少了一重「由中文字根轉換作英文字母」的步驟，有助熟習以條件反射來打字，打得更快。
　行列則以字根的首筆和尾筆筆形，首筆定行，尾筆定列，得出「座標」，對應盤上該座標位置的鍵。這方法理論上的確最有系統、最有法則、最科學的。畢竟視覺上的形似也會有主觀成份，仍要花時間去記憶，但行列這系統除了很少數的例外，基本上都沒有主觀成份。
　然而，過份訴諸理性也會帶來不便。人類組合出整個漢字的過程，總得關視覺事。首尾筆形相同，但中間部份截然不同，足以令各輔根長得不相似。那麼，用者就難以依靠視覺去記住它們在同一個鍵上，必須在拆出字根後，再多花一個步驟，思考字根的首尾筆形，這就會費時失事。
　再者，如前文所述，要掌握字根系統，不但要記得字根的按鍵位置，還要記得有甚麼字根。你若根本記不住有「蜆」這食材，又如何到正確的地方取得蜆，並煮出周打蜆湯？行列的官方敎材過份鼓吹「不用記字根」這點，宣稱只需依筆形找座標便成。用者若誤信之，不花時間去記憶字根，就中伏了。偏偏行列是大根輸入法，260個字根中有不少形塊不算很常見或常用，令用者容易忘記。如「可」不取「一」、「口」，取「畐減掉田」；「微」不取「彳」、「山」、「一」，取上述三者併成的一個大形塊；「舟」卻不能全取一根，先取「ノ」，再取「丹下一點」；「÷」形字根則不用於「舟」，除「母」部件外甚少用到。又如「重減掉曰」拆得岩巉；「叚的左旁」首筆取「直」不取「順彎」，有違多數習慣。凡此種種，皆是伏，都令用者得不到蜆，煮不出周打蜆湯。
　大陸形碼方面，五筆王碼把25鍵分作橫起筆、豎起筆、撇起筆、點起筆、折起筆五區，與行列有點像。但同區的字根要分佈於區內哪個鍵？一般會說依次筆，卻又有許多例外。這就沒行列般科學。鄭碼先以字根的首兩筆（有時是首三筆）分類到「區位」，再按寫法徵編配「位碼」，用兩鍵（甚至三鍵）去表達一個字根，算是另闢蹊徑。
　至於字根系統的地獄廚神，嘸蝦米認了第二，無人能認第一。其字根系統怎一個「亂」字了得！要說就長篇，下文再續。

(繼續閱讀...)

內木一郎發表在痞客邦留言(0) 人氣(148)

個人分類：輸入篇

▲top

2月 11 週四 201614:16
截筆是「浩劫」嗎？

　原文刊於《刻石錄》：http://founder.acgvlyric.org/iu/doku.php/輸入:截筆是浩劫嗎
　發佈了〈我學中文輸入法（一）〉，有朋友提出異議。我說，輸入法取碼時，是否在同一筆破開，並不是甚麼優劣之分，只是習慣不同。他反對此言，認爲筆畫是漢字之基本，我們學寫漢字，就是由筆畫學起：先學「點、橫、直（豎）、撇、捺、挑（趯）、曲（彎）、鈎」，再學以它們組合成的複合筆畫，然後逐筆逐筆寫下每個漢字。他認爲，輸入法若不從此道，就背離了漢字。
　我留意到他用的輸入法是行列。行列官網上，有文宣論及倉頡¹⁾，稱其患了以「砍字截筆」的毛病，跟寫字習慣不一致，不依筆順，又把同一部件甚至同一筆斬開，有如屠夫殺豬殺牛，「肢解文字」。它說倉頡與寫字習慣差異越遠，所以難學；說倉頡令小朋友把「車」字寫成「十田十」，是「文字浩劫」；說倉頡不合潮流，自當引退。
　這種言論有市場，是因爲許多人都沒有眞正了解漢字，只知其一不知其二。
　誠然，大家學習漢字時，都是由今楷出發，學習聽、說、讀、寫。要寫字，就是一筆接一筆，機械式地學。「車」就是「橫、豎、橫豎、橫、橫、橫、豎」，卻沒有解釋爲何是這樣，只管死記。於是大家只認識到漢字的這一面貌，覺得筆畫就是一切。
　我不可以說，以筆畫來理解漢字是「錯」的。只接受這套觀念的人，的確不宜學習把同一筆破開的輸入法。他們應選擇完全依書寫筆畫和筆順製成的輸入法。例如手機上的筆畫輸入法，就完全由筆畫、筆順出發，方便這些朋友無須再另外學習任何字根概念，比行列更直接。
　然而，這些筆畫，就是漢字的一切道理嗎？小學時我已對漢字特別有興趣，開始思考這問題。

　在小學敎育中，除了筆畫，我們能接觸到的另一種漢字單位就是「部首」。因爲要學習査字典嘛！但許多人學習部首時，都只是囫圇吞棗，沒有深思。我卻覺得部首有種魔力。當時我把學生學典翻過不停，自個兒咀嚼字典裏，一個部首率領了甚麼字，它和那些字之間有甚麼關係。也留意到有些字的部首形狀很奇特。例如「重」字是「里」部二畫，那麼「里」字的中豎不是變成向上穿了頭？在摸索過程中，我漸漸建立出「形塊」的概念。²⁾當然，這個名詞也是後來才知道的，但當時已覺得，中文字不是一筆筆的世界。
　到了大概小五吧，我開始有系統地認識六書，認識形聲、會意等造字方法，我的漢字世界就離開了「筆畫」，進入「形塊」或「部件」的層次了。例如「車」字，段玉裁在《說文解字注》裏解釋作：「象其一輿兩輪一軸。」就是說，「車」字是幅俯瞰圖，中間的「田」形是車廂；上下兩個「十」形的橫筆是車輪，因爲是俯瞰，只看到一橫；至於中豎則是車軸。你說，我要是不依前幾段說的筆畫和筆順，寫出「車」形，可否表達這文字呢？其實是可以的。古人用鳥篆龜甲文字，更與現代楷書的筆畫殊異。寫小篆的書法家，才不會把車廂的外圍，用「豎、橫豎、橫」三筆去寫成「囗」形，而會以一筆或兩筆，寫成一個圓角的框框。嚴格來說，楷書筆畫本身也是一種對漢字字形的「肢解」方法，把車廂的外圍「肢解」成三筆。
　楷書，及其筆畫，只是展現漢字的一種手法。雖然這手法很常用、常見，卻不等於漢字本身。要把漢字分析成有理部件時，往往要突破楷書筆畫的限制，「肢解」楷書筆畫，方可見眞象。「里」從「田」從「土」會意，不可拆爲「日、土」。「東」像囊袋之形，中間「田」形是裝滿東西的袋子主體部份，上下兩端以繩索束綁，絕不是從「木、日」。「更」字從「攴」，「丙」聲，楷書把兩個部件都變了形，再連在一起，有如施了接枝手術，它本身就不是「一、曰、乂」。「新」字從「斤」從「辛」，像以斧砍木取柴，後又增「木」，有時「木」與「辛」字會共用筆畫，卻絕無「立」字的成份³⁾。
　行列的發明人，執着地把上述諸字拆作「日土」、「木日」、「一曰乂」、「立木斤」，表明這是行列理念，認爲這樣才是漢字的正途，是知其一不知其二。至於倉頡拆字，也未必符合字源。但，反正兩者都不合，也就是說兩者都平起平坐，沒有誰是「歧途」，只有習慣問題。而習慣這回事，有不少主觀成份。尤其書寫和打字本來就不同。打字節奏能取代書法美感嗎？書寫英文時的連筆草法，也非英文打字可比。用書寫的角度看打字，帶師學藝、放不下另一套事情，就如我在〈我學中文輸入法（一）〉所言，本來就是學習中文輸入法的誤區。把自己的習慣甚至誤區，高擧作標準、正途，不足取信於人。
　行列主張輸入法跟寫字習慣越一致就越容易，強調依字根書寫順序取碼。但這觀念正好帶來問題。書寫時，筆順筆順，取其順者，大體上也許相似，卻沒劃一的細緻答案，要看不同人的習慣⁴⁾。行列依賴容錯碼，認爲這才符合「人性」，不用去「猜」發明人心裏想着哪種拆法。然而，世間上這麼多漢字，許多字都有不同的筆順，行列又是否將其全都包攬？好像「學」字，行列就只接受「先左右後中間」的取碼次序，排除了「由左至右」及「先中間後左右」兩種筆順，沒有容錯碼。用者一樣要「猜」哪些字的哪種筆順獲發明人「觀相」觀中，哪些則沒有。且莫說一味增加容錯碼，會導致重碼率升高，不便盲打之問題。
　倉頡另定統一的字根拆法，排好取碼次序，不管用者筆順如何，都能有一致的拆法。這並不是困難，相反，更是清晰、一致。大易跟行列同以規則簡單、依筆順、大根作賣點，但它也有「對稱取碼」、「『𦥑』形單一取碼」等規定，使這些字有清晰、一致的取碼方法，不像行列般片面強調容錯（卻難以包攬所有可能）。能用同一道理、概念，去縱橫每一個漢字，一理通百理明，何難之有？
　說穿了，在行列文宣裏的「容易」一詞，其實變成了「寫字習慣」的代詞，這只代表它的發明人或擁躉不肯接受「寫字習慣」以外的漢字分拆觀，只是主觀的習慣問題。一味高擧一套主觀習慣，不肯接受其他有理的看法，把其他看法主觀地套上「難學」的標籤，其實這才把漢字引往歧途的惡念。我說這句話，可不是沒依據的主觀感言，而是基於一段活生生的漢字歷史。
　自楷書通行以來，學習、使用漢字的人，世代以楷書筆畫、筆順作漢字單位，與部首一起作爲漢字的檢字方法⁵⁾，從唐至今歷經一千三百年。但筆畫無固定次序，檢字效率欠奉。爲此，二十世紀初至中期，王雲五先生發明「四角號碼」，林語堂大師先後研訂「漢字號碼索引法」、「末筆檢字法」、「上下形檢字法」等，並製成「明快打字機」，爲漢字排序檢字大開便捷之途。這些四角號碼、上下形檢字法，已把中文部件、筆畫斷開，以筆形組合甚至形塊，作爲漢字的單位、組件。可惜當時的人都戴着有色眼鏡，認爲它們切離了傳統文字美學，只爲追求實用而拆開漢字，冒起了抗拒情緒。結果大師傾家蕩產製成的劃時代發明，得不到應有的歡迎，遭眾人埋沒。中文險些就陷入不容於日用打字機、電腦之困局中，跌進了能否適應新科技的存亡危機⁶⁾。這才是眞正的「文字浩劫」！名爲「習慣」之有色眼戴，可眞誤漢字不淺。這是眞實的歷史，不是我的個人主觀看法。唯幸後來能打破這僵局，其中一位重大功臣正是倉頡之父朱邦復先生，除了倉頡這檢字系統，他還對中文電腦貢獻良多。
　眞的無法改變過去習慣的人，去學其他輸入法，不是壞事，我也絕對尊重。畢竟「習慣」這東西有時就是這麼折人。而科技以人爲本，令它適應不同人的習慣，是大好事。行列和其他類似輸入法之存在，的確方便了這種人。不過，若要把一己的習慣，說成是優點，用來攻擊倉頡，像行列的文宣內容般，其實說破了，是這些人放不下有色眼鏡，對漢字了解得太少，把自己管窺蠡測之見，當成是漢字的本質。
　用輸入法去打字，講求實用，不爲審美。至於書法，涉及美學，法以之一套「客觀的主觀」，當另作別論。把風馬牛不相及的兩者混爲一談，難免張冠李戴，思維錯亂。對一知半解的人，也許有市場；對眞知灼見之士，只會貽笑大方。但願行列和其他類似輸入法的發明人、維護人，只管宣傳自己依寫字或書法習慣之「特點」，不要強把這習慣加諸他人身上，說成是「優點」，收起攻擊他人方式是「缺點」之惡言。這樣在宣傳自己時，才不會惹來有識之士之反感。
♪ 本作品以Creative Commons 署名-非商業性-相同方式共享 3.0授權條款授權。如欲回應，請移玉步至《刻石錄》原文。

(繼續閱讀...)

內木一郎發表在痞客邦留言(0) 人氣(221)

個人分類：輸入篇

▲top

2月 10 週三 201614:11
平反倉頡（下）

　原文刊於《刻石錄》：http://founder.acgvlyric.org/iu/doku.php/輸入:平反倉頡_下
　續上篇，一郎繼續說我看到的眞相，到底跟牟利輸入法對倉頡的攻擊文宣有何分別。
　文宣：我們的輸入法重碼率或選字率很低，適合盲打。
　眞相：依實際數據分析¹⁾，倉頡輸入法才是重碼率最低的，這和它的取碼設計有關²⁾。如此宣稱的牟利輸入法，它們的重碼率可能一點也不低，或者依靠簡速鍵等「官方外掛」來達成低重碼率。甚至連「重碼率」一詞都要迴避，取巧地改用「選字率」或「加用第一及第二選字鍵即時選字後」來計算，玩弄語言僞術。
　文宣：我們是最具國際觀的，能夠輸入多國語言漢字，貫通正、簡、日，外國人也適合學習使用。
　眞相：倉頡早就支援超大漢字集，無論是Unicode，還是朱邦復先生那收字更多的「倉頡系統」，編碼都老早就公開。對倉頡來說，不論正、簡、日、韓，所有漢字都地位平等，在相同模式下，按同一套拆碼規則輸入，重碼率還很低。因爲在設計字碼階段時，朱邦復先生已顧及這問題，像「場、场」、「穗、穂」或「營、营、営」等字組，都不重碼。
　相反，有些宣稱自己支援大字集，卻不見支援Unicode的官方編碼，只有民間擁躉補完。更甚者，那些輸入法，字根不區分正、簡、日寫法，例如「釒、钅」或「貝、贝」等正簡字組，組內彼此間都歸入同一主根。輸入法過去甚至慣以拆簡體字的碼，來輸入正體字，當要同時輸入正簡字元時，就會構成嚴重重碼。結果，它必須區分開正體模式、簡體模式、日韓模式，要麼只能出正體字，要麼只能出簡體字，要麼只能出日韓漢字，無法同時輸入各種寫法的漢字。這根本就是沒有國際觀，不能同時支援多國語言裏的漢字。更莫說還有許多語言並不使用漢字，支援漢字並不等於支援多國語言。

　文宣：不論你怎麼寫，用甚麼字形來拆碼，我們的輸入法都支援。倉頡卻不支援異體字。
　眞相：倉頡並非不支援異體字，在「倉頡系統」中，異體字有不同編碼，用者以哪個寫法來取碼，就能輸入該寫法的異體。例如以「竹人木手弓」得出「衛」字，用「竹人木月弓」鍵入「衞」字。本來中文系統就不應該排除異體，應該像倉頡系統般，讓用者輸入不同的寫法³⁾。看我在《刻石錄》上的「說文：字形篇」，那些指責作業系統逼迫他人用臺標寫法的文章，就知這問題令中文使用者多麼懊惱，連使用心目中寫法的字形之權利都遭剝奪。然而，過往市場上的正體中文作業系統，都採用不支援異體的Big5編碼，削去了倉頡支援異體的功能。現在Unicode，支援部份異體字，像上述的「衛」與「衞」，它們已立即能夠用倉頡輸入。但Unicode也合併了的異體，例如「令」字，就無法支援較符合字理、下方從「ㄗ」的寫法，這不是倉頡的錯，是Unicode、Big5編碼的錯。改用倉頡系統的話，兩個「令」字皆可正確輸入和顯示。
　至於過去那些宣稱支援異體的輸入法，其實只是讓你想着異體來拆碼，卻打出Big5中的臺標字形。你明明想打「衞」字，拆碼正確，卻變成系統裏的「衛」字，顯示不正確。若需要這樣的倉頡，以往在DOS裏運行的國喬系統就有，許多改良版的免費倉頡也有提供，用者都可以合法地取得、安裝和使用。「不支援異體字」，只是「依Big5版本的倉頡」之問題，不是倉頡本身之問題。
　再說有些標榜支援異體的輸入法，連明顯是錯別字的寫法也「支援」。好像「眔」字，粵音「踏」，北音「dà」，「懷」、「鰥」等字從之。有輸入法卻當成是「眾」字的異體，拆「眔」形出「眾」字。這又是否好事呢？
　文宣：倉頡沒有容錯碼、簡易的符號輸入碼、假名或諺文輸入、同音字功能、萬用碼功能、打正出簡（或打簡出正）功能、詞組模式。我家的有啊。
　眞相：許多改良版倉頡都添加了這些功能，喜歡甚至在意它們的用者，可選擇這些改良版。甚至我可以說，即使沒有任何改良版本令你滿意，但倉頡發明人早就公開宣佈放棄版權，你可以用他的編碼表去改良，自製合你心水的版本。隨着系統更新，即使是作業系統的預設版本，也加入了部份功能。這些新增功能，並不影響原來輸入法拆字編碼之優劣評價。要動用這些來作攻擊倉頡的武器，是否在主體上輸給別人，就拿無關宏旨的東西來攻擊呢？
　文宣：我們是首創唯一只用二十六個英文字母的中文輸入法，智能電話系統也能用。
　眞相：倉頡字母只用二十五鍵，還留下了「Z」鍵作特殊功能用。也一樣能用於智能電話系統中。
　文宣：倉頡造就了專家權威、培訓中心老師飯碗和收入保證、手寫筆廣告的媒體收入等「好處」，其他輸入法流行起來，就會把這些都「破壞」了，所以要保住倉頡。
　眞相：這種純粹訴諸人身攻擊（或曰「『輸入法身』攻擊」）的言詞，不看也罷。我學倉頡，只靠一本價錢相宜的好書。付出一次，受用終身。有些人單靠網上一些編寫得好的敎學，例如維基敎科書上的敎程，也能學得很好。相反，作出這種攻擊的輸入法，它本身是有專利的，不向該公司購買就不能使用，每次更新作業系統，又要等那輸入法出新版，再花錢購買。甚至連敎材都是那公司獨家的，不許其他「外人」編寫，許多獨門技倆都只在敎材上才談及⁴⁾。精明的消費者，到底是誰在打你錢包主意呢？
　文宣：倉頡有版本差異，出了新版本後，過去的學習者就要跟舊版一起「共存亡」。
　眞相：倉頡是開源的，出了新版並不會取締、消滅舊版。即使出了新版，用者也可繼續合法、免費、方便地使用過去的版本；即使更新了輸入軟件，也仍會繼續合法、免費地支援過去版本的倉頡編碼。而它流通過的，只有三代及五代，兩者間差異極少，亦隨處都有合法、免費、方便的輸入軟件支援，誰都可自由選擇使用哪代的編碼⁵⁾。相反，作出這種攻擊的輸入法，它本身是有專利的，只要公司推出新版時，改變了舊版編碼，不再支援，那麼用者就眞的要與舊版一起「共存亡」。而有關公司也眞的做過這種事，例如在新版本中改變過簡速碼、放棄過舊版本使用的簡速字根等。用者除非堅持不升級，並且確保他那台電腦永不壞掉，否則就只能跟隨公司的新版，改變過往習慣。由民間擁躉編寫的査碼網站，更因此而要列出不同版本的編碼，對學習者帶來不便。
　寫了一大堆，算是爲坊間不實指控平反一下。各位讀者別誤會，我不是要主動攻擊其他輸入法。寫這文章，也只是看不過眼倉頡飽受無理攻擊，希望以親身體驗到的事實，平衡一下外間那傾側且失實的言論大氣。輸入法這回事，跟人的習慣有關，可說是百貨應百客。因此即使我在文中批評過該輸入法的缺點，但你覺得合適自己的話，請繼續使用它、喜歡它，我對此絕對尊重。只是若眞的要討論，我希望無論哪方都能以事實和公理作依歸。要是你還未接觸中文輸入法，現在或將來要挑選，我更希望你能具有慧眼，不要受像上方那些失實文宣所蒙蔽。

(繼續閱讀...)

內木一郎發表在痞客邦留言(0) 人氣(256)

個人分類：輸入篇

▲top

2月 09 週二 201614:06
平反倉頡（上）

　原文刊於《刻石錄》：http://founder.acgvlyric.org/iu/doku.php/輸入:平反倉頡_上
　前文說到，許多輸入法，尤其牟利的，愛以攻擊倉頡作宣傳。我學倉頡前也看到不少，幸好當時有所懷疑，沒有上當。經過學習，破僞立眞。我僅列出一些常見的指控，以及我透過親身學習所看到的眞相，讓各位判斷。
　文宣：倉頡要背各式各樣的字根，又易忘記。我們則以英文字母象形來歸納字根，不易忘記。光是這輸入法是編成英文這一點，我覺得就很難讓我學別的輸入法了。
　眞相：英文字母與漢字部件系統差異極大，要是中文輸入法以英文字母象形歸根，一定有甚多牽強的歸納。比較某甲、某乙兩套以字母象形作賣點的輸入法，「辶」某甲歸「L」，某乙歸「W」；「了」某甲歸「Z」，某乙歸「W」；「戶」某甲歸「P」，某乙歸「F」；「厂」某甲歸「F」，某乙歸「L」；「山」某甲歸「V」，某乙歸「E」；「幺」某甲歸「S」，某乙歸「W」；「亞」某甲歸「5（五）」，某乙歸「O」。可見所謂的字母象形歸根有多主觀、牽強，一樣需要學習者死記。而且，中文常用部件有許多，單以英文字母象形，難以囊括所有字根。因此，在同一套輸入法中，還有大量字根，並不能用跟英文字母象形去記憶。例如某甲的「土、士、⺧」歸「G」、「車、東、朿」歸「0」；某乙的「弗、鬼、佳、衤」歸「V」，「兼、弓、犭、丈」歸「Q」，再牽強都無法與字母繫之以形。即是說，這些輸入法的學習者不但要強背死記，還要在記憶不同字根時，用不同的記憶或聯想方法。這極容易引起混亂，造成大量記錯與遺忘，絕不可能如文宣所說般易記。
　至於倉頡，主輔根加起來只有百餘個，而且輔根皆是主根或其他輔根的形狀變化、衍生，簡單、清楚、好記，絕不易忘。
　文宣：倉頡要死背口訣，以記憶中文字母的位置。我們跟英文鍵盤是吻合的，直接用英文字母，不用另外再背誦口訣，會英文打字的人直接上手，不會打的可以在練中文打字時同時練成英文打字。
　眞相：任何輸入法都必須記憶字根歸鍵的位置，倉頡雖用中文字根來歸鍵，但只有二十四個主根，要使手指的神經「記得」字根位置並不難，且莫說絕大多數中文鍵盤都印有倉頡主根，方便學習者上手。至於用口訣來把中文字母轉換作英文字母，根本是走了歪路，不是正確的學習方法¹⁾。
　要是一套中文輸入法直接以英文字母歸鍵，一來，用者仍然要記憶該英文字母鍵的位置——他在腦海還是要把中文輔根轉換作所歸鍵的英文字母，然後以手指按動英文字母所在的鍵，不會因此而減低記憶負擔。二來，因爲英文字母與漢字部件系統差異極大，必有許多字根要強記，記它們會比記歸鍵位置難（如上方所述），結果是得不償失，對記憶的負擔還加重了。況且，即使它以英文鍵來歸根，中文編碼和英文字串也截然不同。一個人熟習了打「OAO」、「YYY」、「OAQE」等編碼組合，難道就等於他已慣打「capability」、「synonym」、「vocabulary」等字串，手指已條件反射地記得字串的指法嗎嗎？實際上還是要練習。

　文宣：倉頡的拆碼規則很「龜毛」（「婆媽」），很複雜，很難學。
　眞相：倉頡的拆碼規則是仔細，的確相比好些輸入法會顯得繁複，一般輸入法都不會對字身再分拆，但這做法符合漢字特徵²⁾。然而，規則定得仔細，不等於難學。輸入法眞正難學者，在於要死記死背誦，因字而異。但規則是任何情況都適用的話，就能一理通百理明，它是用來理解、用來明白，而不是用來背誦的。無論把漢字分拆成字首、字身，抑或把字身拆成次字首、次字身，原理都一樣，並不困難。眞的怕「龜毛」的話，學大新倉頡、快倉也行，它們都避開了最「龜毛」的取碼規則，因此也適合作過渡原版倉頡的跳板。
　相反，說人家難學的輸入法，自己是否眞的易學？它們當然會說是，並擧出像「OAO=哈」或「阝東=陳」等最直觀的例子。可是，它們的輔根數量多嗎？輔根與主根間的關係統一而好記嗎？它們的取碼規則統一嗎？有沒有許多「不依靠例外就幾乎不行了」的情況？官方取碼會否時常破壞自己的規則？（例如說好了「頭尾」事實卻依賴「頭頭尾」等。）拆字過程能直線順序嗎？還是時常看到「反芻」等非直線情況，或者碰上「最大根」仍要再拆的情況？要是這樣，那麼它們指倉頡「難學」時，其實自己才更難學。
　文宣：倉頡很容易忘記。例如哪個朋友的遠親，沒用半年、數個月，便幾乎忘記了怎麼打中文。我們的輸入法好學好記。
　眞相：自從學會倉頡以來，我從未忘記過。許多朋友也如此。誠然，要是有人丟下了一段長時間，變得生疏了也不太出奇，但任何中文輸入法也一樣，甚至單說英文打字也一樣，不單單是倉頡。而且，倉頡字根少，拆碼規則是略爲複雜但細緻，只要概念清晰，一明白了便不易忘記。不像那些此以攻擊倉頡的輸入法，邊強記了這堆字根歸在哪鍵，邊又忘記另一些，這才是眞正的容易忘記。
　文宣：倉頡打一字要五鍵，速度慢。不及我家輸入法快速、按鍵少。
　眞相：倉頡最多取五鍵，但許多常用字，都可以用一、二、三鍵輸入，平均數爲三碼多，與一般輸入法的平均數相差不大。當中不含要強記的簡速碼，平均三碼多就是平均三碼多，沒有摻進水份。況且取五碼之設計，來自嚴謹的統計與分析，有效區別不同的形塊³⁾。其他輸入法取碼數少於倉頡，卻引致輔根數量大根，或重碼率大增（甚至輔根數量與重碼率都大增）。有些甚至不靠開外掛（例如簡速碼）就難以達到高速輸入，其取碼平均數有「呃秤」（摻水份、欺詐）之嫌。
　文宣：我們有許多「簡速字根」、「一碼字」、「兩碼字」等，都是精華所在，讓用者提升速度。倉頡都沒有。
　眞相：但凡簡速碼，都是外掛，在正常規則以外架牀疊屋，以例外取代通則，增加學習者的記憶負荷。對於想在中文輸入速度比賽中得獎的人來說，肯犧牲腦汁去換取數百字之便宜，周瑜打黃蓋，也無可厚非。但一般用者應當不必依靠之，單以正常規則來取碼，即可得到相對較快、足以應付一般情況有餘的速度。要是一套輸入法不斷強調這些簡速碼，其實側面反映了它的編碼設計本身有缺陷，不靠這些例外難以達成高速輸入。如果你喜歡簡速碼，想背簡速碼去提升速度，在輸入比賽中得獎，可以學大新倉頡、快倉等改良版。大新倉頡還創了全球最高速的紀錄。若不需要，單是學習原版倉頡，已足夠日常應用有餘，不難達到頗高的速度。
　文章才寫了一半，篇幅已等於同系列文章的整篇，還是先擱筆一會兒。下一篇繼續說牟利輸入法對倉頡的攻擊，與我看到的眞相有甚麼差異。

(繼續閱讀...)

內木一郎發表在痞客邦留言(0) 人氣(471)

個人分類：輸入篇

▲top

2月 06 週六 201618:10
我學中文輸入法（四）——倉頡

　原文刊於《刻石錄》：http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_四
　學過許多輸入法，最後鍾情的卻是許多人說難學、罵言四處皆見的倉頡。以個人經驗來說，倉頡絕對不難。
　學倉頡前，我先細心選擇敎材。坊間敎倉頡的書有很多，編寫得好的卻不多，包括自稱最暢銷的那些。不少敎材，用甚麼「日頭、月餅、金星、木笛」或「日爺、月婆、今夕、目的」之類的所謂口訣，敎人強記「日=A，月=B，金=C，木=D」。不少敎材或字典，列倉頡碼時都用英文字母，而非倉頡字母。不少敎材，只列出倉頡的輔助字根及該輔根的例字，而字根間的形狀關係，則沒有清楚解說，甚至毫無解說。凡此種種，我皆捨之，以免誤入歧途。

《30天學倉頡》擷圖。

　最後，我選的書是伍新華編著的《倉頡輸入法：用戶手冊》。這書沒有上述通病，敎導學習者直接掌握倉頡字母在鍵盤上的位置，鼓勵學習者以條件反射盲打，清楚說明輔根的形狀關係，提醒學習者不要死記編碼，避免學習者走進誤區。它對取碼規則的解說相當深入淺出。雖是單色印刷，卻有清晰的例字圖解，分析一些容易拆錯和誤解的字。作者還特地說明異體字、香港字，以及不同系統（如微軟Windows、倚天、國喬等）間的問題，附有依部首、漢拼和廣東拼音的倉頡字典。整本書內容充實，去蕪存菁，售價也很相宜。我從它身上得益不少。若需要多媒體敎學，個人看過香港華通的《30天學倉頡》的一些示範，覺得不錯。
　撇除不宜盲打的筆畫、筆順輸入法，字根是所有形碼輸入法的入門。倉頡字根好記，主根輔根加起來才百餘過，在支援盲打的輸入法中，它是最少的了。¹⁾輔根皆與主根繫之以形，把這個輔根的形狀加點變化，就可想到下個輔根。用這方法去歸納字根，最符合對形塊的聯想思維，很容易就能熟記。倉頡、大易能做到這點，行列則太講求座標理性而失陷此城。至於嘸蝦米之類的雜亂無章，就不再提了。記得曾看過有快碼擁躉撰文，指摘倉頡歸根不直觀，如「

」歸「木」，學習者只可以靠死記。可是，要是你知道：「木」→「

」→「

」這四個字根間的關係，就壓根底兒不會說出這樣的話。由主根「木」，變成「木字底」，取其主榦，再橫臥下來，形狀記憶「一條龍」，毫無難度。該撰文者以爲要死記，無知也。但這未必是他的錯，他可能不幸看到比較差的敎程，沒有說明字根間的形狀關係，他自己也沒有發現，於是他以爲只得逐個形塊死記。

　人謂倉頡難學，主要在規則。其實，倉頡的規則只是規定得比較仔細，這並不是難。沒有系統，要死記強記，自然就難。但規定得仔細，只要明白道理所在，就能一理道，百理明，不管到了多仔細的層次也一樣，以相同道理縱橫行走。因此，只要敎材解說清楚，擧例合宜，學習者能貫徹理解這些仔細（卻不是難）的拆碼規則，根本就沒問題。諸如整體字（亦稱連體字）與分體字，概念清晰。分體字中，只分字首和一層字身者，亦沒有難度。只是字身若還能再分出兩層，即是字身可以再劃出次字首與次字身，一般人來到這步才會覺得複雜一些。不過，既然懂得分字首、字身，那麼在可劃分的字身裏，也只不過是用同一種概念，來劃分次字首、次字身。明白了同一個切割概念，那就一點都不難。
　許多人都批評倉頡這樣做拆得太細，但倉頡取碼要拆得這樣仔細，是有理由的。多數漢字，左方或上方是部首，或者是較簡單、較常用來表示字義類屬的部件。而右方或下方，多數來說構件比較複雜，也比較傾向表示聲音（即形聲字的聲旁），或表示字義仔細項目的。於是，常用的部首或類屬部件，取碼可以少一些，只要足夠表現不同部首或類屬部件間的分別即可。而表音或表示仔細字義項目的部份，則需要較多取碼，才能合理地區分這些形塊。以實例說明，「嗎、碼、瑪」等字，區別在於左邊的部首。如果要用編碼去區分這些部首，編碼並不用太仔細，已能顯示到分別，符合所需。但「槢、樛、櫂」等字，差異在於右旁，而且它們右旁的開首還是相同的；「楛、楉、榙」等字，甚至連右旁的開首與結尾都一樣，只有右旁中間部份相異；「微、徵、徽」等字，左、右、中間的開首，也沒有分別，差異在中間的底部。因此必須把字分拆得仔細一些。
　其他輸入法取碼都沒這麼細緻，例如只簡單地取「首、次、三、尾」四碼，就很容易跳過了細微的差異位，釀成重碼，不能有效反映漢字間的特徵差異。比如「殼、穀、轂、觳、縠」等字，用大易或嘸蝦米，都拆作「士冖一又」，就會重碼。行列爲此而將「士」與「冖」這兩個字根合併，視爲一塊大字根，令這些字的第三碼有分別。但每碰到類似情況就增加大根的話，字根數量就會越來越大。比如不太常用的字裏，有「左『盧』右『攴』」，有「左『盧』右『皮』」，差異在右上方。用行列的話，單是「盧」偏旁就佔了三碼，末碼「又」也沒有分別，結果它就變成重碼。是否又要增加字根，例如把「虍、田」或「田、皿」併作一大根？或者增加「攴」或「皮」根並歸進不同的鍵？這樣頭疼醫頭，腳痛治腳，始終不是辦法。幸好「盧」旁的那兩個字都不常用，可以丟在一旁不加處理。但對於常用字，行列、嘸蝦米用這種一味靠增加大根的方法，就令它們有像「

」般的怪字根，使用者不容易記住。這難免令我感到醫生的醫術不甚高明。若以倉頡的方法，「殼、穀」等字，字首的尾部顯然有分別；字首是「盧」的兩字，字身的開首不同；「微、徵」等字，次字首的尾部相異。要區分它們，用倉頡的拆法就非常簡單。
　發明倉頡輸入法的朱邦復先生，曾爲漢字的分拆大費周章。他先留意到，今天漢字形聲字佔了八、九成，大都可分成上、下偏旁或左、右偏旁，而在上或居左者通常較簡單，得出字首、字身之概念。接着又花上好幾年，從字典裏剪字，分析出約六百個字首、九千九百個字身。由於倉頡字母限定於二十六個以內，以適應一般電腦鍵盤，他計算出字首可取一至兩碼，即有六百五十個組合，足以表達不同字首形塊；字身卻須取一至三碼，才可得一萬餘組編碼，以應符需求。在他撰寫的《倉頡輸入法手冊》和《中文電腦漫談》等著作中，已作詳細解釋過。這也是倉頡取五碼的理由——在這些設定背後，都經過發明人嚴密有理的分析。
　由於從編碼設計的第一步，已作了良好規劃，因此倉頡輸入法以一套比較客觀的取碼規則，即可達至很低的重碼率，例外字很少，可說它已接近做到「完美散列」。其他輸入法沒有這種良好規劃，就只能眼巴巴看着不同的漢字拆成同一組編碼，任由重碼字增加。有些設計者不甘心承認這點，就生硬地創造一大堆簡速碼，把重碼的字硬塞進空缺的編碼組合中。但這些簡速碼，因字而異，沒有規律。靠簡速碼來降低重碼率，只是在文宣上可以騙騙人，讓盲目的信徒瘋狂叫好，卻不算眞正解決問題。甚至有些輸入法的宣傳，連「重碼率」一詞都迴避，改爲「選字率」——因爲重碼組合裏的第一個字，並不當成要選字，因此「選字率」比「重碼率」低。但這只是一種取巧的語言僞術。
　要是眞的理解不了字身再分拆的概念，或者怎也取不到次字首、次字身的編碼，不妨試試改用大新倉頡或快倉。前者最長四碼，減去倉頡的第四碼，字身只取首、尾；後者三碼內搞定，字身甚至只取尾碼。相對來說，它們增加了重碼字，但對於不擅長字身再分拆的用者，這絕對不失是個好方案。從學習角度上，這也可作爲一個跳板，使學習者先熟習字首的取碼及字身的首、尾取碼，慢慢再掌握最後的「字身再分拆」那一關，過渡到原版倉頡。此外，大新倉頡和快倉都有簡速碼，去解決重碼問題，讓不介意背碼的用者提高速度。但若決心學習原版倉頡，就不要去背那些簡速碼了。
　倉頡以統一的拆碼規則，即可達成低重碼率，無須死背簡速碼即可實現盲打，對接觸漢字的人來說十分方便。尤其是倉頡設計時，用來分析的漢字取樣，是出自《康熙字典》等大型字書，而不是只得數千常用字的小型字集。因此，即使字集擴大至Unicode收錄的數萬字，倉頡重碼率仍然不太高。在一萬三千字的Big5碼中，倉頡只有不足五百個重碼字²⁾。即使擴大至Unicode 3.1的七萬字，也有五萬五千多組編碼完全不重碼³⁾。而倉頡也早支援大字集編碼，不像別的輸入法般，遲遲仍是有字無碼。可能不少人只消輸入常用字，但像我這樣，時常接觸香港字、異體字、罕用字的人也不是少的。倉頡能帶給我這種方便，其他輸入法都不能。
　或說倉頡有版本差異，令學習者無所適從。其實，倉頡通行者，僅有三代與五代。兩者只差兩個字根、數個複合字和複合字首，逾97.8%的字編碼相同⁴⁾。雖然微軟的做法：Big5碼內字取三代編碼，Big5碼外字取五代編碼，的確讓用者不便，但這也只是微軟的錯。許多開源正版免費的輸入法，支援純三代倉頡、純五代倉頡，以及Big5碼內碼外字都同時兼容三代及五代的倉頡，可以解決這問題。
　倉頡普及，各大大小小系統都支援，而且老早就開源，發明人放棄一切權利，領先於開源潮流。雖然是先行者，但各方面都比後來者優勝，招來嫉妒、攻擊也正常。好些輸入法，尤其牟利的，都愛以攻擊倉頡作宣傳。好些學習者還未接觸倉頡，或者僅是初試其皮毛，就已有心理障礙，覺得應驗了其他輸入法所作的負面宣傳。有這些先設想法，就當然不會學得好。這正中了牟利輸入法的圈套。
　以個人經驗來說，倉頡字根，字形容易關聯記憶；倉頡拆碼，規則統一有條理，符合漢字特徵。倉頡不難學、不難忘，效率也高。靠着它，我到哪部電腦裏，輸入中文都暢通無阻。

(繼續閱讀...)

內木一郎發表在痞客邦留言(0) 人氣(1,679)

個人分類：輸入篇

▲top

2月 05 週五 201618:06
我學中文輸入法（三）——行列、大易、快碼

　原文刊於《刻石錄》：http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_三
　撇除了設計混亂的嘸蝦米，餘下數種正體中文用者間常見的輸入法，多是大根形。我說的是行列、大易、快碼。這三種輸入法，也有好些相似點。
　行列是字根分佈上最有理據的輸入法。先把筆畫或筆形分作十類，再看字根的首與尾屬於哪類，依座標系統歸到相關的位置中，例外的歸位甚少。接着，用這260個字根來拆字，依筆順，取首、次、三、尾碼，不在同一筆斷開，例如「更」是「一曰乂」。個人學習時，覺得這輸入法挺不錯。唯一問題是，到實際操作起來就很慢。因爲在腦子裏，要先把漢字拆作字根，再思考每個字根的首、尾屬於甚麼筆形。拆一個字就要思考數次¹⁾。結果，我以爲在理論上學會了，在實踐時卻不甚愜意。
　後來我嘗試作弊，直接記憶整塊字根形狀，以及它歸在甚麼鍵。卻發現歸在同一鍵中的字根，雖然一起筆的筆形有共通點，但整塊形狀的差異可以很大，不太能從整塊形狀去聯想。例如「風」、「幺」與「爿」同歸「2↓（X）」，「不」、「夫」與「雨」同歸「1↓（Z）」²⁾。不透過首、尾筆形來思考，是記不到的。結論呢，還是無法作弊。行列的字根歸類，雖然很有系統，但這系統缺乏形似上的關聯，不易讓學習者以形塊形狀去聯想，每次都要依座標系統來推理。
　大易³⁾也是大根形輸入法，有254個字根，與行列相若。用這些字根來拆字，依筆順，取首、次、三、尾碼，不在同一筆斷開。這樣說起來，眞的和行列很相似！但實際拆起字來，兩者也有不少差異。大易輔根的歸類方法，以形似爲則，大多數字根都能由形狀作聯想，從字形直覺上，比行列好記。原來人類記憶字塊，主要依靠的還是整塊整塊的字形，而不是逐個筆畫或筆形去記。而且許多正體中文鍵盤上都有大易的主根，我們不必死記字根對應甚麼英文字母，直接記憶字根的位置。有些人喜歡強記「人是A，革是S」，甚至大易官方也提供所謂「口訣」：「捺金鈴，㇏金0。愛慕，I木。水叉叉，水乂X……」這其實是費時失事的。這種強記，在短期間內，可能會帶給懂英文打字的學習者少許方便。但它本身並不是字根歸納的原理，而且習慣了這種記法後，每次打字時，都要多經「把字根轉換作英文」的一關，日後會成爲提升輸入速度的絆腳石，不便於練習盲打、觸覺打字。

　再說，「愛慕」在漢語的北語（包括大陸普通話、臺灣華語）裏與「I木」同音，在其他漢語語言裏就未必，例如粵語。這些口訣使本來設計上沒有語言之限的純取形輸入法，變成對非北語用者不利，有違設計初衷。嘸蝦米其中一大敗筆，就是有些字根按「音」歸鍵，但所據的音偏重北語，對其他漢語語言用者不公平⁴⁾。大易輸入法本來沒有這問題，因此不要爲強作所謂「口訣」，而重蹈嘸蝦米的覆轍。
　大易的字根歸納純以形似出發，雖然有些字根還是容易記漏，但實在比行列好記得多。然而，它的字根設計不見得比行列好。雖然行列和大易的字根數量相似，有好些字根形狀也很像對方，可是還是有一些差異。這些細微差異就可以令結果很不同。行列把「角」歸「J」鍵，把「魚省掉灬」歸「U」鍵，「魚」字要打「U,」，「鮭、觟」不重碼。大易視「角」爲「魚」的輔根，結果就重碼了。行列把「車」和「甫省掉點」歸入「Q」鍵，「甫」字要打「QH」，「門」歸「E」鍵，不重碼。大易把「車」、「甫」都設定作「門」的輔根，就形成「捕、捙、捫」等重碼字組。
　但這不等於大易的重碼字特別多。看輸入法研究者泰瑞的分析，其實大易的重碼率只是比倉頡略高少許，但行列的重碼率卻明顯高了一截。行列的重碼問題，在於「估你唔到」——在思考怎樣拆一個字的時候，你怎會想像到，「金、半」同鍵，「泮、淦」、「判、釗」會重碼？憑依稀的記憶，使用大易時，大概會有這種心理準備：「又遇到這個根啊，大概會跟哪個哪個根重碼了。」使用行列時，則是：「咦？怎麼這樣的字形會重碼呢？啊，想一想，好像又是啊……」而「大」與「不」重碼，「大受感動」與「不受感動」隨時會相混，更令人一臉「囧」然。
　大易另一缺點，是要使用數字行（或稱「第四排」）的鍵來作字根。學拆字時，不覺得有甚麼問題。練打字時，發現手部活動範圍的確較大，但也說不上很不便。網上還有用者說，在手提電腦裏數字鍵會移位甚至消失，影響使用。但我用過幾部手提電腦，鍵盤基本上都正常，頂多是「'[]-\」少許移位。消失的是右方的數字鍵，不是「第四排」。
　接着要說的是快碼。快碼也是拆大根，也以規則容易作招徠。與大易一樣，使用四排按鍵，規則是：非橫分字，取首、尾碼；橫分字，取左邊的首碼，右邊的首、尾碼。即是取二至三碼。口訣是：「頭尾，頭頭尾」。看起來它比大易更簡單。可是我會說，快碼是劣化版的大易。
　首先，取碼這麼少，意味着重碼機會很高。像「茉、茱、萊、茶、荼、菜、葉、藥、蔾、葇、茦、棻、蘖、蘗、蓁、蘇、葆、蒢、蒤、藻、蓧」等，都是非橫分字，只取首尾，所以都是「艹木」。這不成了依賴選字的速成麼？怎樣盲打？
　而且它的輔根歸類，比大易更忽視細節差異。例如「T」鍵，主根是「木」，輔根卻有「本、未、末、禾、朱、耒、秉、乘」。所以，要是遇到最大根就直接取之，那麼「沐、沫、沬、洙、泍、洡、溗」、「林、秝、柇、枺、秣、株、秼、棅」等，全部都會重碼。結果好些字身都不是取最大根，需要再拆。例如「朱」也常拆作「⺧木」；「株」除「木朱」外也會拆作「木⺧木」；「洙」更一定要用「氵⺧木」才能輸入，不能拆作「氵朱」⁵⁾；甚至「茱」非橫分字，卻除了「艹朱」外，還會拆作「艹⺧木」，與官方宣稱的取碼規則不相符。同理，「菜」也拆作「艹爫⺥木」，「藥」也拆作「艹幺木」，即是都可取三碼。我可以說，原來取碼規則是用來無視的嗎？官方自己無視自己的規則，而且不是僅佔少數的特例，是爲數甚多的常態。同一部件在不同字裏，也往往因此而有不同拆法。容錯支援也很隨機，例如「朱」字支援「ノ未」這容錯拆法，但其他「朱」部件的字都不可以這樣拆。⁶⁾
　同類問題充斥着整套輸入法的編碼中。雖然，快碼的規則的確比許多輸入法簡單，看着印滿主根與輔根的專用鍵盤，要初學者一接觸就能出字，的確無難度。但它用了四排按鍵，也如此依賴選字，重碼的候選字長得有速成的一半，彷彿就是白浪費。看來若不靠官方外掛，也難以盲打⁷⁾。據悉，快碼說明書甚至說它的重碼率約爲百分之五⁸⁾，這是謊言還是「語言僞術」呢？
　而且快碼與嘸蝦米一樣，是擁有專利的。要使用快碼，得買它的軟件，買它的自家鍵盤（鍵盤上印有英文和快碼字根，沒有倉頡、大易的）。那時我還是學生，跑到腦場裏，在他們的推銷攤位玩。的確，看着齊列字根的專用鍵盤，很快就能出字，但我心裏暗忖：非用他們的專用鍵盤不可嗎？花錢買了正版，安裝軟件、安裝鍵盤，在自己家裏熟練了，那麼，到公共圖書館去，到別人的家裏去時，又如何呢？幸好我當時想到這點。現在看看快碼的公司，雖然還有發售這輸入法，可是資源都投放到九方輸入法去了。官網沒有快碼的敎程（只有用來宣傳，吹噓自己有多易學多快速的簡單擧例），連字根表也小得看不清輔根！網上也找不到網友自編的。
　想當初，快碼與嘸蝦米的發明者，寫過多少攻擊倉頡的文章，說倉頡害了幾多人。快碼作者叫梁立人，大家看看他在報章上的離奇膠論，可知他平日也是狗口長不出象牙，愛人身攻擊、扭曲事實。他罵倉頡，說它「落後過時」，是「清朝婦女的纏腳布」，「十碼九騙」之類，論證過程中用了許多詭辯，炸藥份量與發明嘸蝦米的劉重次不遑多讓，但口腔裏的那股臭味更爲濃烈。那時在中文輸入法世界的論壇上，就有不少壇友不齒其言，予以反駁。只是事隔多年，找不回了。
　我個人會建議：怎也只鍾情於大根輸入法的朋友，不如直接學行列或大易。畢竟主流系統都支援它們，或者都能輕易取得免費又合法的支援軟件。拆字的直觀度不會輸給快碼和嘸蝦米。而這兩種間，個人推薦大易多一些，感覺上它比行列容易。至於能適應小根的朋友，倉頡輸入法，或其衍生改良版，仍是很好的選擇。在芸芸改良版中，要容易上手而不怕選字的，可以用速成甚至輕鬆輸入法，尤其後者拆碼眞的超輕鬆，痛苦的部份是選字吶。不想依靠選字，想高速，但嫌倉頡拆碼規則太仔細，可以考慮快倉輸入法（最多三碼）或大新倉頡（最多四碼），它們都跳過了倉頡拆碼最講究的那一至兩個碼，增加了簡速編碼、詞組輸入等去提升速度——即是開外掛，但外掛取碼比嘸蝦米那種有理得多。思路條理清晰的，我還是推薦原味倉頡，根據個人經驗，它絕對沒有坊間所說的難學。
　說起來，其實好些以簡體起家的形碼輸入法，如王碼（五筆）、鄭碼等，都支援正體字拆碼的。可是它們設計時，是從簡化漢字入手的。看過網民說，它們的正體字部份，重碼率都很高。我就暫且不論了。

(繼續閱讀...)

內木一郎發表在痞客邦留言(0) 人氣(10,197)

個人分類：輸入篇

▲top

2月 04 週四 201618:56
我學中文輸入法（二）——嘸蝦米

　原文刊於《刻石錄》：http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_二
　我先從輸入法的理論、系統、設計着手，學習多種正體中文用者間常見的輸入法。結果，我最快放棄嘸蝦米。主要原因是：它的字根設計得太亂、太無理。請留意，我不是嫌它341個基本字根、156個簡速字根¹⁾太多。嘸蝦米是大根輸入法，字根多是難免的，但它把字根歸類得很沒有系統，這才是致命傷。
　蝦米族當然會不同意這觀點。他們會說，字根雖多，但歸類得很易記，只不過是取形、音、義相關而已。可是，哪些字根取形，哪些取音，哪些取義？官方說「只要唸得出聲音來，大部份都取其音」，卻有大量例外，例如取形的「力、工、言、口、亞、田」和取義的「人、車、中、央、屯、曲」等，都明顯唸得出來。蝦米族說只要「多看多練」就可。不過，有哪種輸入法不是這樣的？對我這種講究道理的人來說，這不是答案。能看出規律、練出法門嗎？還是要走馬看花般看，囫圇吞棗地練，學得迷糊含混？尤其是嘸蝦米所謂取義的字根，又包含了像「曲、㣺、巴、虫、冘、旡」等並不是取義的²⁾；所謂取音的字根，也包含了像「亡、辛、牛、云、且、聿」等不是取音的；所謂取形（與英文字母象形）的字根，也包含了像「

（D）、扌（J）、彡（M）、マ（T）、亞（O）、辶(W)、

（H）」等難以聯想的。
　再說，取音是取聲母、韻母、英文字母諧音，還是哪種？「不、方、立、皮、竹」取聲母，「也」取韻母，「耳、爾、寅」取韻尾，「西、夕、雨、魚、于」取英文字母諧音，「月、又」取聲母和介音的英文字母諧音，「尹³⁾、永」取去掉韻尾的英文字母諧音，「酉、與、髟」等聲稱取音卻不知取甚麼音，怎唸都不像⁴⁾！「小、少、身、生、世」取聲母歸「S」，但「食、氏、升」卻歸「X」；「方、丰、飛」歸「F」，但「弗」歸「V」；「瓜、甘」歸「G」，但「弓、冎」歸「Q」。更離譜的是，「卜」取聲母卻歸「P」而非「B」；「臼」歸「G」而非「J（北語）」或「K（粵語）」；「戶」歸「F」而非「H（北語）」或「W（粵語）」（但「乎」則正常地依北語歸「H」）；「黽」讀「敏」，卻取「繩」音歸「X」；「虍」唸「呼」，卻依「據」音歸「Z」（但「據」的漢拼爲「jù」。此外，「Z」、「J」的取音輔根也歸得一片凌亂。）；「糸」一般讀「覓」，卻似乎被當作「絲」音歸「S」。這次第，怎一個「亂」字了得！
　況且它取音的字根，也以北語（包括大陸普通話、臺灣華語）爲主。如「午、瓦、文、巫」歸「W」，但前兩者粵語讀「ng」聲母，後二字粵語唸「m」聲母。還有一些字根，因爲與北語的註音符號同形，就按註音符號而歸鍵。這些歸鍵，都不易讓香港人（或其他非操北語的漢語用者）習慣，增加了非臺灣用者的學習難度。一個拆字輸入法，本應單純以字形出發，不論其音，跨越各種漢語語言發音相異之屏障的。但嘸蝦米在設計字根系統時，就已高高築起這種屏障。
　但我還未說到戲肉。嘸蝦米歸形的字根中，竟有一部份是依靠簡化漢字作聯繫的！留意，我並不是反對形碼輸入法兼及簡體字拆碼，讓簡體用者以同一套字根、規則去打出簡化漢字。能夠輸入所需的字，不致於有字無碼，始終是件好事。但我要指出的是，嘸蝦米有些輔根的歸形，以正簡轉換作聯繫。用者要先懂得那字根的正、簡兩種寫法，才能把該輔根聯繫起來。你得先懂得「婁」簡體寫作「娄」，才知道「婁省掉女」這輔根歸入「米」根；你得知道「堅」簡體寫作「坚」，才知道「臣」這輔根歸入「〢」根。請問我可以只學輸入法，而不必學簡化漢字嗎？可以嗎？可以嗎？！更莫說「臣」變「〢」並不符合簡化漢字的推類規則。

　順帶一提，嘸蝦米的官方字根表中，其實漏掉了好些形狀相似的形塊，即是有若干實際應用上會碰到的字根沒有列出來。這不是嘸蝦米獨有的問題，不少輸入法的字根列表，也會這樣省掉一些形狀相似的形塊，例如只列「食」而省掉「飠（食偏旁）」，只列「金」而省掉「釒」等。要是省略得合理，一般人靠列出的根都能關聯到省去的根，也不疑事。但嘸蝦米只列出「夂」而省掉「攵」，只列出「佳」而省掉「隹」，未免太超過了吧？這些形塊雖然外貌相似，但絕大多數人都知道是不同的字或部件。不一併列出來，難免會令人困惑。又像只列出「歹」而省掉「

」，用者要拆「互」字時就難免抓破頭顱。更弊的是，一向強調容錯碼很多的嘸蝦米，偏偏不替「互」字設任何容錯碼。只列出「

」而省掉「

」，也使「留」的拆碼變得難記。
　嘸蝦米還有一堆簡速字根，可是簡速字根又如何歸類？繼續取形、音、義？「俞」可能取形，「並」可能取音，但有很多也不知何解，官方亦隻字不提，沒有人解釋到是依甚麼系統。蝦米族說，簡速字根可以不記，用本來的字根也可以輸入漢字，不記得就不用簡速字根。但蝦米族也說簡速字根是提升速度和減低重碼的關鍵。迴避它們，始終不是我要聽到的答案。
　輸入法規則設計上，嘸蝦米的「補短」規則也很挫敗人。一個字的末根既已取了，還要再把它「反芻」，再拆開它的尾部，取出眞末根。這種「反芻拆出眞末根」的做法，唯一好處是減低重碼率。同一鍵背負太多字根，重碼率自然高。例如說，把「少、身、生、世」都歸在「S」鍵，那麼「鈔、銵、鉎、鉪」就會重碼。但因爲要反芻再取眞末根，「鈔」的眞實取碼就是「金少ノ（ASP）」，「銵」的眞實取碼就是「金身ナ⁵⁾（ASX）」，「鉎」的眞實取碼就是「金生一（ASE）」，「鉪」的眞實取碼就是「金世∟⁶⁾（ASL）」，它們就不重碼了。然而，要是輸入法設計者在定義字根時，就已經把這些形狀裁小，分拆成兩個字根，也能達致相同效果。那麼爲何要定義這片大形塊作字根，不把它拆開，變成兩塊較細小的字根？
　「反芻拆出眞末根」的設計是很不必要的。這做法令用者在拆字過程上，並不是一直線順着去。拆字思路流程會變得不順暢。有時眞末根甚至不是原末根的一部份，而是全部，就更令人無言。比如「卒」字取「

十十（JJJ）」，原末根「十」反芻，再取眞末根「十」，結果「十」這部件就被取了兩次。「口」和「囗」二字都取「口口（OO）」，整個字都反芻取兩次碼。「回」字取「口口口（OOO）」，第一個「口」是外框，第二個「口」是裏面的原末根，它反芻再取出眞末根「口」，內裏的「口」部件又取了兩次，還跟「品」重碼。（「品」字本身已取了三碼或已上，不用補末根，因此不是「口口口口（OOOO）」。）
　有時同一個部件或形塊，要補甚麼末根，也是隨機的！例如「八」字作右偏旁的字。當中「扒」字在甚麼模式都能補「㇏（N）」或「丶（A）」。「叭」字在正體中文模式只能補「㇏（N）」，在簡體模式卻可補「㇏（N）」或「丶（A）」。「汃」、「釟」、「朳」中則只能補「㇏（N）」。如果說「扒」字補「丶（A）」是容錯，爲甚麼「叭」字只在簡體模式才需要容錯？而另一些「八」偏旁的字就不用容錯嗎？
　再說，嘸蝦米即使用這方法，重碼率仍然相當高⁷⁾，它的用者可以勝出輸入速度比賽，靠的是簡速編碼。除了上方提及的簡速字根，還有個別漢字的簡速碼，例如一碼字、兩碼字、兩碼字借作字根（但有些兩碼字則不能）、加V鍵快速字等。就如上述的「回」與「品」重碼，「回」可以用「OOV」或「OOOV」出字，「品」可以用「OV」出字。這輸入法靠這些正常規則以外的特殊編碼，去簡化按鍵數目，提升速度和支援盲打。
　但這種簡速碼，根本就是開外掛。要記這些簡速編碼，基本上都要逐字去記，每個字有個別的、不同的簡速編碼，很難說得上有甚麼系統、甚麼解釋。就像我唸高中時的那個化學科老師，不仔細說清化學原理的系統、解釋，只管一味說甚麼地方公開試必出，這裏那裏多少條化學公式要死背，甚麼關鍵字不可缺少或串錯，不能用同義詞代替，原因是：「你猜改卷的評分員，會有時間逐字去嗅你的萬言論文麼？哪管你寫得狗屁不通，意思相反了，只要看到有這些關鍵字，一個都不少、不算錯，就給你滿分。」有些同學很受落這套類近補習社式的敎法，但我因此而完全讀不進腦。若要靠死背去開外掛，爲何不把這些時間花在理解正式原理、規則之上？反正都是要花時間去記、去熟習，要是去記一些表面上略爲複雜的規則，我可以一理通，百理明。要是去記這些因字而異的簡速編碼，囫圇吞棗地爲拿分、爲高速而死背死記，不求甚解，我受不了。
　官方開外掛，靠外掛才可以贏，其實在一定程度上，也反映本身的拆字系統設計並不夠理想。而且，其他輸入法也可以用同類方法開外掛。倉頡輸入法開了外掛，進化成快倉或大新倉頡，也有同樣效果，速度上更勝嘸蝦米。要單純追求速度的話，學嘸蝦米不如用大新倉頡或快倉。至於一般用者，根本就不應額外去記去背一大堆簡速碼，應該用正規的拆碼規則，取得不錯的、足夠日常應用有餘的速度，這已很好。
　誠然，蝦米族的擁躉也有不少，這種輸入法雖然不適合我，卻適合不少人。百貨應百客，我絕對尊重蝦米族對嘸蝦米輸入法的喜愛。不過看到嘸蝦米官方不時熱衷於踩倉抬嘸，有些蝦米族也中了這毒，例如把自己爭取到學校中文打字課程棄倉投嘸，視爲人生的功績⁸⁾，我想我也有必要表達另一邊的感受和觀點。要記數量龐大卻雜亂無章的字根與編碼組合——341個基本字根、156個簡速字根，472個兩碼字⁹⁾，還有加V鍵快速字、兩碼字能借作字根的部份，諸如此類，不勝枚擧。甚至有些字，擁躉還建議靠簡體拆碼來打才會有效率¹⁰⁾，要我在輸入正體字時想着簡體形狀。不論蝦米族如何緊跟官方說法，四處拿着大聲公高喊「一點也不難」，對好些人來說就是難，就是亂，就是沒條理，就是不適合。所謂的「多看多練」、「看個幾次就會了，不用背啦」，只不過是任何輸入法皆可高擧的宣傳口號。蝦米族說兩三個月內（甚至說一個月內、數週內、一週內）一定學會，但是有用者就是學不會。栽在嘸蝦米凌亂的設計和字根中，以及官方外掛裏的學習者，是大有人在的。

(繼續閱讀...)

內木一郎發表在痞客邦留言(0) 人氣(2,491)