PIXNET Logo登入

拓碑林

跳到主文

刻石埋首白,拓碑覓知音

部落格全站分類:藝文情報

  • 相簿
  • 部落格
  • 留言
  • 名片
  • 10月 26 週三 201617:41
  • 狗肉字根我不受


 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:狗肉字根我不受
 中共治下的大陸,曾有一輸入法,名曰「認知碼」,是甚麼「國家『八五』重點科技攻關項目926工程」的成果之一。嘩,好不巴閉,小鳳姐云:「齊鼓掌!」啪啪啪。雖然大家根本不明白一個輸入法有甚麼「重點」的科技要「攻」甚麼「關」做甚麼「工程」,甚至不知道甚麼「八五」甚麼「926」是年份月份日子項目數量還是甚麼瞎扯吹牛皮。它曾通過國家敎委的技術鑑定,曾在廣東、天津和北京一批學校裏試驗,還聲稱「效果很好」,打算在一九九五年推向全國中小學。然而,據中文維基百科記載,當時有硏究者在《計算機世界》撰文批評過它,以大量分析和數據指出它不宜推廣。後來,它像綠壩娘那般,在花了國家不知多少錢後就無疾而終,人間蒸發。
 認知碼的字根系統是怎樣的?據資料,它有四百個多字根,比大陸許多形碼輸入法都要多。硏究者撰文批評它時,就列出多數輸入法的字根數目作對比,直接指出字根越多越難記難學。不但學習者難以全部熟記,甚至連發明人也出糗。明明設了「朱」這個字根,但連發明人自己都忘記,把「朱」的編碼設定爲「ノ、未」,其他「朱」部件的字也是如此,「朱」這字根就變成沒有用的垃圾。而且這不是孤例,認知碼的許多字根,都像「朱」一樣可以再分拆作兩個或多個字根。當中有些字根使用率不高,萬一眞的碰到它,用者就很難搞清楚到底要再拆開,還是不要再拆。例如在「鼠」、「黑」、「骨」要拆開的同時,「俞」、「愛」竟然不用再拆,這點就被撰文的硏究者擧出來批評。
 認知碼歸鍵方法,是看字根在北語中唸甚麼聲母。例如「韓」字拆做「十」、「早」、「韋」,「十」是「shi」,「早」是「zao」,「韋」是「wei」,於是要打「SZW」。如是者,明明是取形的輸入法,思維卻要同時花在發音上。有好些字根,由於並不成字,發明人還人爲地賦予它們讀音,增加學習困難。同一鍵上也有太多字根,用者連想用鍵盤貼紙來幫助學習都不能。
 硏究者還批評,認知碼重碼率高,簡碼的使用不科學。
 現在認知碼皮已收。這絕對不是壞事,因爲它只是是個負面示範,讓人看到設計不良的輸入法會是甚麼樣子。可是,有種輸入法的字根系統,問題跟認知碼「不相伯仲」,甚至「不甘後人」,卻在其敎徒傳銷下大行其市。這種輸入法,名叫嘸蝦米。

 嘸蝦米,官方在「字根『總』表」上列出三百四十一個字根,然後又在「簡速字根總表」上多添一百五十六個,共計四百九十七個字根,比認知碼還要多近一百個。當然也難以使用鍵盤貼紙。
 嘸蝦米的字根中,不論普通字根還是簡速字根,都有許多大形塊,與認知碼相同。若屬於簡速字根,你最好不再拆開它,但也可以再拆。它與認知碼一樣,在「鼠」、「黑」、「骨」必須拆開的同時,「俞」、「愛」就不用再拆,可以整塊輸入。不過,因爲「俞」、「愛」屬簡速字根,要是再拆了,也可以的。
 至於普通字根,原則上不可以再拆,要取大根。但偶爾又會有容錯碼,錯誤地再拆了也可以輸入,卻不一定有。例如「微」字,「兩撇一座山再加一橫」竟然是一塊字根,要先取。接着取左下角的「〡」,中下方的「儿」,和最右旁的「攵」。不過若拆細了,變成「兩撇」、「〡」、「山」,再加最右旁的「攵」,也容許的。但如「髟」字,就不可以再拆,視爲一塊字根,而且沒有容錯,拆細了就無法輸入。
 簡速字根最好直接輸入,但也可以再拆細。普通字根原則上不可以再拆細。不過部份字設了容錯碼,誤拆了普通字根仍可輸入。用者不但要記住哪些是字根,哪些不是,還要記住哪些字根屬於簡速者,哪些卻只是普通字根,然後才可以知道,他應不應、可不可以再拆細。這比認知碼還複雜,要記住的東西比認知碼還多、還亂。
 嘸蝦米的字根歸鍵,當中有一堆都與認知碼一樣,視乎其北語讀音。卻不一定像認知碼般按其聲母。也許按其韻母、韻腹、韻尾、整體諧音,甚至不知甚麼音來歸鍵。跟認知碼一樣,它亦包含了不成字部件的人爲造音。例如上方說過的「髟」,它在北語裏明明讀「biāo」,卻人爲地替它造了個不存在的「v」音。而北語「b」聲母的「卜」字,卻歸到「P」鍵裏。讀音相同的字,或者只有聲調不同的字,不時會歸到不同的鍵裏。有時還好像摻雜閩南語(但一郎不懂閩南語,無法肯定)。
 但同一時間,嘸蝦米又有不少能唸出來的部件,不依發音,而依跟英文字母形似,或者跟其他字根形似,或者跟英譯的首字母等關係來歸鍵。到底一個字根,甚麼時候依音,甚麼時候按形,甚麼時候取英譯,根本任發明人是但噏,沒有準繩可從。學習者即使知道某個形塊是字根,也未必能記住它到底是以形、音還是義來聯想,不同的聯想方法會互相干擾,徒添混亂。而且這些形似或英譯,又不乏甚爲牽強者。諸如說「亞」形似「O」,說「巾」形似「N」,說「辶」形似「W」,說「佳」譯作「very good」而不是「good」等等。
 嘸蝦米字根還有兩大問題。首先,正常分拆漢字時,許多人都會拆到的形塊,如「艹」、「罒」、「コ」、「攵」、「隹」等,都不在字根表裏。那即是要再拆細,例如把「艹」拆成「十十」嗎?原來不是,而是要借用表上另一個字根「廾」!「罒」要借用「皿」,「コ」要借用「ユ」,「攵」要借用「夂」,「隹」要借用「佳」!中文維基百科的「嘸蝦米輸入法」條目,說「如果沒有該字根,在拆字時要借用樣貌相似的字根」,還稱這是「潛規則」——官方沒說出來,但在分解漢字時實際上會用到。這個所謂「潛規則」的說法已近乎替官方狡辯!這完完全全是一郎在上一篇文章中所說,用者要煲周打蜆湯,卻無法找到蜆,要硬着頭皮用蠔來權充!那麼煮出來的,還是周打「蜆」湯嗎?
 而且用者若養成了習慣,以差不多先生的心態對待字根形狀,有時又會中伏。比如「犂」的右上角,嘸蝦米編碼是視作字根表上的「ㄉ」,把兩筆的「勹」與一筆的「ㄅ」相混。若用者習慣了,看到「勹」時都視爲字根表上的「ㄅ」,那就踩地雷了。兩筆的「勹」與一筆的「ㄅ」是否要區分,連官方字根表都自相矛盾。又如表上沒有「无」這字根,用者若眞的在字根表上找貌似的「旡」字根借用,又中伏了。這次「无」要拆細作「一、尢」。甚麼時候借用貌似字根,甚麼時候細拆,根本無所適從。有好些字根,甚至完全沒有在字根表上列出,嘸蝦米査碼程式的製作者還在blog上沾沾自喜,將之稱作「隱藏字根」,叫用者用査碼程式找出來1)。這明明不是甚麼光彩的事!
 其次,嘸蝦米字根雖多,卻往往無法區分近形的字。例如「干」字、「千」字、「干」字豎筆變撇、「千」字豎筆變撇,四者都歸在同一鍵上。因此「干」和「千」重碼,「天」和「夭」也重碼。嘸蝦米官方還特別說,把字根設定成這樣,「刊」和異體「刋」就不用編成不同的碼,如此云云。謬矣哉!「刊」讀「看」平聲,指刊刻或書冊;「刋」唸「千」去聲,解作切。昔日執字笠時代,曾有報章誤用,以「刋」代「刊」,還遭讀者投函指正。兩字雖是近形,卻不是異體,其區分的關鍵正正在首筆。有些字有異體寫法,爲異體多設一組編碼,技術上不難,嘸蝦米本身也有不少異體碼。但要有效區分形似異字,才眞正考輸入法設計者功夫。爲了很容易解決的支援異體問題,令眞正需要分辨的關鍵差異無法區分,造成「結構性」的重碼——即是有一些常用偏旁重碼,導致含有該偏旁的一系列字都會重碼。這樣的字根系統怎可能給高分呢?
 只要肯睜開眼睛,大家都可以看到,嘸蝦米字根系統凌亂無章,自相矛盾。這點是客觀事實。差在看倌在主觀感情方面是否願意承認。早陣子在百度倉頡帖吧上,有人在網上推薦嘸蝦米給別人,就推銷它「非常易學」,聲稱自己只花了四小時去背嘸蝦米字根,說:「嘸蝦米字根是亂,但真的好背!」如此云云。誠然,有些人記憶力好,給他一堆凌亂的東西,只要說明必須記住,他就自己會找方法牢記。但不可以因他的能力高,就認爲其他人也可以記住,也可以接受如此凌亂無章的字根系統!正如一郎唸中學時,化學老師以補習社式的雞精敎法,不好好解釋化學現象背後的細緻科學原理,一味說甚麼化學公式要背,還眞的要我默書般背默;一味說甚麼關鍵字是重點,考試時必須寫出來不可串錯,但當中的過程可以亂寫:「沒有人會理會,你以爲改卷佬有閒情嗅你的解說麼?」有些同學很喜愛這種補習社式的敎法,但我在他敎導下,無法眞正了解背後的原理、操作,初時依他所說不斷死背,還勉強低空略過,後來東西多起來,就墜機了。
 除了我自己,我也從網上接觸到好些人,覺得嘸蝦米字根系統雜亂非常,甚或認爲它是「渣」。當中有已使用嘸蝦米多年的朋友。然而,如果你在搜尋引擎上找,或者瀏覽一些台灣的輸入法討論板塊,卻甚少看到這種聲音,相反,有許多人都不斷說嘸蝦米很好學、字根很好記。說得動聽點,這叫傳銷做得好,說得難聽點,這叫三人成虎。傳銷時掛着「字根很好學」的羊頭,販賣凌亂的、貨不對辦的狗肉字根系統。誠然,有朋友記性好,或其他原因,了解過以後,自己選擇去接受、去學習這套字根系統,我絕對尊重。不過若有人罔顧事實,散播「嘸蝦米字根很好學」這種失實傳銷口號,我自問沒有容下指鹿爲馬的能力,接受不了。
 還有一種叫快碼的商業輸入法,跟嘸蝦米一樣愛以謊言吹捧自己,並攻擊其他輸入法。而它的字根系統,缺點也跟嘸蝦米相似。例如宣稱快碼字根與英文字母象形,卻不乏牽強者。例如說「同、內、用」像「M」而「月、肉、円」像「N」;說「國、田、甲、曲」像「U」而「山」像「V」;說「戈、戊、民、瓦、成」像「C」;說「可、勻、勿、司」「D」等。字根的歸鍵也混雜英譯等其他方法,例如「木」取「T」(tree)、「土」取「G」(ground),並不統一以形似來歸鍵。字根時常無法好好區分近形偏旁,導致「結構性」的重碼。比如「金」旁和「食」旁,「方」旁、「皮」旁和「反」旁,「未」旁、「朱」旁、「耒」旁和「乘」旁等,全都重碼,其字根比嘸蝦米區分能力更差得多!但字根系統着造成這麼多的重碼,基本上每組輸入碼的候選字都一大堆,快碼的發明人居然膽敢聲稱其重碼率只有約5%,即是比倉頡還低!快碼也聲稱它平均輸入2.1個鍵便可打出一個中文字,即是比速成還少!如此指鹿爲馬,掛羊頭賣狗肉,我們眞的要相信嗎?
(繼續閱讀...)
文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣(112)

  • 個人分類:輸入篇
▲top
  • 10月 22 週六 201601:54
  • 字根不良難煮字



 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:字根不良難煮字
 夫烹飪,重者有二:一曰食材,二曰煮法。食材不佳,雖有神技難調美食;烹煮乏法,有鮮材亦烹不出佳餚。
 凡形碼輸入法,皆與烹飪同。其重者,一爲字根,二爲取碼規則。字根如食材,取碼規則猶煮法。二者之中,任一不良,亦難言好輸入法。今天先說字根。
 字根是形碼輸入法裏用以組字的元素。用者要組出一個漢字,先要掌握全套字根,了解它有甚麼形塊部件,選甚麼部件出來組字才正確,以及這些部件要按哪個鍵才可獲得。跟選擇正確食材,以及知道食材要到哪裏獲得,是同樣道理。
 若形塊部件沒有系統,用者難以全套熟記,就如同他本要煲周打蜆湯,卻尋遍不獲半隻蜆,只覓到蠔來權充。那麼,任他怎樣煮,都煲不出周打蜆湯。即是說,用者得不到正確的字根,結果組嵌不到要輸入的字。
 因此,把字根設計得有系統,令用者容易掌握,是輸入法設計者首要之務。字根系統的設計,是判定形碼輸入法好與壞的第一步。若設計得沒有系統,用者沒有章法可以好好掌握全套字根,記不住字根系統裏的每一個形塊部件,以及它的歸鍵,這輸入法就等於連地基都打不穩,是失敗中的失敗。
 爲使字根系統良好,不少形碼輸入法設計者都各出其謀。

 倉頡和大易用的都是視覺原理。它們的設計者,先確立約數十個基本字根,這些基本字根本身都是能獨立成字、能簡單地喊出來的。然後把另一些形狀上相關的字根,歸納到基本字根之下,成爲它們的輔根。
 例如倉頡字母「月」之下,就有「月」的外框「⺆」和變體「冂」、「冖」,以及把「月」形推斜的「」和稍加變形的「爫」。或者像大易的基本字根「糸」麾下,就擁有取其上方的「幺」和變體「乡」,以及取其下方的「小」。用者學習時,憑着字根之間的形狀關係,便可以一條龍地記憶字根。
 既然如此,學習這些形碼輸入法時,選擇把字根形狀清晰解說的敎材,就十分重要了。不良的敎材只會列出字根,或者只作解單的解釋,學習者難以掌握同鍵字根之間的形變關係,便會事倍功半。殊甚可惜!
 據一郎個人經驗,以視覺原理歸根,是最能令我熟記整套字根系統的好方法。拆字時,我首先想到漢字的形狀,接着便想到依規則要取哪兒的字根。這時,我在腦海中得到了字根的外形,怎樣可以迅速知道它屬於哪鍵?形狀上與主根相關,始終是最符合直覺、最易想到的方法。
 尤其是倉頡,連取碼的方法都按視覺原理,整個「烹調」過程都純以視覺原理來操作,對一郎來說就更得心應手。至於大易,則按書寫的筆順次序取碼,可能有些朋友會比較習慣這樣。
 撇除無理取鬧者,倉頡和大易的字根系統,唯一會有人批評的地方,是它沒有跟鍵盤上的英文字母從視覺上對應起來。於是有些輸入法便嘗試從英文字母字形着手,按鍵下的字根都跟英文字母形狀相關。然而,嘗試此道者大多失敗而回,無法只依英文形似這一個方法歸根,結果變成雜炒,摻進其他歸根方法,並不統一。能貫徹者,只有華象直覺等寥寥可數的輸入法,以普及率而言亦不算成功。無他,英文字母形狀本來跟中文組件十分不同。許多組字根本難以找到形狀相關的英文字母。設計者要麼強行歸納,牽強附會;要麼放棄那字根,要用者拿其他字根去組字。兩者俱得不償失。
 其實,中英系統殊異,要由英文字母牽着中文字根的鼻子走,違反漢字本道矣。且英文鍵盤除Qwerty外,還有多種樣式,字母會換位。若中文字根都要跟着易位,豈算良策?不如直接記下中文主根的鍵位,輸入漢字時少了一重「由中文字根轉換作英文字母」的步驟,有助熟習以條件反射來打字,打得更快。
 行列則以字根的首筆和尾筆筆形,首筆定行,尾筆定列,得出「座標」,對應盤上該座標位置的鍵。這方法理論上的確最有系統、最有法則、最科學的。畢竟視覺上的形似也會有主觀成份,仍要花時間去記憶,但行列這系統除了很少數的例外,基本上都沒有主觀成份。
 然而,過份訴諸理性也會帶來不便。人類組合出整個漢字的過程,總得關視覺事。首尾筆形相同,但中間部份截然不同,足以令各輔根長得不相似。那麼,用者就難以依靠視覺去記住它們在同一個鍵上,必須在拆出字根後,再多花一個步驟,思考字根的首尾筆形,這就會費時失事。
 再者,如前文所述,要掌握字根系統,不但要記得字根的按鍵位置,還要記得有甚麼字根。你若根本記不住有「蜆」這食材,又如何到正確的地方取得蜆,並煮出周打蜆湯?行列的官方敎材過份鼓吹「不用記字根」這點,宣稱只需依筆形找座標便成。用者若誤信之,不花時間去記憶字根,就中伏了。偏偏行列是大根輸入法,260個字根中有不少形塊不算很常見或常用,令用者容易忘記。如「可」不取「一」、「口」,取「畐減掉田」;「微」不取「彳」、「山」、「一」,取上述三者併成的一個大形塊;「舟」卻不能全取一根,先取「ノ」,再取「丹下一點」;「÷」形字根則不用於「舟」,除「母」部件外甚少用到。又如「重減掉曰」拆得岩巉;「叚的左旁」首筆取「直」不取「順彎」,有違多數習慣。凡此種種,皆是伏,都令用者得不到蜆,煮不出周打蜆湯。
 大陸形碼方面,五筆王碼把25鍵分作橫起筆、豎起筆、撇起筆、點起筆、折起筆五區,與行列有點像。但同區的字根要分佈於區內哪個鍵?一般會說依次筆,卻又有許多例外。這就沒行列般科學。鄭碼先以字根的首兩筆(有時是首三筆)分類到「區位」,再按寫法徵編配「位碼」,用兩鍵(甚至三鍵)去表達一個字根,算是另闢蹊徑。
 至於字根系統的地獄廚神,嘸蝦米認了第二,無人能認第一。其字根系統怎一個「亂」字了得!要說就長篇,下文再續。
(繼續閱讀...)
文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣(148)

  • 個人分類:輸入篇
▲top
  • 2月 11 週四 201614:16
  • 截筆是「浩劫」嗎?


 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:截筆是浩劫嗎
 發佈了〈我學中文輸入法(一)〉,有朋友提出異議。我說,輸入法取碼時,是否在同一筆破開,並不是甚麼優劣之分,只是習慣不同。他反對此言,認爲筆畫是漢字之基本,我們學寫漢字,就是由筆畫學起:先學「點、橫、直(豎)、撇、捺、挑(趯)、曲(彎)、鈎」,再學以它們組合成的複合筆畫,然後逐筆逐筆寫下每個漢字。他認爲,輸入法若不從此道,就背離了漢字。
 我留意到他用的輸入法是行列。行列官網上,有文宣論及倉頡1),稱其患了以「砍字截筆」的毛病,跟寫字習慣不一致,不依筆順,又把同一部件甚至同一筆斬開,有如屠夫殺豬殺牛,「肢解文字」。它說倉頡與寫字習慣差異越遠,所以難學;說倉頡令小朋友把「車」字寫成「十田十」,是「文字浩劫」;說倉頡不合潮流,自當引退。
 這種言論有市場,是因爲許多人都沒有眞正了解漢字,只知其一不知其二。
 誠然,大家學習漢字時,都是由今楷出發,學習聽、說、讀、寫。要寫字,就是一筆接一筆,機械式地學。「車」就是「橫、豎、橫豎、橫、橫、橫、豎」,卻沒有解釋爲何是這樣,只管死記。於是大家只認識到漢字的這一面貌,覺得筆畫就是一切。
 我不可以說,以筆畫來理解漢字是「錯」的。只接受這套觀念的人,的確不宜學習把同一筆破開的輸入法。他們應選擇完全依書寫筆畫和筆順製成的輸入法。例如手機上的筆畫輸入法,就完全由筆畫、筆順出發,方便這些朋友無須再另外學習任何字根概念,比行列更直接。
 然而,這些筆畫,就是漢字的一切道理嗎?小學時我已對漢字特別有興趣,開始思考這問題。

 在小學敎育中,除了筆畫,我們能接觸到的另一種漢字單位就是「部首」。因爲要學習査字典嘛!但許多人學習部首時,都只是囫圇吞棗,沒有深思。我卻覺得部首有種魔力。當時我把學生學典翻過不停,自個兒咀嚼字典裏,一個部首率領了甚麼字,它和那些字之間有甚麼關係。也留意到有些字的部首形狀很奇特。例如「重」字是「里」部二畫,那麼「里」字的中豎不是變成向上穿了頭?在摸索過程中,我漸漸建立出「形塊」的概念。2)當然,這個名詞也是後來才知道的,但當時已覺得,中文字不是一筆筆的世界。
 到了大概小五吧,我開始有系統地認識六書,認識形聲、會意等造字方法,我的漢字世界就離開了「筆畫」,進入「形塊」或「部件」的層次了。例如「車」字,段玉裁在《說文解字注》裏解釋作:「象其一輿兩輪一軸。」就是說,「車」字是幅俯瞰圖,中間的「田」形是車廂;上下兩個「十」形的橫筆是車輪,因爲是俯瞰,只看到一橫;至於中豎則是車軸。你說,我要是不依前幾段說的筆畫和筆順,寫出「車」形,可否表達這文字呢?其實是可以的。古人用鳥篆龜甲文字,更與現代楷書的筆畫殊異。寫小篆的書法家,才不會把車廂的外圍,用「豎、橫豎、橫」三筆去寫成「囗」形,而會以一筆或兩筆,寫成一個圓角的框框。嚴格來說,楷書筆畫本身也是一種對漢字字形的「肢解」方法,把車廂的外圍「肢解」成三筆。
 楷書,及其筆畫,只是展現漢字的一種手法。雖然這手法很常用、常見,卻不等於漢字本身。要把漢字分析成有理部件時,往往要突破楷書筆畫的限制,「肢解」楷書筆畫,方可見眞象。「里」從「田」從「土」會意,不可拆爲「日、土」。「東」像囊袋之形,中間「田」形是裝滿東西的袋子主體部份,上下兩端以繩索束綁,絕不是從「木、日」。「更」字從「攴」,「丙」聲,楷書把兩個部件都變了形,再連在一起,有如施了接枝手術,它本身就不是「一、曰、乂」。「新」字從「斤」從「辛」,像以斧砍木取柴,後又增「木」,有時「木」與「辛」字會共用筆畫,卻絕無「立」字的成份3)。
 行列的發明人,執着地把上述諸字拆作「日土」、「木日」、「一曰乂」、「立木斤」,表明這是行列理念,認爲這樣才是漢字的正途,是知其一不知其二。至於倉頡拆字,也未必符合字源。但,反正兩者都不合,也就是說兩者都平起平坐,沒有誰是「歧途」,只有習慣問題。而習慣這回事,有不少主觀成份。尤其書寫和打字本來就不同。打字節奏能取代書法美感嗎?書寫英文時的連筆草法,也非英文打字可比。用書寫的角度看打字,帶師學藝、放不下另一套事情,就如我在〈我學中文輸入法(一)〉所言,本來就是學習中文輸入法的誤區。把自己的習慣甚至誤區,高擧作標準、正途,不足取信於人。
 行列主張輸入法跟寫字習慣越一致就越容易,強調依字根書寫順序取碼。但這觀念正好帶來問題。書寫時,筆順筆順,取其順者,大體上也許相似,卻沒劃一的細緻答案,要看不同人的習慣4)。行列依賴容錯碼,認爲這才符合「人性」,不用去「猜」發明人心裏想着哪種拆法。然而,世間上這麼多漢字,許多字都有不同的筆順,行列又是否將其全都包攬?好像「學」字,行列就只接受「先左右後中間」的取碼次序,排除了「由左至右」及「先中間後左右」兩種筆順,沒有容錯碼。用者一樣要「猜」哪些字的哪種筆順獲發明人「觀相」觀中,哪些則沒有。且莫說一味增加容錯碼,會導致重碼率升高,不便盲打之問題。  
 倉頡另定統一的字根拆法,排好取碼次序,不管用者筆順如何,都能有一致的拆法。這並不是困難,相反,更是清晰、一致。大易跟行列同以規則簡單、依筆順、大根作賣點,但它也有「對稱取碼」、「『𦥑』形單一取碼」等規定,使這些字有清晰、一致的取碼方法,不像行列般片面強調容錯(卻難以包攬所有可能)。能用同一道理、概念,去縱橫每一個漢字,一理通百理明,何難之有?
 說穿了,在行列文宣裏的「容易」一詞,其實變成了「寫字習慣」的代詞,這只代表它的發明人或擁躉不肯接受「寫字習慣」以外的漢字分拆觀,只是主觀的習慣問題。一味高擧一套主觀習慣,不肯接受其他有理的看法,把其他看法主觀地套上「難學」的標籤,其實這才把漢字引往歧途的惡念。我說這句話,可不是沒依據的主觀感言,而是基於一段活生生的漢字歷史。
 自楷書通行以來,學習、使用漢字的人,世代以楷書筆畫、筆順作漢字單位,與部首一起作爲漢字的檢字方法5),從唐至今歷經一千三百年。但筆畫無固定次序,檢字效率欠奉。爲此,二十世紀初至中期,王雲五先生發明「四角號碼」,林語堂大師先後研訂「漢字號碼索引法」、「末筆檢字法」、「上下形檢字法」等,並製成「明快打字機」,爲漢字排序檢字大開便捷之途。這些四角號碼、上下形檢字法,已把中文部件、筆畫斷開,以筆形組合甚至形塊,作爲漢字的單位、組件。可惜當時的人都戴着有色眼鏡,認爲它們切離了傳統文字美學,只爲追求實用而拆開漢字,冒起了抗拒情緒。結果大師傾家蕩產製成的劃時代發明,得不到應有的歡迎,遭眾人埋沒。中文險些就陷入不容於日用打字機、電腦之困局中,跌進了能否適應新科技的存亡危機6)。這才是眞正的「文字浩劫」!名爲「習慣」之有色眼戴,可眞誤漢字不淺。這是眞實的歷史,不是我的個人主觀看法。唯幸後來能打破這僵局,其中一位重大功臣正是倉頡之父朱邦復先生,除了倉頡這檢字系統,他還對中文電腦貢獻良多。
 眞的無法改變過去習慣的人,去學其他輸入法,不是壞事,我也絕對尊重。畢竟「習慣」這東西有時就是這麼折人。而科技以人爲本,令它適應不同人的習慣,是大好事。行列和其他類似輸入法之存在,的確方便了這種人。不過,若要把一己的習慣,說成是優點,用來攻擊倉頡,像行列的文宣內容般,其實說破了,是這些人放不下有色眼鏡,對漢字了解得太少,把自己管窺蠡測之見,當成是漢字的本質。
 用輸入法去打字,講求實用,不爲審美。至於書法,涉及美學,法以之一套「客觀的主觀」,當另作別論。把風馬牛不相及的兩者混爲一談,難免張冠李戴,思維錯亂。對一知半解的人,也許有市場;對眞知灼見之士,只會貽笑大方。但願行列和其他類似輸入法的發明人、維護人,只管宣傳自己依寫字或書法習慣之「特點」,不要強把這習慣加諸他人身上,說成是「優點」,收起攻擊他人方式是「缺點」之惡言。這樣在宣傳自己時,才不會惹來有識之士之反感。
♪ 本作品以Creative Commons 署名-非商業性-相同方式共享 3.0授權條款授權。如欲回應,請移玉步至《刻石錄》原文。
(繼續閱讀...)
文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣(221)

  • 個人分類:輸入篇
▲top
  • 2月 10 週三 201614:11
  • 平反倉頡(下)


 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:平反倉頡_下
 續上篇,一郎繼續說我看到的眞相,到底跟牟利輸入法對倉頡的攻擊文宣有何分別。
 文宣:我們的輸入法重碼率或選字率很低,適合盲打。
 眞相:依實際數據分析1),倉頡輸入法才是重碼率最低的,這和它的取碼設計有關2)。如此宣稱的牟利輸入法,它們的重碼率可能一點也不低,或者依靠簡速鍵等「官方外掛」來達成低重碼率。甚至連「重碼率」一詞都要迴避,取巧地改用「選字率」或「加用第一及第二選字鍵即時選字後」來計算,玩弄語言僞術。
 文宣:我們是最具國際觀的,能夠輸入多國語言漢字,貫通正、簡、日,外國人也適合學習使用。
 眞相:倉頡早就支援超大漢字集,無論是Unicode,還是朱邦復先生那收字更多的「倉頡系統」,編碼都老早就公開。對倉頡來說,不論正、簡、日、韓,所有漢字都地位平等,在相同模式下,按同一套拆碼規則輸入,重碼率還很低。因爲在設計字碼階段時,朱邦復先生已顧及這問題,像「場、场」、「穗、穂」或「營、营、営」等字組,都不重碼。
 相反,有些宣稱自己支援大字集,卻不見支援Unicode的官方編碼,只有民間擁躉補完。更甚者,那些輸入法,字根不區分正、簡、日寫法,例如「釒、钅」或「貝、贝」等正簡字組,組內彼此間都歸入同一主根。輸入法過去甚至慣以拆簡體字的碼,來輸入正體字,當要同時輸入正簡字元時,就會構成嚴重重碼。結果,它必須區分開正體模式、簡體模式、日韓模式,要麼只能出正體字,要麼只能出簡體字,要麼只能出日韓漢字,無法同時輸入各種寫法的漢字。這根本就是沒有國際觀,不能同時支援多國語言裏的漢字。更莫說還有許多語言並不使用漢字,支援漢字並不等於支援多國語言。

 文宣:不論你怎麼寫,用甚麼字形來拆碼,我們的輸入法都支援。倉頡卻不支援異體字。
 眞相:倉頡並非不支援異體字,在「倉頡系統」中,異體字有不同編碼,用者以哪個寫法來取碼,就能輸入該寫法的異體。例如以「竹人木手弓」得出「衛」字,用「竹人木月弓」鍵入「衞」字。本來中文系統就不應該排除異體,應該像倉頡系統般,讓用者輸入不同的寫法3)。看我在《刻石錄》上的「說文:字形篇」,那些指責作業系統逼迫他人用臺標寫法的文章,就知這問題令中文使用者多麼懊惱,連使用心目中寫法的字形之權利都遭剝奪。然而,過往市場上的正體中文作業系統,都採用不支援異體的Big5編碼,削去了倉頡支援異體的功能。現在Unicode,支援部份異體字,像上述的「衛」與「衞」,它們已立即能夠用倉頡輸入。但Unicode也合併了的異體,例如「令」字,就無法支援較符合字理、下方從「ㄗ」的寫法,這不是倉頡的錯,是Unicode、Big5編碼的錯。改用倉頡系統的話,兩個「令」字皆可正確輸入和顯示。
 至於過去那些宣稱支援異體的輸入法,其實只是讓你想着異體來拆碼,卻打出Big5中的臺標字形。你明明想打「衞」字,拆碼正確,卻變成系統裏的「衛」字,顯示不正確。若需要這樣的倉頡,以往在DOS裏運行的國喬系統就有,許多改良版的免費倉頡也有提供,用者都可以合法地取得、安裝和使用。「不支援異體字」,只是「依Big5版本的倉頡」之問題,不是倉頡本身之問題。
 再說有些標榜支援異體的輸入法,連明顯是錯別字的寫法也「支援」。好像「眔」字,粵音「踏」,北音「dà」,「懷」、「鰥」等字從之。有輸入法卻當成是「眾」字的異體,拆「眔」形出「眾」字。這又是否好事呢?
 文宣:倉頡沒有容錯碼、簡易的符號輸入碼、假名或諺文輸入、同音字功能、萬用碼功能、打正出簡(或打簡出正)功能、詞組模式。我家的有啊。
 眞相:許多改良版倉頡都添加了這些功能,喜歡甚至在意它們的用者,可選擇這些改良版。甚至我可以說,即使沒有任何改良版本令你滿意,但倉頡發明人早就公開宣佈放棄版權,你可以用他的編碼表去改良,自製合你心水的版本。隨着系統更新,即使是作業系統的預設版本,也加入了部份功能。這些新增功能,並不影響原來輸入法拆字編碼之優劣評價。要動用這些來作攻擊倉頡的武器,是否在主體上輸給別人,就拿無關宏旨的東西來攻擊呢?
 文宣:我們是首創唯一只用二十六個英文字母的中文輸入法,智能電話系統也能用。
 眞相:倉頡字母只用二十五鍵,還留下了「Z」鍵作特殊功能用。也一樣能用於智能電話系統中。
 文宣:倉頡造就了專家權威、培訓中心老師飯碗和收入保證、手寫筆廣告的媒體收入等「好處」,其他輸入法流行起來,就會把這些都「破壞」了,所以要保住倉頡。
 眞相:這種純粹訴諸人身攻擊(或曰「『輸入法身』攻擊」)的言詞,不看也罷。我學倉頡,只靠一本價錢相宜的好書。付出一次,受用終身。有些人單靠網上一些編寫得好的敎學,例如維基敎科書上的敎程,也能學得很好。相反,作出這種攻擊的輸入法,它本身是有專利的,不向該公司購買就不能使用,每次更新作業系統,又要等那輸入法出新版,再花錢購買。甚至連敎材都是那公司獨家的,不許其他「外人」編寫,許多獨門技倆都只在敎材上才談及4)。精明的消費者,到底是誰在打你錢包主意呢?
 文宣:倉頡有版本差異,出了新版本後,過去的學習者就要跟舊版一起「共存亡」。
 眞相:倉頡是開源的,出了新版並不會取締、消滅舊版。即使出了新版,用者也可繼續合法、免費、方便地使用過去的版本;即使更新了輸入軟件,也仍會繼續合法、免費地支援過去版本的倉頡編碼。而它流通過的,只有三代及五代,兩者間差異極少,亦隨處都有合法、免費、方便的輸入軟件支援,誰都可自由選擇使用哪代的編碼5)。相反,作出這種攻擊的輸入法,它本身是有專利的,只要公司推出新版時,改變了舊版編碼,不再支援,那麼用者就眞的要與舊版一起「共存亡」。而有關公司也眞的做過這種事,例如在新版本中改變過簡速碼、放棄過舊版本使用的簡速字根等。用者除非堅持不升級,並且確保他那台電腦永不壞掉,否則就只能跟隨公司的新版,改變過往習慣。由民間擁躉編寫的査碼網站,更因此而要列出不同版本的編碼,對學習者帶來不便。
 寫了一大堆,算是爲坊間不實指控平反一下。各位讀者別誤會,我不是要主動攻擊其他輸入法。寫這文章,也只是看不過眼倉頡飽受無理攻擊,希望以親身體驗到的事實,平衡一下外間那傾側且失實的言論大氣。輸入法這回事,跟人的習慣有關,可說是百貨應百客。因此即使我在文中批評過該輸入法的缺點,但你覺得合適自己的話,請繼續使用它、喜歡它,我對此絕對尊重。只是若眞的要討論,我希望無論哪方都能以事實和公理作依歸。要是你還未接觸中文輸入法,現在或將來要挑選,我更希望你能具有慧眼,不要受像上方那些失實文宣所蒙蔽。
(繼續閱讀...)
文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣(256)

  • 個人分類:輸入篇
▲top
  • 2月 09 週二 201614:06
  • 平反倉頡(上)


 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:平反倉頡_上
 前文說到,許多輸入法,尤其牟利的,愛以攻擊倉頡作宣傳。我學倉頡前也看到不少,幸好當時有所懷疑,沒有上當。經過學習,破僞立眞。我僅列出一些常見的指控,以及我透過親身學習所看到的眞相,讓各位判斷。
 文宣:倉頡要背各式各樣的字根,又易忘記。我們則以英文字母象形來歸納字根,不易忘記。光是這輸入法是編成英文這一點,我覺得就很難讓我學別的輸入法了。
 眞相:英文字母與漢字部件系統差異極大,要是中文輸入法以英文字母象形歸根,一定有甚多牽強的歸納。比較某甲、某乙兩套以字母象形作賣點的輸入法,「辶」某甲歸「L」,某乙歸「W」;「了」某甲歸「Z」,某乙歸「W」;「戶」某甲歸「P」,某乙歸「F」;「厂」某甲歸「F」,某乙歸「L」;「山」某甲歸「V」,某乙歸「E」;「幺」某甲歸「S」,某乙歸「W」;「亞」某甲歸「5(五)」,某乙歸「O」。可見所謂的字母象形歸根有多主觀、牽強,一樣需要學習者死記。而且,中文常用部件有許多,單以英文字母象形,難以囊括所有字根。因此,在同一套輸入法中,還有大量字根,並不能用跟英文字母象形去記憶。例如某甲的「土、士、⺧」歸「G」、「車、東、朿」歸「0」;某乙的「弗、鬼、佳、衤」歸「V」,「兼、弓、犭、丈」歸「Q」,再牽強都無法與字母繫之以形。即是說,這些輸入法的學習者不但要強背死記,還要在記憶不同字根時,用不同的記憶或聯想方法。這極容易引起混亂,造成大量記錯與遺忘,絕不可能如文宣所說般易記。
 至於倉頡,主輔根加起來只有百餘個,而且輔根皆是主根或其他輔根的形狀變化、衍生,簡單、清楚、好記,絕不易忘。
 文宣:倉頡要死背口訣,以記憶中文字母的位置。我們跟英文鍵盤是吻合的,直接用英文字母,不用另外再背誦口訣,會英文打字的人直接上手,不會打的可以在練中文打字時同時練成英文打字。
 眞相:任何輸入法都必須記憶字根歸鍵的位置,倉頡雖用中文字根來歸鍵,但只有二十四個主根,要使手指的神經「記得」字根位置並不難,且莫說絕大多數中文鍵盤都印有倉頡主根,方便學習者上手。至於用口訣來把中文字母轉換作英文字母,根本是走了歪路,不是正確的學習方法1)。
 要是一套中文輸入法直接以英文字母歸鍵,一來,用者仍然要記憶該英文字母鍵的位置——他在腦海還是要把中文輔根轉換作所歸鍵的英文字母,然後以手指按動英文字母所在的鍵,不會因此而減低記憶負擔。二來,因爲英文字母與漢字部件系統差異極大,必有許多字根要強記,記它們會比記歸鍵位置難(如上方所述),結果是得不償失,對記憶的負擔還加重了。況且,即使它以英文鍵來歸根,中文編碼和英文字串也截然不同。一個人熟習了打「OAO」、「YYY」、「OAQE」等編碼組合,難道就等於他已慣打「capability」、「synonym」、「vocabulary」等字串,手指已條件反射地記得字串的指法嗎嗎?實際上還是要練習。

 文宣:倉頡的拆碼規則很「龜毛」(「婆媽」),很複雜,很難學。
 眞相:倉頡的拆碼規則是仔細,的確相比好些輸入法會顯得繁複,一般輸入法都不會對字身再分拆,但這做法符合漢字特徵2)。然而,規則定得仔細,不等於難學。輸入法眞正難學者,在於要死記死背誦,因字而異。但規則是任何情況都適用的話,就能一理通百理明,它是用來理解、用來明白,而不是用來背誦的。無論把漢字分拆成字首、字身,抑或把字身拆成次字首、次字身,原理都一樣,並不困難。眞的怕「龜毛」的話,學大新倉頡、快倉也行,它們都避開了最「龜毛」的取碼規則,因此也適合作過渡原版倉頡的跳板。
 相反,說人家難學的輸入法,自己是否眞的易學?它們當然會說是,並擧出像「OAO=哈」或「阝東=陳」等最直觀的例子。可是,它們的輔根數量多嗎?輔根與主根間的關係統一而好記嗎?它們的取碼規則統一嗎?有沒有許多「不依靠例外就幾乎不行了」的情況?官方取碼會否時常破壞自己的規則?(例如說好了「頭尾」事實卻依賴「頭頭尾」等。)拆字過程能直線順序嗎?還是時常看到「反芻」等非直線情況,或者碰上「最大根」仍要再拆的情況?要是這樣,那麼它們指倉頡「難學」時,其實自己才更難學。
 文宣:倉頡很容易忘記。例如哪個朋友的遠親,沒用半年、數個月,便幾乎忘記了怎麼打中文。我們的輸入法好學好記。
 眞相:自從學會倉頡以來,我從未忘記過。許多朋友也如此。誠然,要是有人丟下了一段長時間,變得生疏了也不太出奇,但任何中文輸入法也一樣,甚至單說英文打字也一樣,不單單是倉頡。而且,倉頡字根少,拆碼規則是略爲複雜但細緻,只要概念清晰,一明白了便不易忘記。不像那些此以攻擊倉頡的輸入法,邊強記了這堆字根歸在哪鍵,邊又忘記另一些,這才是眞正的容易忘記。
 文宣:倉頡打一字要五鍵,速度慢。不及我家輸入法快速、按鍵少。
 眞相:倉頡最多取五鍵,但許多常用字,都可以用一、二、三鍵輸入,平均數爲三碼多,與一般輸入法的平均數相差不大。當中不含要強記的簡速碼,平均三碼多就是平均三碼多,沒有摻進水份。況且取五碼之設計,來自嚴謹的統計與分析,有效區別不同的形塊3)。其他輸入法取碼數少於倉頡,卻引致輔根數量大根,或重碼率大增(甚至輔根數量與重碼率都大增)。有些甚至不靠開外掛(例如簡速碼)就難以達到高速輸入,其取碼平均數有「呃秤」(摻水份、欺詐)之嫌。
 文宣:我們有許多「簡速字根」、「一碼字」、「兩碼字」等,都是精華所在,讓用者提升速度。倉頡都沒有。
 眞相:但凡簡速碼,都是外掛,在正常規則以外架牀疊屋,以例外取代通則,增加學習者的記憶負荷。對於想在中文輸入速度比賽中得獎的人來說,肯犧牲腦汁去換取數百字之便宜,周瑜打黃蓋,也無可厚非。但一般用者應當不必依靠之,單以正常規則來取碼,即可得到相對較快、足以應付一般情況有餘的速度。要是一套輸入法不斷強調這些簡速碼,其實側面反映了它的編碼設計本身有缺陷,不靠這些例外難以達成高速輸入。如果你喜歡簡速碼,想背簡速碼去提升速度,在輸入比賽中得獎,可以學大新倉頡、快倉等改良版。大新倉頡還創了全球最高速的紀錄。若不需要,單是學習原版倉頡,已足夠日常應用有餘,不難達到頗高的速度。
 文章才寫了一半,篇幅已等於同系列文章的整篇,還是先擱筆一會兒。下一篇繼續說牟利輸入法對倉頡的攻擊,與我看到的眞相有甚麼差異。
(繼續閱讀...)
文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣(471)

  • 個人分類:輸入篇
▲top
  • 2月 06 週六 201618:10
  • 我學中文輸入法(四)——倉頡


 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_四
 學過許多輸入法,最後鍾情的卻是許多人說難學、罵言四處皆見的倉頡。以個人經驗來說,倉頡絕對不難。
 學倉頡前,我先細心選擇敎材。坊間敎倉頡的書有很多,編寫得好的卻不多,包括自稱最暢銷的那些。不少敎材,用甚麼「日頭、月餅、金星、木笛」或「日爺、月婆、今夕、目的」之類的所謂口訣,敎人強記「日=A,月=B,金=C,木=D」。不少敎材或字典,列倉頡碼時都用英文字母,而非倉頡字母。不少敎材,只列出倉頡的輔助字根及該輔根的例字,而字根間的形狀關係,則沒有清楚解說,甚至毫無解說。凡此種種,我皆捨之,以免誤入歧途。


《30天學倉頡》擷圖

《30天學倉頡》擷圖。




 最後,我選的書是伍新華編著的《倉頡輸入法:用戶手冊》。這書沒有上述通病,敎導學習者直接掌握倉頡字母在鍵盤上的位置,鼓勵學習者以條件反射盲打,清楚說明輔根的形狀關係,提醒學習者不要死記編碼,避免學習者走進誤區。它對取碼規則的解說相當深入淺出。雖是單色印刷,卻有清晰的例字圖解,分析一些容易拆錯和誤解的字。作者還特地說明異體字、香港字,以及不同系統(如微軟Windows、倚天、國喬等)間的問題,附有依部首、漢拼和廣東拼音的倉頡字典。整本書內容充實,去蕪存菁,售價也很相宜。我從它身上得益不少。若需要多媒體敎學,個人看過香港華通的《30天學倉頡》的一些示範,覺得不錯。
 撇除不宜盲打的筆畫、筆順輸入法,字根是所有形碼輸入法的入門。倉頡字根好記,主根輔根加起來才百餘過,在支援盲打的輸入法中,它是最少的了。1)輔根皆與主根繫之以形,把這個輔根的形狀加點變化,就可想到下個輔根。用這方法去歸納字根,最符合對形塊的聯想思維,很容易就能熟記。倉頡、大易能做到這點,行列則太講求座標理性而失陷此城。至於嘸蝦米之類的雜亂無章,就不再提了。記得曾看過有快碼擁躉撰文, 指摘倉頡歸根不直觀,如「」歸「木」,學習者只可以靠死記。可是,要是你知道:「木」→「」→「」→「」這四個字根間的關係,就壓根底兒不會說出這樣的話。 由主根「木」,變成「木字底」,取其主榦,再橫臥下來,形狀記憶「一條龍」,毫無難度。該撰文者以爲要死記,無知也。但這未必是他的錯,他可能不幸看到比較差的敎程,沒有說明字根間的形狀關係,他自己也沒有發現,於是他以爲只得逐個形塊死記。

 人謂倉頡難學,主要在規則。其實,倉頡的規則只是規定得比較仔細,這並不是難。沒有系統,要死記強記,自然就難。但規定得仔細,只要明白道理所在,就能一理道,百理明,不管到了多仔細的層次也一樣,以相同道理縱橫行走。因此,只要敎材解說清楚,擧例合宜,學習者能貫徹理解這些仔細(卻不是難)的拆碼規則,根本就沒問題。諸如整體字(亦稱連體字)與分體字,概念清晰。分體字中,只分字首和一層字身者,亦沒有難度。只是字身若還能再分出兩層,即是字身可以再劃出次字首與次字身,一般人來到這步才會覺得複雜一些。不過,既然懂得分字首、字身,那麼在可劃分的字身裏,也只不過是用同一種概念,來劃分次字首、次字身。明白了同一個切割概念,那就一點都不難。
 許多人都批評倉頡這樣做拆得太細,但倉頡取碼要拆得這樣仔細,是有理由的。多數漢字,左方或上方是部首,或者是較簡單、較常用來表示字義類屬的部件。而右方或下方,多數來說構件比較複雜,也比較傾向表示聲音(即形聲字的聲旁),或表示字義仔細項目的。於是,常用的部首或類屬部件,取碼可以少一些,只要足夠表現不同部首或類屬部件間的分別即可。而表音或表示仔細字義項目的部份,則需要較多取碼,才能合理地區分這些形塊。以實例說明,「嗎、碼、瑪」等字,區別在於左邊的部首。如果要用編碼去區分這些部首,編碼並不用太仔細,已能顯示到分別,符合所需。但「槢、樛、櫂」等字,差異在於右旁,而且它們右旁的開首還是相同的;「楛、楉、榙」等字,甚至連右旁的開首與結尾都一樣,只有右旁中間部份相異;「微、徵、徽」等字,左、右、中間的開首,也沒有分別,差異在中間的底部。因此必須把字分拆得仔細一些。
  其他輸入法取碼都沒這麼細緻,例如只簡單地取「首、次、三、尾」四碼,就很容易跳過了細微的差異位,釀成重碼,不能有效反映漢字間的特徵差異。比如「殼、穀、轂、觳、縠」等字,用大易或嘸蝦米,都拆作「士冖一又」,就會重碼。行列爲此而將「士」與「冖」這兩個字根合併,視爲一塊大字根,令這些字的第三碼有分別。但每碰到類似情況就增加大根的話,字根數量就會越來越大。比如不太常用的字裏,有「左『盧』右『攴』」,有「左『盧』右『皮』」,差異在右上方。用行列的話,單是「盧」偏旁就佔了三碼,末碼「又」也沒有分別,結果它就變成重碼。是否又要增加字根,例如把「虍、田」或「田、皿」併作一大根?或者增加「攴」或「皮」根並歸進不同的鍵?這樣頭疼醫頭,腳痛治腳,始終不是辦法。幸好「盧」旁的那兩個字都不常用,可以丟在一旁不加處理。但對於常用字,行列、嘸蝦米用這種一味靠增加大根的方法,就令它們有像「vmliu.xyz_liuzmd1_png.root.25_root_m_1_060.jpg」般的怪字根,使用者不容易記住。這難免令我感到醫生的醫術不甚高明。若以倉頡的方法,「殼、穀」等字,字首的尾部顯然有分別;字首是「盧」的兩字,字身的開首不同;「微、徵」等字,次字首的尾部相異。要區分它們,用倉頡的拆法就非常簡單。
 發明倉頡輸入法的朱邦復先生,曾爲漢字的分拆大費周章。他先留意到,今天漢字形聲字佔了八、九成,大都可分成上、下偏旁或左、右偏旁,而在上或居左者通常較簡單,得出字首、字身之概念。接着又花上好幾年,從字典裏剪字,分析出約六百個字首、九千九百個字身。由於倉頡字母限定於二十六個以內,以適應一般電腦鍵盤,他計算出字首可取一至兩碼,即有六百五十個組合,足以表達不同字首形塊;字身卻須取一至三碼,才可得一萬餘組編碼,以應符需求。在他撰寫的《倉頡輸入法手冊》和《中文電腦漫談》等著作中,已作詳細解釋過。這也是倉頡取五碼的理由——在這些設定背後,都經過發明人嚴密有理的分析。
 由於從編碼設計的第一步,已作了良好規劃,因此倉頡輸入法以一套比較客觀的取碼規則,即可達至很低的重碼率,例外字很少,可說它已接近做到「完美散列」。其他輸入法沒有這種良好規劃,就只能眼巴巴看着不同的漢字拆成同一組編碼,任由重碼字增加。有些設計者不甘心承認這點,就生硬地創造一大堆簡速碼,把重碼的字硬塞進空缺的編碼組合中。但這些簡速碼,因字而異,沒有規律。靠簡速碼來降低重碼率,只是在文宣上可以騙騙人,讓盲目的信徒瘋狂叫好,卻不算眞正解決問題。甚至有些輸入法的宣傳,連「重碼率」一詞都迴避,改爲「選字率」——因爲重碼組合裏的第一個字,並不當成要選字,因此「選字率」比「重碼率」低。但這只是一種取巧的語言僞術。
 要是眞的理解不了字身再分拆的概念,或者怎也取不到次字首、次字身的編碼,不妨試試改用大新倉頡或快倉。前者最長四碼,減去倉頡的第四碼,字身只取首、尾;後者三碼內搞定,字身甚至只取尾碼。相對來說,它們增加了重碼字,但對於不擅長字身再分拆的用者,這絕對不失是個好方案。從學習角度上,這也可作爲一個跳板,使學習者先熟習字首的取碼及字身的首、尾取碼,慢慢再掌握最後的「字身再分拆」那一關,過渡到原版倉頡。此外,大新倉頡和快倉都有簡速碼,去解決重碼問題,讓不介意背碼的用者提高速度。但若決心學習原版倉頡,就不要去背那些簡速碼了。
 倉頡以統一的拆碼規則,即可達成低重碼率,無須死背簡速碼即可實現盲打,對接觸漢字的人來說十分方便。尤其是倉頡設計時,用來分析的漢字取樣,是出自《康熙字典》等大型字書,而不是只得數千常用字的小型字集。因此,即使字集擴大至Unicode收錄的數萬字,倉頡重碼率仍然不太高。在一萬三千字的Big5碼中,倉頡只有不足五百個重碼字2)。即使擴大至Unicode 3.1的七萬字,也有五萬五千多組編碼完全不重碼3)。而倉頡也早支援大字集編碼,不像別的輸入法般,遲遲仍是有字無碼。可能不少人只消輸入常用字,但像我這樣,時常接觸香港字、異體字、罕用字的人也不是少的。倉頡能帶給我這種方便,其他輸入法都不能。
 或說倉頡有版本差異,令學習者無所適從。其實,倉頡通行者,僅有三代與五代。兩者只差兩個字根、數個複合字和複合字首,逾97.8%的字編碼相同4)。雖然微軟的做法:Big5碼內字取三代編碼,Big5碼外字取五代編碼,的確讓用者不便,但這也只是微軟的錯。許多開源正版免費的輸入法,支援純三代倉頡、純五代倉頡,以及Big5碼內碼外字都同時兼容三代及五代的倉頡,可以解決這問題。
 倉頡普及,各大大小小系統都支援,而且老早就開源,發明人放棄一切權利,領先於開源潮流。雖然是先行者,但各方面都比後來者優勝,招來嫉妒、攻擊也正常。好些輸入法,尤其牟利的,都愛以攻擊倉頡作宣傳。好些學習者還未接觸倉頡,或者僅是初試其皮毛,就已有心理障礙,覺得應驗了其他輸入法所作的負面宣傳。有這些先設想法,就當然不會學得好。這正中了牟利輸入法的圈套。
 以個人經驗來說,倉頡字根,字形容易關聯記憶;倉頡拆碼,規則統一有條理,符合漢字特徵。倉頡不難學、不難忘,效率也高。靠着它,我到哪部電腦裏,輸入中文都暢通無阻。
(繼續閱讀...)
文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣(1,679)

  • 個人分類:輸入篇
▲top
  • 2月 05 週五 201618:06
  • 我學中文輸入法(三)——行列、大易、快碼


 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_三
 撇除了設計混亂的嘸蝦米,餘下數種正體中文用者間常見的輸入法,多是大根形。我說的是行列、大易、快碼。這三種輸入法,也有好些相似點。
 行列是字根分佈上最有理據的輸入法。先把筆畫或筆形分作十類,再看字根的首與尾屬於哪類,依座標系統歸到相關的位置中,例外的歸位甚少。接着,用這260個字根來拆字,依筆順,取首、次、三、尾碼,不在同一筆斷開,例如「更」是「一曰乂」。個人學習時,覺得這輸入法挺不錯。唯一問題是,到實際操作起來就很慢。因爲在腦子裏,要先把漢字拆作字根,再思考每個字根的首、尾屬於甚麼筆形。拆一個字就要思考數次1)。結果,我以爲在理論上學會了,在實踐時卻不甚愜意。
 後來我嘗試作弊,直接記憶整塊字根形狀,以及它歸在甚麼鍵。卻發現歸在同一鍵中的字根,雖然一起筆的筆形有共通點,但整塊形狀的差異可以很大,不太能從整塊形狀去聯想。例如「風」、「幺」與「爿」同歸「2↓(X)」,「不」、「夫」與「雨」同歸「1↓(Z)」2)。不透過首、尾筆形來思考,是記不到的。結論呢,還是無法作弊。行列的字根歸類,雖然很有系統,但這系統缺乏形似上的關聯,不易讓學習者以形塊形狀去聯想,每次都要依座標系統來推理。
  大易3)也是大根形輸入法,有254個字根,與行列相若。用這些字根來拆字,依筆順,取首、次、三、尾碼,不在同一筆斷開。這樣說起來,眞的和行列很相似!但實際拆起字來,兩者也有不少差異。大易輔根的歸類方法,以形似爲則,大多數字根都能由形狀作聯想,從字形直覺上,比行列好記。原來人類記憶字塊,主要依靠的還是整塊整塊的字形,而不是逐個筆畫或筆形去記。而且許多正體中文鍵盤上都有大易的主根,我們不必死記字根對應甚麼英文字母,直接記憶字根的位置。有些人喜歡強記「人是A,革是S」,甚至大易官方也提供所謂「口訣」:「捺金鈴,㇏金0。愛慕,I木。水叉叉,水乂X……」這其實是費時失事的。這種強記,在短期間內,可能會帶給懂英文打字的學習者少許方便。但它本身並不是字根歸納的原理,而且習慣了這種記法後,每次打字時,都要多經「把字根轉換作英文」的一關,日後會成爲提升輸入速度的絆腳石,不便於練習盲打、觸覺打字。

 再說,「愛慕」在漢語的北語(包括大陸普通話、臺灣華語)裏與「I木」同音,在其他漢語語言裏就未必,例如粵語。這些口訣使本來設計上沒有語言之限的純取形輸入法,變成對非北語用者不利,有違設計初衷。嘸蝦米其中一大敗筆,就是有些字根按「音」歸鍵,但所據的音偏重北語,對其他漢語語言用者不公平4)。大易輸入法本來沒有這問題,因此不要爲強作所謂「口訣」,而重蹈嘸蝦米的覆轍。
 大易的字根歸納純以形似出發,雖然有些字根還是容易記漏,但實在比行列好記得多。然而,它的字根設計不見得比行列好。雖然行列和大易的字根數量相似,有好些字根形狀也很像對方,可是還是有一些差異。這些細微差異就可以令結果很不同。行列把「角」歸「J」鍵,把「魚省掉灬」歸「U」鍵,「魚」字要打「U,」,「鮭、觟」不重碼。大易視「角」爲「魚」的輔根,結果就重碼了。行列把「車」和「甫省掉點」歸入「Q」鍵,「甫」字要打「QH」,「門」歸「E」鍵,不重碼。大易把「車」、「甫」都設定作「門」的輔根,就形成「捕、捙、捫」等重碼字組。
 但這不等於大易的重碼字特別多。看輸入法研究者泰瑞的分析,其實大易的重碼率只是比倉頡略高少許,但行列的重碼率卻明顯高了一截。行列的重碼問題,在於「估你唔到」——在思考怎樣拆一個字的時候,你怎會想像到,「金、半」同鍵,「泮、淦」、「判、釗」會重碼?憑依稀的記憶,使用大易時,大概會有這種心理準備:「又遇到這個根啊,大概會跟哪個哪個根重碼了。」使用行列時,則是:「咦?怎麼這樣的字形會重碼呢?啊,想一想,好像又是啊……」而「大」與「不」重碼,「大受感動」與「不受感動」隨時會相混,更令人一臉「囧」然。
 大易另一缺點,是要使用數字行(或稱「第四排」)的鍵來作字根。學拆字時,不覺得有甚麼問題。練打字時,發現手部活動範圍的確較大,但也說不上很不便。網上還有用者說,在手提電腦裏數字鍵會移位甚至消失,影響使用。但我用過幾部手提電腦,鍵盤基本上都正常,頂多是「'[]-\」少許移位。消失的是右方的數字鍵,不是「第四排」。
 接着要說的是快碼。快碼也是拆大根,也以規則容易作招徠。與大易一樣,使用四排按鍵,規則是:非橫分字,取首、尾碼;橫分字,取左邊的首碼,右邊的首、尾碼。即是取二至三碼。口訣是:「頭尾,頭頭尾」。看起來它比大易更簡單。可是我會說,快碼是劣化版的大易。
 首先,取碼這麼少,意味着重碼機會很高。像「茉、茱、萊、茶、荼、菜、葉、藥、蔾、葇、茦、棻、蘖、蘗、蓁、蘇、葆、蒢、蒤、藻、蓧」等,都是非橫分字,只取首尾,所以都是「艹木」。這不成了依賴選字的速成麼?怎樣盲打?
 而且它的輔根歸類,比大易更忽視細節差異。例如「T」鍵,主根是「木」,輔根卻有「本、未、末、禾、朱、耒、秉、乘」。所以,要是遇到最大根就直接取之,那麼「沐、沫、沬、洙、泍、洡、溗」、「林、秝、柇、枺、秣、株、秼、棅」等,全部都會重碼。結果好些字身都不是取最大根,需要再拆。例如「朱」也常拆作「⺧木」;「株」除「木朱」外也會拆作「木⺧木」;「洙」更一定要用「氵⺧木」才能輸入,不能拆作「氵朱」5);甚至「茱」非橫分字,卻除了「艹朱」外,還會拆作「艹⺧木」,與官方宣稱的取碼規則不相符。同理,「菜」也拆作「艹爫⺥木」,「藥」也拆作「艹幺木」,即是都可取三碼。我可以說,原來取碼規則是用來無視的嗎?官方自己無視自己的規則,而且不是僅佔少數的特例,是爲數甚多的常態。同一部件在不同字裏,也往往因此而有不同拆法。容錯支援也很隨機,例如「朱」字支援「ノ未」這容錯拆法,但其他「朱」部件的字都不可以這樣拆。6)
 同類問題充斥着整套輸入法的編碼中。雖然,快碼的規則的確比許多輸入法簡單,看着印滿主根與輔根的專用鍵盤,要初學者一接觸就能出字,的確無難度。但它用了四排按鍵,也如此依賴選字,重碼的候選字長得有速成的一半,彷彿就是白浪費。看來若不靠官方外掛,也難以盲打7)。據悉,快碼說明書甚至說它的重碼率約爲百分之五8),這是謊言還是「語言僞術」呢?
 而且快碼與嘸蝦米一樣,是擁有專利的。要使用快碼,得買它的軟件,買它的自家鍵盤(鍵盤上印有英文和快碼字根,沒有倉頡、大易的)。那時我還是學生,跑到腦場裏,在他們的推銷攤位玩。的確,看着齊列字根的專用鍵盤,很快就能出字,但我心裏暗忖:非用他們的專用鍵盤不可嗎?花錢買了正版,安裝軟件、安裝鍵盤,在自己家裏熟練了,那麼,到公共圖書館去,到別人的家裏去時,又如何呢?幸好我當時想到這點。現在看看快碼的公司,雖然還有發售這輸入法,可是資源都投放到九方輸入法去了。官網沒有快碼的敎程(只有用來宣傳,吹噓自己有多易學多快速的簡單擧例),連字根表也小得看不清輔根!網上也找不到網友自編的。
 想當初,快碼與嘸蝦米的發明者,寫過多少攻擊倉頡的文章,說倉頡害了幾多人。快碼作者叫梁立人,大家看看他在報章上的離奇膠論,可知他平日也是狗口長不出象牙,愛人身攻擊、扭曲事實。他罵倉頡,說它「落後過時」,是「清朝婦女的纏腳布」,「十碼九騙」之類,論證過程中用了許多詭辯,炸藥份量與發明嘸蝦米的劉重次不遑多讓,但口腔裏的那股臭味更爲濃烈。那時在中文輸入法世界的論壇上,就有不少壇友不齒其言,予以反駁。只是事隔多年,找不回了。
 我個人會建議:怎也只鍾情於大根輸入法的朋友,不如直接學行列或大易。畢竟主流系統都支援它們,或者都能輕易取得免費又合法的支援軟件。拆字的直觀度不會輸給快碼和嘸蝦米。而這兩種間,個人推薦大易多一些,感覺上它比行列容易。至於能適應小根的朋友,倉頡輸入法,或其衍生改良版,仍是很好的選擇。在芸芸改良版中,要容易上手而不怕選字的,可以用速成甚至輕鬆輸入法,尤其後者拆碼眞的超輕鬆,痛苦的部份是選字吶。不想依靠選字,想高速,但嫌倉頡拆碼規則太仔細,可以考慮快倉輸入法(最多三碼)或大新倉頡(最多四碼),它們都跳過了倉頡拆碼最講究的那一至兩個碼,增加了簡速編碼、詞組輸入等去提升速度——即是開外掛,但外掛取碼比嘸蝦米那種有理得多。思路條理清晰的,我還是推薦原味倉頡,根據個人經驗,它絕對沒有坊間所說的難學。
 說起來,其實好些以簡體起家的形碼輸入法,如王碼(五筆)、鄭碼等,都支援正體字拆碼的。可是它們設計時,是從簡化漢字入手的。看過網民說,它們的正體字部份,重碼率都很高。我就暫且不論了。
(繼續閱讀...)
文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣(10,197)

  • 個人分類:輸入篇
▲top
  • 2月 04 週四 201618:56
  • 我學中文輸入法(二)——嘸蝦米


 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_二
 我先從輸入法的理論、系統、設計着手,學習多種正體中文用者間常見的輸入法。結果,我最快放棄嘸蝦米。主要原因是:它的字根設計得太亂、太無理。請留意,我不是嫌它341個基本字根、156個簡速字根1)太多。嘸蝦米是大根輸入法,字根多是難免的,但它把字根歸類得很沒有系統,這才是致命傷。
 蝦米族當然會不同意這觀點。他們會說,字根雖多,但歸類得很易記,只不過是取形、音、義相關而已。可是,哪些字根取形,哪些取音,哪些取義?官方說「只要唸得出聲音來,大部份都取其音」,卻有大量例外,例如取形的「力、工、言、口、亞、田」和取義的「人、車、中、央、屯、曲」等,都明顯唸得出來。蝦米族說只要「多看多練」就可。不過,有哪種輸入法不是這樣的?對我這種講究道理的人來說,這不是答案。能看出規律、練出法門嗎?還是要走馬看花般看,囫圇吞棗地練,學得迷糊含混?尤其是嘸蝦米所謂取義的字根,又包含了像「曲、㣺、巴、虫、冘、旡」等並不是取義的2);所謂取音的字根,也包含了像「亡、辛、牛、云、且、聿」等不是取音的;所謂取形(與英文字母象形)的字根,也包含了像「(D)、扌(J)、彡(M)、マ(T)、亞(O)、辶(W)、 (H)」等難以聯想的。
 再說,取音是取聲母、韻母、英文字母諧音,還是哪種?「不、方、立、皮、竹」取聲母,「也」取韻母,「耳、爾、寅」取韻尾,「西、夕、雨、魚、于」取英文字母諧音,「月、又」取聲母和介音的英文字母諧音,「尹3)、永」取去掉韻尾的英文字母諧音,「酉、與、髟」等聲稱取音卻不知取甚麼音,怎唸都不像4)!「小、少、身、生、世」取聲母歸「S」,但「食、氏、升」卻歸「X」;「方、丰、飛」歸「F」,但「弗」歸「V」;「瓜、甘」歸「G」,但「弓、冎」歸「Q」。更離譜的是,「卜」取聲母卻歸「P」而非「B」;「臼」歸「G」而非「J(北語)」或「K(粵語)」;「戶」歸「F」而非「H(北語)」或「W(粵語)」(但「乎」則正常地依北語歸「H」);「黽」讀「敏」,卻取「繩」音歸「X」;「虍」唸「呼」,卻依「據」音歸「Z」(但「據」的漢拼爲「jù」。此外,「Z」、「J」的取音輔根也歸得一片凌亂。);「糸」一般讀「覓」,卻似乎被當作「絲」音歸「S」。這次第,怎一個「亂」字了得!
 況且它取音的字根,也以北語(包括大陸普通話、臺灣華語)爲主。如「午、瓦、文、巫」歸「W」,但前兩者粵語讀「ng」聲母,後二字粵語唸「m」聲母。還有一些字根,因爲與北語的註音符號同形,就按註音符號而歸鍵。這些歸鍵,都不易讓香港人(或其他非操北語的漢語用者)習慣,增加了非臺灣用者的學習難度。一個拆字輸入法,本應單純以字形出發,不論其音,跨越各種漢語語言發音相異之屏障的。但嘸蝦米在設計字根系統時,就已高高築起這種屏障。
 但我還未說到戲肉。嘸蝦米歸形的字根中,竟有一部份是依靠簡化漢字作聯繫的!留意,我並不是反對形碼輸入法兼及簡體字拆碼,讓簡體用者以同一套字根、規則去打出簡化漢字。能夠輸入所需的字,不致於有字無碼,始終是件好事。但我要指出的是,嘸蝦米有些輔根的歸形,以正簡轉換作聯繫。用者要先懂得那字根的正、簡兩種寫法,才能把該輔根聯繫起來。你得先懂得「婁」簡體寫作「娄」,才知道「婁省掉女」這輔根歸入「米」根;你得知道「堅」簡體寫作「坚」,才知道「臣」這輔根歸入「〢」根。請問我可以只學輸入法,而不必學簡化漢字嗎?可以嗎?可以嗎?!更莫說「臣」變「〢」並不符合簡化漢字的推類規則。

 順帶一提,嘸蝦米的官方字根表中,其實漏掉了好些形狀相似的形塊,即是有若干實際應用上會碰到的字根沒有列出來。這不是嘸蝦米獨有的問題,不少輸入法的字根列表,也會這樣省掉一些形狀相似的形塊,例如只列「食」而省掉「飠(食偏旁)」,只列「金」而省掉「釒」等。要是省略得合理,一般人靠列出的根都能關聯到省去的根,也不疑事。但嘸蝦米只列出「夂」而省掉「攵」,只列出「佳」而省掉「隹」,未免太超過了吧?這些形塊雖然外貌相似,但絕大多數人都知道是不同的字或部件。不一併列出來,難免會令人困惑。又像只列出「歹」而省掉「」,用者要拆「互」字時就難免抓破頭顱。更弊的是,一向強調容錯碼很多的嘸蝦米,偏偏不替「互」字設任何容錯碼。只列出「」而省掉「」,也使「留」的拆碼變得難記。
 嘸蝦米還有一堆簡速字根,可是簡速字根又如何歸類?繼續取形、音、義?「俞」可能取形,「並」可能取音,但有很多也不知何解,官方亦隻字不提,沒有人解釋到是依甚麼系統。蝦米族說,簡速字根可以不記,用本來的字根也可以輸入漢字,不記得就不用簡速字根。但蝦米族也說簡速字根是提升速度和減低重碼的關鍵。迴避它們,始終不是我要聽到的答案。
 輸入法規則設計上,嘸蝦米的「補短」規則也很挫敗人。一個字的末根既已取了,還要再把它「反芻」,再拆開它的尾部,取出眞末根。這種「反芻拆出眞末根」的做法,唯一好處是減低重碼率。同一鍵背負太多字根,重碼率自然高。例如說,把「少、身、生、世」都歸在「S」鍵,那麼「鈔、銵、鉎、鉪」就會重碼。但因爲要反芻再取眞末根,「鈔」的眞實取碼就是「金少ノ(ASP)」,「銵」的眞實取碼就是「金身ナ5)(ASX)」,「鉎」的眞實取碼就是「金生一(ASE)」,「鉪」的眞實取碼就是「金世∟6)(ASL)」,它們就不重碼了。然而,要是輸入法設計者在定義字根時,就已經把這些形狀裁小,分拆成兩個字根,也能達致相同效果。那麼爲何要定義這片大形塊作字根,不把它拆開,變成兩塊較細小的字根?
 「反芻拆出眞末根」的設計是很不必要的。這做法令用者在拆字過程上,並不是一直線順着去。拆字思路流程會變得不順暢。有時眞末根甚至不是原末根的一部份,而是全部,就更令人無言。比如「卒」字取「十十(JJJ)」,原末根「十」反芻,再取眞末根「十」,結果「十」這部件就被取了兩次。「口」和「囗」二字都取「口口(OO)」,整個字都反芻取兩次碼。「回」字取「口口口(OOO)」,第一個「口」是外框,第二個「口」是裏面的原末根,它反芻再取出眞末根「口」,內裏的「口」部件又取了兩次,還跟「品」重碼。(「品」字本身已取了三碼或已上,不用補末根,因此不是「口口口口(OOOO)」。)
 有時同一個部件或形塊,要補甚麼末根,也是隨機的!例如「八」字作右偏旁的字。當中「扒」字在甚麼模式都能補「㇏(N)」或「丶(A)」。「叭」字在正體中文模式只能補「㇏(N)」,在簡體模式卻可補「㇏(N)」或「丶(A)」。「汃」、「釟」、「朳」中則只能補「㇏(N)」。如果說「扒」字補「丶(A)」是容錯,爲甚麼「叭」字只在簡體模式才需要容錯?而另一些「八」偏旁的字就不用容錯嗎?
 再說,嘸蝦米即使用這方法,重碼率仍然相當高7),它的用者可以勝出輸入速度比賽,靠的是簡速編碼。除了上方提及的簡速字根,還有個別漢字的簡速碼,例如一碼字、兩碼字、兩碼字借作字根(但有些兩碼字則不能)、加V鍵快速字等。就如上述的「回」與「品」重碼,「回」可以用「OOV」或「OOOV」出字,「品」可以用「OV」出字。這輸入法靠這些正常規則以外的特殊編碼,去簡化按鍵數目,提升速度和支援盲打。
 但這種簡速碼,根本就是開外掛。要記這些簡速編碼,基本上都要逐字去記,每個字有個別的、不同的簡速編碼,很難說得上有甚麼系統、甚麼解釋。就像我唸高中時的那個化學科老師,不仔細說清化學原理的系統、解釋,只管一味說甚麼地方公開試必出,這裏那裏多少條化學公式要死背,甚麼關鍵字不可缺少或串錯,不能用同義詞代替,原因是:「你猜改卷的評分員,會有時間逐字去嗅你的萬言論文麼?哪管你寫得狗屁不通,意思相反了,只要看到有這些關鍵字,一個都不少、不算錯,就給你滿分。」有些同學很受落這套類近補習社式的敎法,但我因此而完全讀不進腦。若要靠死背去開外掛,爲何不把這些時間花在理解正式原理、規則之上?反正都是要花時間去記、去熟習,要是去記一些表面上略爲複雜的規則,我可以一理通,百理明。要是去記這些因字而異的簡速編碼,囫圇吞棗地爲拿分、爲高速而死背死記,不求甚解,我受不了。
 官方開外掛,靠外掛才可以贏,其實在一定程度上,也反映本身的拆字系統設計並不夠理想。而且,其他輸入法也可以用同類方法開外掛。倉頡輸入法開了外掛,進化成快倉或大新倉頡,也有同樣效果,速度上更勝嘸蝦米。要單純追求速度的話,學嘸蝦米不如用大新倉頡或快倉。至於一般用者,根本就不應額外去記去背一大堆簡速碼,應該用正規的拆碼規則,取得不錯的、足夠日常應用有餘的速度,這已很好。
 誠然,蝦米族的擁躉也有不少,這種輸入法雖然不適合我,卻適合不少人。百貨應百客,我絕對尊重蝦米族對嘸蝦米輸入法的喜愛。不過看到嘸蝦米官方不時熱衷於踩倉抬嘸,有些蝦米族也中了這毒,例如把自己爭取到學校中文打字課程棄倉投嘸,視爲人生的功績8),我想我也有必要表達另一邊的感受和觀點。要記數量龐大卻雜亂無章的字根與編碼組合——341個基本字根、156個簡速字根,472個兩碼字9),還有加V鍵快速字、兩碼字能借作字根的部份,諸如此類,不勝枚擧。甚至有些字,擁躉還建議靠簡體拆碼來打才會有效率10),要我在輸入正體字時想着簡體形狀。不論蝦米族如何緊跟官方說法,四處拿着大聲公高喊「一點也不難」,對好些人來說就是難,就是亂,就是沒條理,就是不適合。所謂的「多看多練」、「看個幾次就會了,不用背啦」,只不過是任何輸入法皆可高擧的宣傳口號。蝦米族說兩三個月內(甚至說一個月內、數週內、一週內)一定學會,但是有用者就是學不會。栽在嘸蝦米凌亂的設計和字根中,以及官方外掛裏的學習者,是大有人在的。
(繼續閱讀...)
文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣(2,491)

  • 個人分類:輸入篇
▲top
  • 2月 03 週三 201617:27
  • 我學中文輸入法(一)——總論

 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_一
 自小對中文字有興趣,但家境不算很好,小時候沒有電腦,自然與中文輸入法無緣。
(繼續閱讀...)
文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣(487)

  • 個人分類:輸入篇
▲top
  • 1月 30 週六 201604:26
  • 新舍入伙

 自暴元亂世,惡勢歪治,一郎蝸居陋室,餐風飲露,獨箇兒寫刻石錄。今建新舍,寄存拓碑,不求聞於市俗,唯願饗以知音,不嫌酒淡乏香、菜薄無味。謹此作序。
(繼續閱讀...)
文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣(12)

  • 個人分類:
▲top
1

個人資訊

內木一郎
暱稱:
內木一郎
分類:
藝文情報
好友:
累積中
地區:

熱門文章

  • (10,197)我學中文輸入法(三)——行列、大易、快碼
  • (2,491)我學中文輸入法(二)——嘸蝦米
  • (1,679)我學中文輸入法(四)——倉頡
  • (471)平反倉頡(上)
  • (256)平反倉頡(下)
  • (221)截筆是「浩劫」嗎?
  • (112)狗肉字根我不受

文章分類

toggle 造字 (1)
  • 輸入篇 (9)
  • 未分類文章 (1)

最新文章

  • 狗肉字根我不受
  • 字根不良難煮字
  • 截筆是「浩劫」嗎?
  • 平反倉頡(下)
  • 平反倉頡(上)
  • 我學中文輸入法(四)——倉頡
  • 我學中文輸入法(三)——行列、大易、快碼
  • 我學中文輸入法(二)——嘸蝦米
  • 我學中文輸入法(一)——總論
  • 新舍入伙

最新留言

    動態訂閱

    文章精選

    文章搜尋

    誰來我家

    參觀人氣

    • 本日人氣:
    • 累積人氣: