原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:狗肉字根我不受

 中共治下的大陸,曾有一輸入法,名曰「認知碼」,是甚麼「國家『八五』重點科技攻關項目926工程」的成果之一。嘩,好不巴閉,小鳳姐云:「齊鼓掌!」啪啪啪。雖然大家根本不明白一個輸入法有甚麼「重點」的科技要「攻」甚麼「關」做甚麼「工程」,甚至不知道甚麼「八五」甚麼「926」是年份月份日子項目數量還是甚麼瞎扯吹牛皮。它曾通過國家敎委的技術鑑定,曾在廣東、天津和北京一批學校裏試驗,還聲稱「效果很好」,打算在一九九五年推向全國中小學。然而,據中文維基百科記載,當時有硏究者在《計算機世界》撰文批評過它,以大量分析和數據指出它不宜推廣。後來,它像綠壩娘那般,在花了國家不知多少錢後就無疾而終,人間蒸發。

 認知碼的字根系統是怎樣的?據資料,它有四百個多字根,比大陸許多形碼輸入法都要多。硏究者撰文批評它時,就列出多數輸入法的字根數目作對比,直接指出字根越多越難記難學。不但學習者難以全部熟記,甚至連發明人也出糗。明明設了「朱」這個字根,但連發明人自己都忘記,把「朱」的編碼設定爲「ノ、未」,其他「朱」部件的字也是如此,「朱」這字根就變成沒有用的垃圾。而且這不是孤例,認知碼的許多字根,都像「朱」一樣可以再分拆作兩個或多個字根。當中有些字根使用率不高,萬一眞的碰到它,用者就很難搞清楚到底要再拆開,還是不要再拆。例如在「鼠」、「黑」、「骨」要拆開的同時,「俞」、「愛」竟然不用再拆,這點就被撰文的硏究者擧出來批評。

 認知碼歸鍵方法,是看字根在北語中唸甚麼聲母。例如「韓」字拆做「十」、「早」、「韋」,「十」是「shi」,「早」是「zao」,「韋」是「wei」,於是要打「SZW」。如是者,明明是取形的輸入法,思維卻要同時花在發音上。有好些字根,由於並不成字,發明人還人爲地賦予它們讀音,增加學習困難。同一鍵上也有太多字根,用者連想用鍵盤貼紙來幫助學習都不能。

 硏究者還批評,認知碼重碼率高,簡碼的使用不科學。

 現在認知碼皮已收。這絕對不是壞事,因爲它只是是個負面示範,讓人看到設計不良的輸入法會是甚麼樣子。可是,有種輸入法的字根系統,問題跟認知碼「不相伯仲」,甚至「不甘後人」,卻在其敎徒傳銷下大行其市。這種輸入法,名叫嘸蝦米。

文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣()

 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:字根不良難煮字

 夫烹飪,重者有二:一曰食材,二曰煮法。食材不佳,雖有神技難調美食;烹煮乏法,有鮮材亦烹不出佳餚。

 凡形碼輸入法,皆與烹飪同。其重者,一爲字根,二爲取碼規則。字根如食材,取碼規則猶煮法。二者之中,任一不良,亦難言好輸入法。今天先說字根。

 字根是形碼輸入法裏用以組字的元素。用者要組出一個漢字,先要掌握全套字根,了解它有甚麼形塊部件,選甚麼部件出來組字才正確,以及這些部件要按哪個鍵才可獲得。跟選擇正確食材,以及知道食材要到哪裏獲得,是同樣道理。

 若形塊部件沒有系統,用者難以全套熟記,就如同他本要煲周打蜆湯,卻尋遍不獲半隻蜆,只覓到蠔來權充。那麼,任他怎樣煮,都煲不出周打蜆湯。即是說,用者得不到正確的字根,結果組嵌不到要輸入的字。

 因此,把字根設計得有系統,令用者容易掌握,是輸入法設計者首要之務。字根系統的設計,是判定形碼輸入法好與壞的第一步。若設計得沒有系統,用者沒有章法可以好好掌握全套字根,記不住字根系統裏的每一個形塊部件,以及它的歸鍵,這輸入法就等於連地基都打不穩,是失敗中的失敗。

 爲使字根系統良好,不少形碼輸入法設計者都各出其謀。

文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣()

 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:截筆是浩劫嗎

 發佈了〈我學中文輸入法(一)〉,有朋友提出異議。我說,輸入法取碼時,是否在同一筆破開,並不是甚麼優劣之分,只是習慣不同。他反對此言,認爲筆畫是漢字之基本,我們學寫漢字,就是由筆畫學起:先學「點、橫、直(豎)、撇、捺、挑(趯)、曲(彎)、鈎」,再學以它們組合成的複合筆畫,然後逐筆逐筆寫下每個漢字。他認爲,輸入法若不從此道,就背離了漢字。

 我留意到他用的輸入法是行列。行列官網上,有文宣論及倉頡1),稱其患了以「砍字截筆」的毛病,跟寫字習慣不一致,不依筆順,又把同一部件甚至同一筆斬開,有如屠夫殺豬殺牛,「肢解文字」。它說倉頡與寫字習慣差異越遠,所以難學;說倉頡令小朋友把「車」字寫成「十田十」,是「文字浩劫」;說倉頡不合潮流,自當引退。

 這種言論有市場,是因爲許多人都沒有眞正了解漢字,只知其一不知其二。

 誠然,大家學習漢字時,都是由今楷出發,學習聽、說、讀、寫。要寫字,就是一筆接一筆,機械式地學。「車」就是「橫、豎、橫豎、橫、橫、橫、豎」,卻沒有解釋爲何是這樣,只管死記。於是大家只認識到漢字的這一面貌,覺得筆畫就是一切。

 我不可以說,以筆畫來理解漢字是「錯」的。只接受這套觀念的人,的確不宜學習把同一筆破開的輸入法。他們應選擇完全依書寫筆畫和筆順製成的輸入法。例如手機上的筆畫輸入法,就完全由筆畫、筆順出發,方便這些朋友無須再另外學習任何字根概念,比行列更直接。

 然而,這些筆畫,就是漢字的一切道理嗎?小學時我已對漢字特別有興趣,開始思考這問題。

文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣()

 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:平反倉頡_下

 續上篇,一郎繼續說我看到的眞相,到底跟牟利輸入法對倉頡的攻擊文宣有何分別。

 文宣:我們的輸入法重碼率或選字率很低,適合盲打。

 眞相:依實際數據分析1),倉頡輸入法才是重碼率最低的,這和它的取碼設計有關2)。如此宣稱的牟利輸入法,它們的重碼率可能一點也不低,或者依靠簡速鍵等「官方外掛」來達成低重碼率。甚至連「重碼率」一詞都要迴避,取巧地改用「選字率」或「加用第一及第二選字鍵即時選字後」來計算,玩弄語言僞術。

 文宣:我們是最具國際觀的,能夠輸入多國語言漢字,貫通正、簡、日,外國人也適合學習使用。

 眞相:倉頡早就支援超大漢字集,無論是Unicode,還是朱邦復先生那收字更多的「倉頡系統」,編碼都老早就公開。對倉頡來說,不論正、簡、日、韓,所有漢字都地位平等,在相同模式下,按同一套拆碼規則輸入,重碼率還很低。因爲在設計字碼階段時,朱邦復先生已顧及這問題,像「場、场」、「穗、穂」或「營、营、営」等字組,都不重碼。

 相反,有些宣稱自己支援大字集,卻不見支援Unicode的官方編碼,只有民間擁躉補完。更甚者,那些輸入法,字根不區分正、簡、日寫法,例如「釒、钅」或「貝、贝」等正簡字組,組內彼此間都歸入同一主根。輸入法過去甚至慣以拆簡體字的碼,來輸入正體字,當要同時輸入正簡字元時,就會構成嚴重重碼。結果,它必須區分開正體模式、簡體模式、日韓模式,要麼只能出正體字,要麼只能出簡體字,要麼只能出日韓漢字,無法同時輸入各種寫法的漢字。這根本就是沒有國際觀,不能同時支援多國語言裏的漢字。更莫說還有許多語言並不使用漢字,支援漢字並不等於支援多國語言。

文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣()

 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:平反倉頡_上

 前文說到,許多輸入法,尤其牟利的,愛以攻擊倉頡作宣傳。我學倉頡前也看到不少,幸好當時有所懷疑,沒有上當。經過學習,破僞立眞。我僅列出一些常見的指控,以及我透過親身學習所看到的眞相,讓各位判斷。

 文宣:倉頡要背各式各樣的字根,又易忘記。我們則以英文字母象形來歸納字根,不易忘記。光是這輸入法是編成英文這一點,我覺得就很難讓我學別的輸入法了。

 眞相:英文字母與漢字部件系統差異極大,要是中文輸入法以英文字母象形歸根,一定有甚多牽強的歸納。比較某甲、某乙兩套以字母象形作賣點的輸入法,「辶」某甲歸「L」,某乙歸「W」;「了」某甲歸「Z」,某乙歸「W」;「戶」某甲歸「P」,某乙歸「F」;「厂」某甲歸「F」,某乙歸「L」;「山」某甲歸「V」,某乙歸「E」;「幺」某甲歸「S」,某乙歸「W」;「亞」某甲歸「5(五)」,某乙歸「O」。可見所謂的字母象形歸根有多主觀、牽強,一樣需要學習者死記。而且,中文常用部件有許多,單以英文字母象形,難以囊括所有字根。因此,在同一套輸入法中,還有大量字根,並不能用跟英文字母象形去記憶。例如某甲的「土、士、⺧」歸「G」、「車、東、朿」歸「0」;某乙的「弗、鬼、佳、衤」歸「V」,「兼、弓、犭、丈」歸「Q」,再牽強都無法與字母繫之以形。即是說,這些輸入法的學習者不但要強背死記,還要在記憶不同字根時,用不同的記憶或聯想方法。這極容易引起混亂,造成大量記錯與遺忘,絕不可能如文宣所說般易記。

 至於倉頡,主輔根加起來只有百餘個,而且輔根皆是主根或其他輔根的形狀變化、衍生,簡單、清楚、好記,絕不易忘。

 文宣:倉頡要死背口訣,以記憶中文字母的位置。我們跟英文鍵盤是吻合的,直接用英文字母,不用另外再背誦口訣,會英文打字的人直接上手,不會打的可以在練中文打字時同時練成英文打字。

 眞相:任何輸入法都必須記憶字根歸鍵的位置,倉頡雖用中文字根來歸鍵,但只有二十四個主根,要使手指的神經「記得」字根位置並不難,且莫說絕大多數中文鍵盤都印有倉頡主根,方便學習者上手。至於用口訣來把中文字母轉換作英文字母,根本是走了歪路,不是正確的學習方法1)

 要是一套中文輸入法直接以英文字母歸鍵,一來,用者仍然要記憶該英文字母鍵的位置——他在腦海還是要把中文輔根轉換作所歸鍵的英文字母,然後以手指按動英文字母所在的鍵,不會因此而減低記憶負擔。二來,因爲英文字母與漢字部件系統差異極大,必有許多字根要強記,記它們會比記歸鍵位置難(如上方所述),結果是得不償失,對記憶的負擔還加重了。況且,即使它以英文鍵來歸根,中文編碼和英文字串也截然不同。一個人熟習了打「OAO」、「YYY」、「OAQE」等編碼組合,難道就等於他已慣打「capability」、「synonym」、「vocabulary」等字串,手指已條件反射地記得字串的指法嗎嗎?實際上還是要練習。

文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣()

 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_四

 學過許多輸入法,最後鍾情的卻是許多人說難學、罵言四處皆見的倉頡。以個人經驗來說,倉頡絕對不難。

 學倉頡前,我先細心選擇敎材。坊間敎倉頡的書有很多,編寫得好的卻不多,包括自稱最暢銷的那些。不少敎材,用甚麼「日頭、月餅、金星、木笛」或「日爺、月婆、今夕、目的」之類的所謂口訣,敎人強記「日=A,月=B,金=C,木=D」。不少敎材或字典,列倉頡碼時都用英文字母,而非倉頡字母。不少敎材,只列出倉頡的輔助字根及該輔根的例字,而字根間的形狀關係,則沒有清楚解說,甚至毫無解說。凡此種種,我皆捨之,以免誤入歧途。

《30天學倉頡》擷圖
《30天學倉頡》擷圖。

 最後,我選的書是伍新華編著的《倉頡輸入法:用戶手冊》。這書沒有上述通病,敎導學習者直接掌握倉頡字母在鍵盤上的位置,鼓勵學習者以條件反射盲打,清楚說明輔根的形狀關係,提醒學習者不要死記編碼,避免學習者走進誤區。它對取碼規則的解說相當深入淺出。雖是單色印刷,卻有清晰的例字圖解,分析一些容易拆錯和誤解的字。作者還特地說明異體字、香港字,以及不同系統(如微軟Windows、倚天、國喬等)間的問題,附有依部首、漢拼和廣東拼音的倉頡字典。整本書內容充實,去蕪存菁,售價也很相宜。我從它身上得益不少。若需要多媒體敎學,個人看過香港華通的《30天學倉頡》的一些示範,覺得不錯。

 撇除不宜盲打的筆畫、筆順輸入法,字根是所有形碼輸入法的入門。倉頡字根好記,主根輔根加起來才百餘過,在支援盲打的輸入法中,它是最少的了。1)輔根皆與主根繫之以形,把這個輔根的形狀加點變化,就可想到下個輔根。用這方法去歸納字根,最符合對形塊的聯想思維,很容易就能熟記。倉頡、大易能做到這點,行列則太講求座標理性而失陷此城。至於嘸蝦米之類的雜亂無章,就不再提了。記得曾看過有快碼擁躉撰文, 指摘倉頡歸根不直觀,如「」歸「木」,學習者只可以靠死記。可是,要是你知道:「木」→「」→「」→「」這四個字根間的關係,就壓根底兒不會說出這樣的話。 由主根「木」,變成「木字底」,取其主榦,再橫臥下來,形狀記憶「一條龍」,毫無難度。該撰文者以爲要死記,無知也。但這未必是他的錯,他可能不幸看到比較差的敎程,沒有說明字根間的形狀關係,他自己也沒有發現,於是他以爲只得逐個形塊死記。

文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣()

 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_三

 撇除了設計混亂的嘸蝦米,餘下數種正體中文用者間常見的輸入法,多是大根形。我說的是行列、大易、快碼。這三種輸入法,也有好些相似點。

 行列是字根分佈上最有理據的輸入法。先把筆畫或筆形分作十類,再看字根的首與尾屬於哪類,依座標系統歸到相關的位置中,例外的歸位甚少。接着,用這260個字根來拆字,依筆順,取首、次、三、尾碼,不在同一筆斷開,例如「更」是「一曰乂」。個人學習時,覺得這輸入法挺不錯。唯一問題是,到實際操作起來就很慢。因爲在腦子裏,要先把漢字拆作字根,再思考每個字根的首、尾屬於甚麼筆形。拆一個字就要思考數次1)。結果,我以爲在理論上學會了,在實踐時卻不甚愜意。

 後來我嘗試作弊,直接記憶整塊字根形狀,以及它歸在甚麼鍵。卻發現歸在同一鍵中的字根,雖然一起筆的筆形有共通點,但整塊形狀的差異可以很大,不太能從整塊形狀去聯想。例如「風」、「幺」與「爿」同歸「2↓(X)」,「不」、「夫」與「雨」同歸「1↓(Z)」2)。不透過首、尾筆形來思考,是記不到的。結論呢,還是無法作弊。行列的字根歸類,雖然很有系統,但這系統缺乏形似上的關聯,不易讓學習者以形塊形狀去聯想,每次都要依座標系統來推理。

  大易3)也是大根形輸入法,有254個字根,與行列相若。用這些字根來拆字,依筆順,取首、次、三、尾碼,不在同一筆斷開。這樣說起來,眞的和行列很相似!但實際拆起字來,兩者也有不少差異。大易輔根的歸類方法,以形似爲則,大多數字根都能由形狀作聯想,從字形直覺上,比行列好記。原來人類記憶字塊,主要依靠的還是整塊整塊的字形,而不是逐個筆畫或筆形去記。而且許多正體中文鍵盤上都有大易的主根,我們不必死記字根對應甚麼英文字母,直接記憶字根的位置。有些人喜歡強記「人是A,革是S」,甚至大易官方也提供所謂「口訣」:「捺金鈴,㇏金0。愛慕,I木。水叉叉,水乂X……」這其實是費時失事的。這種強記,在短期間內,可能會帶給懂英文打字的學習者少許方便。但它本身並不是字根歸納的原理,而且習慣了這種記法後,每次打字時,都要多經「把字根轉換作英文」的一關,日後會成爲提升輸入速度的絆腳石,不便於練習盲打、觸覺打字。

文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣()

 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_二

 我先從輸入法的理論、系統、設計着手,學習多種正體中文用者間常見的輸入法。結果,我最快放棄嘸蝦米。主要原因是:它的字根設計得太亂、太無理。請留意,我不是嫌它341個基本字根、156個簡速字根1)太多。嘸蝦米是大根輸入法,字根多是難免的,但它把字根歸類得很沒有系統,這才是致命傷。

 蝦米族當然會不同意這觀點。他們會說,字根雖多,但歸類得很易記,只不過是取形、音、義相關而已。可是,哪些字根取形,哪些取音,哪些取義?官方說「只要唸得出聲音來,大部份都取其音」,卻有大量例外,例如取形的「力、工、言、口、亞、田」和取義的「人、車、中、央、屯、曲」等,都明顯唸得出來。蝦米族說只要「多看多練」就可。不過,有哪種輸入法不是這樣的?對我這種講究道理的人來說,這不是答案。能看出規律、練出法門嗎?還是要走馬看花般看,囫圇吞棗地練,學得迷糊含混?尤其是嘸蝦米所謂取義的字根,又包含了像「曲、㣺、巴、虫、冘、旡」等並不是取義的2);所謂取音的字根,也包含了像「亡、辛、牛、云、且、聿」等不是取音的;所謂取形(與英文字母象形)的字根,也包含了像「(D)、扌(J)、彡(M)、マ(T)、亞(O)、辶(W)、 (H)」等難以聯想的。

 再說,取音是取聲母、韻母、英文字母諧音,還是哪種?「不、方、立、皮、竹」取聲母,「也」取韻母,「耳、爾、寅」取韻尾,「西、夕、雨、魚、于」取英文字母諧音,「月、又」取聲母和介音的英文字母諧音,「尹3)、永」取去掉韻尾的英文字母諧音,「酉、與、髟」等聲稱取音卻不知取甚麼音,怎唸都不像4)!「小、少、身、生、世」取聲母歸「S」,但「食、氏、升」卻歸「X」;「方、丰、飛」歸「F」,但「弗」歸「V」;「瓜、甘」歸「G」,但「弓、冎」歸「Q」。更離譜的是,「卜」取聲母卻歸「P」而非「B」;「臼」歸「G」而非「J(北語)」或「K(粵語)」;「戶」歸「F」而非「H(北語)」或「W(粵語)」(但「乎」則正常地依北語歸「H」);「黽」讀「敏」,卻取「繩」音歸「X」;「虍」唸「呼」,卻依「據」音歸「Z」(但「據」的漢拼爲「jù」。此外,「Z」、「J」的取音輔根也歸得一片凌亂。);「糸」一般讀「覓」,卻似乎被當作「絲」音歸「S」。這次第,怎一個「亂」字了得!

 況且它取音的字根,也以北語(包括大陸普通話、臺灣華語)爲主。如「午、瓦、文、巫」歸「W」,但前兩者粵語讀「ng」聲母,後二字粵語唸「m」聲母。還有一些字根,因爲與北語的註音符號同形,就按註音符號而歸鍵。這些歸鍵,都不易讓香港人(或其他非操北語的漢語用者)習慣,增加了非臺灣用者的學習難度。一個拆字輸入法,本應單純以字形出發,不論其音,跨越各種漢語語言發音相異之屏障的。但嘸蝦米在設計字根系統時,就已高高築起這種屏障。

 但我還未說到戲肉。嘸蝦米歸形的字根中,竟有一部份是依靠簡化漢字作聯繫的!留意,我並不是反對形碼輸入法兼及簡體字拆碼,讓簡體用者以同一套字根、規則去打出簡化漢字。能夠輸入所需的字,不致於有字無碼,始終是件好事。但我要指出的是,嘸蝦米有些輔根的歸形,以正簡轉換作聯繫。用者要先懂得那字根的正、簡兩種寫法,才能把該輔根聯繫起來。你得先懂得「婁」簡體寫作「娄」,才知道「婁省掉女」這輔根歸入「米」根;你得知道「堅」簡體寫作「坚」,才知道「臣」這輔根歸入「〢」根。請問我可以只學輸入法,而不必學簡化漢字嗎?可以嗎?可以嗎?!更莫說「臣」變「〢」並不符合簡化漢字的推類規則。

文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣()

 原文刊於《刻石錄》:http://founder.acgvlyric.org/iu/doku.php/輸入:我學中文輸入法_一

 自小對中文字有興趣,但家境不算很好,小時候沒有電腦,自然與中文輸入法無緣。

 第一次接觸中文輸入法,是在表姊夫的家中。那時還是DOS稱霸的年代,他用倚天中文系統打字。系統內附一些輸入中文的小遊戲,會顯示一些字根或漢字,考你懂不懂輸入。印象中有的遊戲用不知是大易還是行列的字根,有些用倉頡字根。表姊夫在電腦鍵盤旁,有一張小小的倉輔根表。那是我第一次接觸中文輸入法,當時我玩得不亦樂乎。

 以後,我看了一些學習輸入法的文章。其中有一篇說,學習輸入法時,應當拋開過去査字典時的觀念,不要帶師學藝,虛心接受與部首、筆畫、筆順截然不同的拆字系統。這篇文章說的,許多人都忽略,卻非常有用。

文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣()

 自暴元亂世,惡勢歪治,一郎蝸居陋室,餐風飲露,獨箇兒寫刻石錄。今建新舍,寄存拓碑,不求聞於市俗,唯願饗以知音,不嫌酒淡乏香、菜薄無味。謹此作序。

文章標籤

內木一郎 發表在 痞客邦 留言(0) 人氣()