當今被稱爲壹個「萬碼奔騰」的時代。二十多年來,漢字輸入研究取得了長足的進展,但至今仍未出現壹種足以「壹統天下」的易學易用的漢字輸入法。漢字輸入仍是信息處理的壹個「瓶頸」。目前的鍵盤輸入法主要分爲拼音、拼形、音形結合三類,拼音碼以全拼和雙拼爲代表,全拼基本上不需要學習便會使用,雙拼需要少量記憶,但重碼都很多。拼形碼以五筆字型、表形碼爲代表,重碼少,但記憶量較大,不易掌握。音形碼以自然碼爲代表,自然碼以雙拼爲基礎,輔以字形,達到降低重碼的目的。
粵音輸入法屬音形碼。粵音輸入法以廣州話拼音方案爲基礎,略加改動,采用雙拼制,聲韻各壹鍵,再加壹鍵表部首以區分同音字。與其它輸入法相比,本輸入法具有如下特點:
1、本輸入法以語音爲主要信息,具有音碼反應快的特點。音碼可以避免形碼拆字的麻煩,提取信息較形碼快得多,大大減輕了腦力的負擔,並且可以邊輸入邊理解,克服了形碼輸入法「輸完壹篇文章而不知道輸了什麽內容,只看到字根」的缺點。本輸入法采用雙拼制,不但使字詞編碼比全拼簡短,而且有壹點明顯優于形碼的地方,就是同音字聲韻相同,只要熟悉了某個音節的代碼,便可以很快輸入這個音節的所有的字,這樣可以「以壹帶十」。例如用戶熟悉了音節「靜」的代碼爲jk,那麽,在輸入法「證據」、「正確」、「政治」「靜止」、「淨化」等詞時,便可以很快打出前兩個代碼jk。在形碼中,第壹、二字根相同的字則完全沒有這種「血緣關系」,如在五筆中,「直」、「越」、「鹽」等前兩個代碼都是fh,但是人們並不容易察覺,無法讓人把它們聯系起來。
2、本輸入法采用三碼打字、四碼打詞。這樣做優點是使字的輸入更加簡易,而且避免了字與詞之間的重碼,缺點是使字之間的重碼較高,但與其他輸入法的三鍵重碼率(打完三鍵後的重碼率)相比是相當低的,壹級字庫中,86版五筆的三鍵重碼888個,表形碼1054個,鄭碼685個,而粵音輸入法只有568個。本輸入法規定字之間出現重碼時以加後綴的方法區分。在本輸入法中,壹級字庫中的字絕大部分不用加後綴碼。我們沒有必要爲了降低覆蓋率不足0.1%的幾千個漢字的重碼而增加常用字的碼長。雖然,采用四碼打字的輸入法可以設置簡碼,但是用戶無法預知哪個字有簡碼,哪個字沒有簡碼,只能壹壹記住。
3、本輸入法以詞輸入爲主導,收詞量多,而且重碼率很低。粵音輸入法備有80000多條詞彙,還可自定義詞。(98版五筆收詞15000條)在本輸入法中,字以三碼表示而詞用四碼表示,因此字詞間不存在重碼,又因爲粵語音節遠比普通話豐富,同音詞遠少于普通話,而且本輸入法又引進了聲調信息,所以詞組重碼很少。在本輸入法中詞彙的重碼率低于4%,比五筆、表形碼、鄭碼等都低,以壹個不加任何選擇的10000條的詞庫爲例,五筆重碼(包括字與詞的重碼)達10%,而本輸入法只有6.5%。
4、本輸入法收有大量粵語方言字詞,如:「喺」、「嚿」、「嗰」、「啲」、「嘅」、「野」、「鬼馬」、「專登」、「利市」、「的式」等等,可以很方便地輸入粵語句子。
5、本輸入法在聲母和韻母中溶入了聲調信息。這樣雖然在壹定程度上增加了記憶負擔和減慢了反應速度,但大大地降低了重碼率,這也是本輸入法詞彙重碼率能夠低于形碼的壹個重要原因,因此,這樣做得是遠大于失的。
6、本輸入法能夠處理UNICOE大字符集中的七萬多個漢字。大字符集中按照讀音編碼有2萬多個,對于GB字庫以外的字,由于都是生僻字,本輸入法按照「子字拆字法」或筆畫對其進行編碼 。
7、本輸入法采用「子字拆字法」和「筆畫輸入法」輸入難讀字,妥善解決了非常用字的輸入問題。壹般音碼具有兩大缺點,壹是重碼多,二是不會讀的字無法輸入。本輸入法在詞彙上實現了比形碼更低的重碼率,上文已經論述。對于不會讀的字可以用「子字拆字法」和「筆畫輸入法」很容易地輸入。
8、本輸入法對標准windows輸入法進行了壹些改進,可使用shift切換中英文狀態,在中文標點狀態下小鍵盤可輸入英文句點。
粵音輸入法當前版本號爲6.08。
|