|
 
- UID
- 29026
- 帖子
- 225
- 主題
- 82
- 精華
- 0
- 粵銀
- 527 文
- 在線時間
- 89 小時
- 註冊時間
- 2010-5-23
- 最後登錄
- 2013-4-27
|
63樓
發表於 2010-9-13 08:40
| 只看該作者
本帖最後由 lotus7174 於 2010-9-13 09:17 編輯
我的字頻表是參考了Big5 13060個字的字頻排出來的,
可以在網上找到,
不是見仁見知的!
當字頻表遇到多音字
樓主反應很快。用現成排列表很好,我以為有人手動調整。
但是真的有問題,唔只係「伸」音「信」字排頭,「捐」音重「身」字排頭。
當然知道「身毒」(音:捐篤)<gûendüg>,係「天竺」<tînzüg>嘅古異譯,
甚至可以讀做「軒篤」<hîndüg>,如「鐵<tìd 33>板」有南洋人用廣州話讀「歇<hìd 33>板」。
此外,打「已」音,「尔」字排頭也很難得出,因為繁體字是「爾」字,
而且「尔」字不是五大碼。
麻煩你查下所謂字頻,佢點樣處理多音字和非五大碼字。
目前排法會影響實用性。
能否提供未經字頻排列過的原始碼表?它用什麼次序?
我猜是「信、身」是常用字,但是它作為的「伸、捐」讀音,不是常用字。
而字碼表只照字頻排列,而沒有考慮到「該發音上」那些字的字頻。
多音字、非五大碼字、非正規音字
如果要分開多音字同異讀字,可以恁樣:
(san) <sen> 申伸身+信←插入+號,隔出多音字
(guen) <guen> 捐娟+身←插入+號,隔出多音字
(yi) <yi> 已爾*尔←插入*號,隔出非五大碼字(舊電腦無法使用)
(nga) <nga> 牙訝迓-亞氬←插入-號,隔出非正規音字(避免使用)
諸版本
此外,樓主公布了太多版本:
HK:原版(工具欄上稱「 HK」)
港拼:自創版(工具欄上稱「港拼」)
香港:最新版(工具欄上稱「香港」,設定裡面稱「香港廣拼」)
它的Remove好像是卸裝程序,但是效果有待改善。
最新版內碼表
樓主在《通用輸入法工具》提供的內碼表,好像不是「最新版」採用的內碼表。
能否提供與輸入法同步的最新版?
而標點符號、日語字母等,說明,散落在本帖各樓,
建議做一個說明文檔,附在安裝包裡面。
不然,提供最新碼表供查閱也可以。
反而簡體的 imegen.exe 輸入法生成器 可以出到 unicode character.
簡體 windows disk 找找 imegen.exe imegen.hlp imegen.chm 這幾個 file.
繁體字《微軟視窗》,補充字;
五大碼、國標碼、統一碼
我上便講過,我用嘅係繁體字Windows XP。
至於香港字,我之前上過一個網站話,睇唔倒字就裝香港字(五大碼補充字?),
但係我用Windows XP繁體版,裝咗之後一樣睇唔倒。
而樓主嘅《通用輸入法工具》附嘅字碼,唔覺得有問號字
(如上便講嘅(ngap) <ngeb>〔噏〕音),唔知點試。
《行列輸入法》多咗【唔係五大碼】而【國標碼簡、繁體字集】「食得」嘅字,
所以有「嘅、咗」,但係冇「(口架)」爾個字。
所以寄「伊尾(陰平)佬」簡「簡體字」逼佢用大陸國標碼,反而對方重睇得倒。
而《通用輸入法工具》工具唔知追唔追得上。
但係樓主收錄咗嘅「尔、噏」唔係五大碼喎!恁好嘢?
我懷疑《通用輸入法工具》,可以超出五大碼,但係喺國標碼簡、繁體字集之內。
不過,《行列輸入法》可能係因為納入《通用輸入法工具》,
所以冇咗「1^、1-、1v」(一上、一中、一下)嘅顯示法,可惜。
想打快一點的話,我已有了方法,
不過你要識倉頡的頭碼就夠了,
減少同碼字,打快尐
一般人很難為了打快一點,跑去再學一個倉頡輸入法。
建議順著本來輸入法的精神,再加入聲調(九聲),減少同碼字,自然就打得快。
謝謝! |
|
|
|
|
|
|
|