找回密碼
 註冊

QQ登錄

只需一步,快速開始

搜索
熱搜: 活動 交友 discuz
樓主: penkyamp

[粵語拼音] Penkyamp 输入软件设想及工作相关贴

[複製鏈接]
發表於 2010-1-23 23:42:48 | 顯示全部樓層
缺席太多了

對整個進度不了解。

能夠指導一下我嗎?我想盡快參與其中...........................
[ 本帖最後由 xiss 於 2010-1-27 13:04 編輯 ]
發表於 2010-1-23 23:48:48 | 顯示全部樓層
本帖最後由 xiss 於 2015-3-21 22:53 編輯

為開發工作便利起見
公布我的QQ和電子郵件地址

QQ:443817814
E-mail:xissmail@qq.com

發表於 2010-1-24 00:09:52 | 顯示全部樓層
下载了2.0版,試用了一下,感覺智能性上不錯,輸入法的骨架是搞了出來了。

我覺得,我們今后努力的工作就是:
1.繼續完善碼表的編排工作
2.探討并實踐將該輸入法轉移到一款Windows上適用的輸入程序,像「輕鬆粵拼輸入法」一樣

實現了以上兩點後,可以開展第三點
3.繼續完善智能性,實現智能組詞,字詞頻調整等功能

當然,以上第一第二點是目前急需,經過我試用,目前「中州Penkyampji輸入法」還存在以下不足:

第一,碼表不完善,我輸入fag,它無法識別出這是粵語的一個音節,沒有出現候選字,如圖:
未命名.jpg

第二,這個輸入法,僅僅是一個技術骨架,無法移植成一款Windows上適用的輸入法,這是一種很大的「硬傷」,不知道有沒有辦法解決這個「硬傷」呢?

此外,針對以上兩點,我們有什么可以幫到佛腳你的,請即管說,我們會全程協助的。
發表於 2010-1-24 01:08:03 | 顯示全部樓層
好!

中州韻輸入平台/ZIME,是一款泛用拼音輸入平台。它提供了一些定製輸入方案的機制,使得輸入法設計者可以借助平台支持快速實現一款新的拼音輸入法。然而,這些機制不是提供給輸入法的最終用戶的,且要達到最大的靈活性、適應盡可能多的輸入法類型,故此不採取「傻瓜」的方式,而需要輸入方案開發者瞭解主要選項的作用、能夠使用平台提供的工具並具有文本處理的基礎技術能力。

平台軟件目前有用於Linux系統的桌面版和網頁體驗版;用戶以文本形式定義的ZIME輸入方案可通用於平台的兩種實現。

Linux版本(code name: "Rhyme")基於IBus輸入法框架( http://ibus.googlecode.com ),以Python語言開發。目前已經實現了所有預想功能,今後重點也許是執行效率和存儲方式的優化。
網頁體驗版(code name: "Plume")是本地HTML網頁程序,以JavaScript和GWT進行開發。輸入方案用工具轉換為JSON文件,在輸入過程中以Ajax方式動態加載。
網頁版目前由於受瀏覽器安全機制所限,無法存儲數據,因此實用效果比不上桌面版。
為彌補這一缺憾,近日嘗試寫一在線服務,替代網頁輸入法的後端,然appspot.com訪問時斷時續,開發受阻。

將來,有機種選擇:
一是將"Rhyme"移植到Windows平台。因為Python語言是跨平台的,理論上,將Windows IME模擬為IBus的接口即可直接利用全部的輸入法算法。
二是繼續寫成網頁版的在線服務。這一設計是唯一不需任何下載即可在任意系統上應用的,而且可以讓所有用戶一起來訓練一個語言模型。缺點是實現難度大,尤其是配置新方案時受站點吞吐能力限制會很不易。
三是利用現代瀏覽器的HTML5 Local Storage結合在內存中建立的快取來做出網頁版的記憶功能,疑點是HTML5標準仍未定案,瀏覽器的支持程度不一。

天明後我打盤寫一篇《ZIME輸入方案開發者指南》,介紹如何應用現有的平台軟件來製作新的輸入法。
發表於 2010-1-24 01:23:25 | 顯示全部樓層
回43樓:
法 fad,粵音同「發」。

若要出Windows版,一定是用功能完善且代碼能做到系統兼容的"Rhyme"分支,用戶造詞和詞頻調整的問題已然解決;
佛振,未接觸過Windows IME編程,正打算找個實例學習一下。難點大概有:封裝 IME API、實現輸入法介面、與Python代碼對接等。

網頁版智能上的不足是出於缺乏保存數據的功能,即,受瀏覽器安全機制所限,其所有資料都只能唯讀訪問。
寫線上服務的嘗試遭遇了困難,我想用上文所述的Local Storage也許是個不錯的選擇。


 樓主| 發表於 2010-1-24 01:23:54 | 顯示全部樓層
fag 字汉字点写唔重要,最重要系我地能够开源地加入一个拉丁字母节(加标调号的)fâg 或者大写 Fâg , 以方便 汉拉混用 文体。
我再提一个理想: 使未来的 penkyamp 输入法能够在同一输入方式(双拼等)中不但能输入汉字,汉字词,而且能输入标调拉丁 penkyamp 单音节或音节连词(也就是带空格和不带空格的元音带标调号 penkyamp 音节)。 这在 繼續完善碼表的編排工作 中实现就行了。 广东话音节大概几百个,带了音节号大概一千来左右吧。
發表於 2010-1-24 01:33:49 | 顯示全部樓層
原帖由 penkyamp 於 2010-1-24 01:23 發表 fag 字汉字点写唔重要,最重要系我地能够开源地加入一个拉丁字母节(加标调号的)fâg 或者大写 Fâg , 以方便 汉拉混用 文体。 我再提一个理想: 使未来的 penkyamp 输入法能够在同一输入方式(双拼等)中不但能输入汉字,汉字词, ...


這在ZIME中真的不需要擴充碼表,只要利用正則表達式(Regex)指定「兼容拼寫形式」即可。天明後的《指南》會舉例說明。
(不需修改碼表是指加調號只用來顯示的情形;若需要以此區分同音字則必須在單字表中標調)

佛振現在要稍事休息,天明再幹活。二位交流交流。
[ 本帖最後由 佛振 於 2010-1-24 01:37 編輯 ]
發表於 2010-1-24 14:50:50 | 顯示全部樓層
原帖由 佛振 於 2010-1-24 01:23 發表 回43樓:法 fad,粵音同「發」。若要出Windows版,一定是用功能完善且代碼能做到系統兼容的"Rhyme"分支,用戶造詞和詞頻調整的問題已然解決;佛振,未接觸過Windows IME編程,正打算找個實例學習一下。難點大概有:封裝 IME API、實 ...


在實現智能組詞、字詞頻調整、Windows移植以及粵語拼音資料等方面,有什么需要我們幫手的,請即管說

我和Penkyamp會全力協助的。

天明後我打盤寫一篇《ZIME輸入方案開發者指南》,介紹如何應用現有的平台軟件來製作新的輸入法。


很好,我正想看看這方面的資料。

想問問,目前能先搞個能移植到Windows的輸入法平臺嗎?我覺得,以後各種智能化嘅改進工作可以在這個平臺上繼續改進。
[ 本帖最後由 xiss 於 2010-1-24 14:55 編輯 ]
發表於 2010-1-24 14:52:56 | 顯示全部樓層
原帖由 penkyamp 於 2010-1-24 01:23 發表 fag 字汉字点写唔重要,最重要系我地能够开源地加入一个拉丁字母节(加标调号的)fâg 或者大写 Fâg , 以方便 汉拉混用 文体。 我再提一个理想: 使未来的 penkyamp 输入法能够在同一输入方式(双拼等)中不但能输入汉字,汉字词, ...


Penkyamp,我覺得帶標調輸入工具我們可以利用中州輸入法平臺,另外制造一個碼表,造出另外一個「中州粵語拼音字音節帶標調輸入工具」即可,沒必要跟現有的輸入法混為一個平臺。
發表於 2010-1-24 18:12:21 | 顯示全部樓層

ZIME輸入方案開發者指南

指南,寫成了。快來瞧瞧。
看誰能學會。那位寫教學文章的高手如果用後有心得可要幫我改改喔。

《指南》:
ZIME輸入方案開發者指南

帶插圖的PDF:
zime-schema-developer-guide.pdf

-----------------------
想問問,目前能先搞個能移植到Windows的輸入法平臺嗎?我覺得,以後各種智能化嘅改進工作可以在這個平臺上繼續改進。

佛振說:移植的方案我正在考慮,可以優先於網頁版的開發。但此事不是非常容易的。
智能組詞、字詞頻調整,Linux桌面版已經都有,惟網頁版還未實現。只要把Linux版本成功移植到Windows,功能就齊全了。

我明天晚上就要回家鄉去,也許不會經常上網了。
現在要抓緊蒐集一些Windows IME編程資料,回家後慢慢消化。

[ 本帖最後由 佛振 於 2010-1-24 18:15 編輯 ]
 樓主| 發表於 2010-1-25 02:49:59 | 顯示全部樓層
我希望 xiss 的朋友,设计XP输入IME(Penkyamp 上标调号)的 Foxs , 让墨,吴语各论坛人士,包括设计吴语输入Windows IME 的上海闲话ABC 和 钱乃荣教授(上海)能够 和 佛振 和 xiss 在网上互通 email 或见面,互相切磋 佛振方案的 各种 将来主流  OS 的应用。
發表於 2010-1-25 14:11:43 | 顯示全部樓層
Windows IME的開發移植,我可以向FOXS請求幫忙,只怕他又要多收我金錢
發表於 2010-1-25 14:22:10 | 顯示全部樓層
Hello 大家好。
發表於 2010-1-25 15:02:44 | 顯示全部樓層
原帖由 佛振 於 2010-1-25 14:22 發表 Hello 大家好。


熟悉你了,干嘛又打招呼呢?
發表於 2010-1-25 15:13:20 | 顯示全部樓層
佛振今晚搭火車回家過年。
我這回帶著問題回去。一方面研究一個Windows IME的Sample,一方面嘗試實現以C++調用Python寫的平台算法。
過段時間有進展了再議吧。
[ 本帖最後由 佛振 於 2010-1-25 15:17 編輯 ]
發表於 2010-1-25 15:24:29 | 顯示全部樓層
原帖由 佛振 於 2010-1-25 15:13 發表 佛振今晚搭火車回家過年。我這回帶著問題回去。一方面研究一個Windows IME的Sample,一方面嘗試實現以C++調用Python寫的平台算法。過段時間有進展了再議吧。 ...


好的,我也要抽時間組裝新電腦了。
 樓主| 發表於 2010-1-25 15:56:27 | 顯示全部樓層
http://bbs.cantonese.asia/viewthread.php?tid=15296

庞贯哲全拼输入软件开发计划:

1。用双拼,全拼输入汉字
2。输入的汉字分几个选择键:A。港台韩繁 B。陆新简 C。日本当用(日当)。拼打入后,如果键是选「日当」的,会将日当系字优先排前让你选择,复合词也由日当系汉字组成,并不是说台繁字和陆简字找不到,只不过要你键入很多「+」键才可以找到,排得很后
3。庞全拼有开源性, 你如果有新的复合词原来找不到, 可以加入造词库, 比如说我要加入"火星文字委员会" 一个词组, 我把这个词组高亮了以后, 再右击, 找到"加入造词库"的选择, 就行了.
4. 庞式韩国罗马字:  bang seok han guk lo ma ja : 只用英语键盘 ja yong yeong eo geon ban , 输入韩国罗马字后,就像今天 microsoft 日本语 IME 一样显示出谚文,再第二步显示出汉字或汉字复合词让你选择。同样,分A。港台韩繁 B。陆新简 C。日本当用(日当)三种字系选择。
5。庞氏 penkyamp 全拼。penkyamp 是粤语的拼音。

6。这几个是今后方便未受训练的人用英语键盘和基本汉语拼音,韩文罗马字,粤语拼音打出繁体,简体,当体等系汉字的软件研发项目,将大大造福整个汉字文化圈。

 樓主| 發表於 2010-1-25 16:03:45 | 顯示全部樓層

做搜狗,谷歌拼音输入法型的 penkyamp 自定义输入法也行!


如果坐的是武广线,一行愉快快快快 lol 祝在未来的铁路上,能够得到超速的灵感。

Penkyamp 驶向未来。中州输入法驶向未来!



送你书看:

 

http://andylin02.javaeye.com/blog/425272

IME输入法编程:第一章 Windows9x系统下汉字输入法的基本原理

 

 

 

http://www.google.com.hk/search?source=ig&hl=en&rlz=&=&q=microsoft+ime&btnG=Google+Search&meta=lr%3D&aq=f&oq=

microsoft ime

http://www.microsoft.com/windows/ie/ie6/downloads/recommended/ime/default.mspx

Microsoft Global Input Method Editors (IMEs)

http://en.wikipedia.org/wiki/Microsoft_Pinyin_IME

Microsoft Pinyin IME (Chinese: 微软拼音输入法; pinyin: wēiruǎn pīnyīn shūrùfǎ) is the pinyin input method implementation developed by Microsoft and Harbin Institute of Technology. It is bundled with Microsoft Windows and Chinese editions of Microsoft Office. Various versions can be downloaded from Microsoft's website with some restrictions.

 

http://www.google.com.hk/search?hl=en&q=microsoft+ime+design&btnG=Search&meta=&aq=f&oq=

microsoft ime design

http://www.google.com.hk/search?hl=en&q=microsoft+new+ime&btnG=Search&meta=&aq=f&oq=

microsoft new ime

http://www.google.com.hk/search?hl=en&q=microsoft+ime+opensource&btnG=Search&meta=&aq=f&oq=

microsoft ime opensource

http://www.google.com.hk/search?q=microsoft+ime+%E2%80%9Copen+source&btnG=Search&hl=en&sa=2

microsoft ime 「open source

http://www.microsoft.com/library/errorpages/smarterror.aspx/404?aspxerrorpath=/globaldev/handson/user/ime_paper.mspx

What is an IME (Input Method Editor) and how do I use it?

http://www.google.com.hk/search?q=microsoft+ime+%E2%80%9C%E8%87%AA%E5%AE%9A%E4%B9%89&btnG=Search&hl=en&sa=2

microsoft ime 「自定义

http://www.google.com.hk/search?q=microsoft+ime+%E2%80%9C%E5%BC%80%E6%BA%90&btnG=Search&hl=en&sa=2

microsoft ime 「开源

http://www.google.com.hk/search?q=microsoft+ime+%E2%80%9C%E5%BC%80%E5%8F%91&btnG=Search&hl=en&sa=2

microsoft ime 「开发

 

 

http://msdn.microsoft.com/en-us/library/ms904352.aspx

Simplified Chinese MSPY 3.0 IME OS Design Development

http://blogs.msdn.com/wit/archive/2009/01/14/how-to-use-microsoft-ime-to-input-east-asian-characters.aspx

How to Use Microsoft IME to Input East Asian Characters

http://www.slideshare.net/kenn.hussey/papyrus-advent-of-an-open-source-ime-at-eclipse

Papyrus: Advent of an Open Source IME at Eclipse

http://www.google.com.hk/search?hl=en&q=microsoft+ime+development&start=10&sa=N

microsoft ime development

http://social.msdn.microsoft.com/Forums/en/vssmartdevicesnative/thread/520456d6-f335-4cff-b603-02a40e6f0798

QuestionIMM based IME development - populate candidate list?

http://www.slideshare.net/wfassbinder/how-microsoft-stole-the-chinese-fonts-ime

How Microsoft Stole The Chinese Fonts & Ime

http://everything2.com/title/Microsoft+IME

Microsoft IME

http://www.google.com.hk/search?hl=en&q=microsoft+ime+%22%E6%96%B9%E8%A8%80&start=50&sa=N

microsoft ime "方言

http://www.google.com.hk/search?hl=en&q=microsoft+ime+%22%E7%BC%96%E7%A8%8B&start=20&sa=N

microsoft ime "编程

http://msdn.microsoft.com/zh-cn/library/b6ewb9fy.aspx

Visual C++ 中的 MBCS 支持

http://www.pudn.com/downloads3/sourcecode/windows/ime/detail8449.html

 详细说明:IME编程的源码-IME programming source code

http://d.wanfangdata.com.cn/Periodical_wjfz200612014.aspx

基于IMM-IME的汉字键盘输入法编程技术研究

http://myvnet.com/article.asp?id=50

 来自Microsoft的一点输入法编程资料 

 

 

今天再到Microsoft MSDN去找,Microsoft MSDN上的资料非常多,也非常难找。不过还是让我找到了,哈哈(自喜中)。。。

 

Input Method Editor http://msdn2.microsoft.com/en-us/library/ms776145%28VS.85%29.aspx

 

把里面的一些参考内容COPY过来,方便自己查看。

Input Method Editor (IME) Functions

 

This section describes the input method editor functions.

 

 

http://andylin02.javaeye.com/blog/425272

IME输入法编程:第一章 Windows9x系统下汉字输入法的基本原理

 

http://www.wangchao.net.cn/bbsdetail_25593.html

Windows 输入法编程 ()

http://www.7880.com/info/Article-59a53800.html

输入法编辑器(IME)程序设计(4

http://www.china-code.net/article/7/6/11706/ccpQwd1e.html

您的位置:文章首页 -> 网络编程 -> 其他编程 -> Windows 输入法编程 ()

http://www.23book.net/SoftwareDev/VC/13666.htm

输入法编辑器(ime)程序设计(4

http://study.qqcf.com/web/215/23299.htm

# 输入法编程指南(根据msdn翻译)

http://www.99inf.net/SoftwareDev/VC/22495.htm

windows 输入法编程 ()

http://hi.baidu.com/lzlsha/blog/item/eea71a0165d5890c7aec2c5f.html

IME输入法编程 第一章 Windows9x系统下汉字输入法的基本原理

http://blog.csdn.net/myazrael/archive/2005/06/15/394901.aspx

 原创  IME输入法编程 收藏 

http://www.cnblogs.com/songsu/articles/1202197.html

 Windows 输入法编程 () 

http://www.xgdown.com/article/236/32512_1.htm

Windows 输入法编程 ()

http://www.microsoft.com/china/windows/products/ime/MSPY2007.mspx

微软拼音输入法2007

http://msdn.microsoft.com/zh-cn/goglobal/bb688135.aspx

循序渐进全球化

输入语言:键盘和 IME

http://office.microsoft.com/zh-cn/word/HP052585662052.aspx

Word 中的东亚语言功能

http://office.microsoft.com/zh-cn/project/HP453049762052.aspx

自定义「输入法」模式

http://office.microsoft.com/zh-cn/access/HP052592032052.aspx

设置默认的输入法 (IME)

http://laiba.tianya.cn/laiba/CommMsgs?cmm=13628&tid=2653239980447733307

 谁给个Microsoft Global ime 5.0 for Japanese下载地址

http://hi.baidu.com/awerlasdfwe/blog/item/0585e4167d2e7a54f2de321d.html

自定义五笔输入法

http://www.google.com/ime/pinyin/feature.html

Google谷歌拼音输入法功能介绍

http://www.fly010.net/new3706.html

如果我们要将双系统中Windows 98里输入法自定义的词组转移到Windows XP中使用,该怎么做呢?这里笔者以常用的几种输入法为例,介绍一下具体的转移方法。

http://www.it2us.com/html/31/n-31.html

揭密win7pe制作全过程(五)

http://uicom.net/blog/?p=595

再聊谷歌拼音输入法

http://faq.csdn.net/read/214493.html

#   问题内容:如何开发一个汉字输入法的程序(vc++)?

http://zh.wikipedia.org/zh-tw/Talk:%E8%A1%8C%E5%88%97%E8%BC%B8%E5%85%A5%E6%B3%95

討論:行列輸入法

http://berrymac.us/tag/ime

SunPinyin for Mac OS X

http://amos-tsai.blogspot.com/2009/12/windows.html

如何在中文Windows下輸入日文

http://bbs.cantonese.asia/viewthread.php?tid=15296

庞贯哲全拼输入软件开发计划

http://www.lupaworld.com/35206/viewspace-18713.html

11. 支持各款手写输入法及微软Global IME*输入法

http://msdn.microsoft.com/zh-cn/goglobal/bb688173.aspx

输入法管理器和编辑器 (IMM/IME)

http://social.microsoft.com/Forums/zh-CN/visualcshartzhchs/thread/f62afd8b-03e4-46c7-8569-e5ab38c50ceb

已答复C#如何调用IME来实现输入法的开发

http://office.microsoft.com/zh-cn/excel/HP030900382052.aspx

向「输入法编辑器」(IME) 词典中添加单词

http://www.google.com/ime/pinyin/

谷歌拼音输入法五大特色

http://office.microsoft.com/zh-cn/access/HP030900422052.aspx

向输入法编辑器 (IME) 字典中添加字词

http://down.qqread.com/soft/application/translation/scmondo.html

Microsoft Global IME V5.02 简体中文版

http://www.skycn.com/soft/3050.html

Microsoft Global IME V5.02 繁体中文版

 

 

 

http://www.soft456.cn/soft.asp?id=2175&s_type=0&pcid=518

Microsoft Global IME 5.02 破解版

http://topic.csdn.net/t/20020218/20/531886.html

如何开发一个汉字输入法的程序(vc++)?

http://www.metamuse.net/2007/04/blog-post_10.html

Google IME 谷歌拼音輸入法(cotent refreshed@2007/04/11)

http://www.sciencenet.cn/m/Print.aspx?id=45541

[打印]在中文环境中输入日文_IME输入方法,拼写总结

http://d.wanfangdata.com.cn/Periodical_jsjgcyyy200201038.aspx

基于IMM-IME输入法接口的实现方法

http://msdn.microsoft.com/en-us/library/ms904351.aspx

Simplified Chinese MSPY 3.0 IME Configuration

http://msdn.microsoft.com/en-us/library/ms904345.aspx

Setting the Input Method Programmatically

http://msdn.microsoft.com/en-us/library/ms903865.aspx

End User-Defined Phrase (EUDP)

http://msdn.microsoft.com/en-us/library/ms904350.aspx

Simplified Chinese MSPY 3.0 IME

http://andylin02.javaeye.com/blog/426215

输入法(IME)实现原理

http://support.microsoft.com/default.aspx/kb/943084/zh-tw

Bug:Windows Vista上使用大易和行列輸入法的問題

http://support.microsoft.com/kb/942642/zh-tw

您在 Windows Vista 電腦上使用中文繁體大易 (version 6.0) 輸入法 (IME) 或中文繁體行列 (version 6.0) 輸入法時可能會遇到的問題






References

[edit] See also


 樓主| 發表於 2010-1-29 16:07:07 | 顯示全部樓層
發表於 2010-1-29 17:32:28 | 顯示全部樓層
還沒有開工,移動硬盤時好時壞,Mac Mini又找不到合適的顯示器,偷閒來上網看看大家。
您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則

Archiver|手機版|粵語協會

GMT+8, 2024-12-22 10:53 , Processed in 0.065738 second(s), 20 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回復 返回頂部 返回列表