找回密碼
 註冊

QQ登錄

只需一步,快速開始

搜索
熱搜: 活動 交友 discuz
查看: 7036|回復: 26

[資料收集] 新輸入法字詞音調校對而引申出嘅問題,校對成員必入

[複製鏈接]
發表於 2008-10-14 10:12:16 | 顯示全部樓層 |閱讀模式

鑒於今次輸入法製作加入咗詞表及音調,成品可能會影響年輕一代甚至再下一代人,所以任何問題都必須謹慎處理
輸入法詞彙以台灣書面文用詞彙爲基礎,加入香港粵語成文所用嘅粵語詞彙,口音以廣州西關口音爲標準
喺呢度提出幾個問題


1、關於何文匯對粵語正音嘅影響
何文匯經常採用「舊音今用」甚至「古音今用」,如果古音必棄,噉舊音嘅採用標準界限係幾多?

「使si2用」、「搜索saak3」,資料顯示此爲古音,呢類音以前喺廣府話中不曾聽過,至少我由細到大住喺西關都未聽過啲老人家講廣州話係噉樣講,十年前香港嘅電視臺都唔會噉講,現時是否按上一版本繼續收錄?至於「妖(jiu2)」讀成「夭(jiu1)」乃係舊音,呢類音又是否收錄?


2、從俗問題
個人覺得「應從俗又不可太俗」,太俗嘅話,明明係寫成「僆仔」之但係要從俗又要寫成「o靚仔」;「來」字本身有「lai4」及「loi4」音而冇「lei4」音,香港新造一個「嚟」字來囊括「lai4」同「lei4」音,因為經已有段時日,「嚟」字續漸被接受;而現時又有以新造字「噚」來囊括「尋」同「琴」音(噚日、噚晚),新造俗字又是否接受呢!?


3、本字問題
「呢個」嘅「呢」字喺表示「這」嘅意思時候,經常有人讀「ni1」或者「ji1」,經已有人考證出本字爲「爾」,「爾」古音同今音嘅聲母分別爲「n」同「j」,符合現今口音習慣及古音轉今音嘅規律;而「啲」字係表示些少嘅時候係「尐」,修飾名詞成形容詞嘅係「的(dit1音)」,類似嘅本字問題應該從本收錄定從俗收錄呢?而「我哋」嘅「哋」字本字爲「等」,類似嘅又如何處理?

個人意見係「口」字邊嘅擬聲字喺本字唔引起歧義嘅情況下應該盡量棄用


4、字音嘅亦正亦誤問題
「尐」字喺一般口語情況應該讀「dit1」,但粵語審音嘅拼音係「zit1」,雖然非廣府話嘅其他粵語片方言係d-z互換,噉係可以講得過去,但例如「鬈毛」嘅「鬈」字,平時係讀「lyun1」,而粵語審音及上一版輸入法都係「kyun4」音,噉呢啲亦正亦誤嘅音又如何處理?


5、對日語漢字嘅支持問題
日語入邊有好多漢字係日本自造字,根本冇中文讀音,unicode一定有收錄在內,對於日本自造字如何處理其音韻及音調問題?




下面係校對時候發現嘅問題
衞 VS 衛
http://bbs.cantonese.asia/viewthread.php?tid=12863&extra=page%3D1

亁 VS 乾

http://bbs.cantonese.asia/viewthread.php?tid=12864&extra=page%3D1

邊 VS 便

http://bbs.cantonese.asia/viewthread.php?tid=12865&page=1&extra=page%3D1#pid112711

[ 本帖最後由 Lucciora 於 2008-10-14 10:35 編輯 ]
發表於 2008-10-14 10:31:48 | 顯示全部樓層
我覺得每個人嘅口語習慣唔同,新版應該體現一定嘅包容性,因為輸入法于我哋係交流嘅必要工具,雖然唔可能完全照顧所有粵方言區嘅朋友,但應該加收更多口語詞。而以往有嘅,除非係謬誤,唔係嘅話都應該收錄。
發表於 2008-10-14 11:45:17 | 顯示全部樓層
語言的變調,其中我疑是因人不想撞詞,此應是有尐不知覺的.
又或有其它原因亦不定.
只為正而正,好像有尐食古不化.
話不定他有其它原因,但我冇聞.
發表於 2008-10-14 16:20:58 | 顯示全部樓層

1、妖讀、民讀,都應該收錄。

2、3、平時使用宜從俗,研究時可追本溯源。口字邊嘅字既然有群衆基礎,一定要收錄,至於本字係咪應該收錄,就要斟酌下。

4、如果嗰個字有嗰個讀音,可以收錄埋。

發表於 2008-10-14 17:20:52 | 顯示全部樓層
我覺得本字版本同俗字版本都可以一齊收錄,由用戶自行決定用邊個。
至於明顯唔符合絕大多數廣府人習慣嘅何氏音,應旗幟鮮明噉排斥。例如時間,絕無必要收「gaan1」音。同理,「購買」唔應收 gau3音。對於本來就存在嘅異讀,則應悉數收錄。例如「觸」zuk, cuk 兩音都有人讀,所以應該都收。
發表於 2008-10-14 17:28:35 | 顯示全部樓層

收錄妖音對輸入法其實影響不大。我哋平時輸入只須按照自己嘅口語習慣輸入即可,例如kau maai、sai jung……此時就算詞庫有收到gau maai、si jung呢啲音,都對你打字冇影響。

噉樣可以同時兼顧各類人嘅習慣,使輸入法嘅受衆更廣。

 樓主| 發表於 2008-10-14 17:45:56 | 顯示全部樓層
我都反對收錄何文匯嘅妖音
發表於 2008-10-14 19:08:59 | 顯示全部樓層

考本字比较可靠的我看只有白宛如。

可以参考他的《广州方言词典》

其他书上出现的广州话本字应该慎用

至于正音问题,我认为没有调查就没有发言权,所以对何文汇字音不必过早定论。哪些字音合理,哪些音不合理,超出一般网友的知识范围。

[ 本帖最後由 南汉 於 2008-10-14 19:13 編輯 ]
發表於 2008-10-15 01:21:53 | 顯示全部樓層
個人覺得,異讀兼容多些好。包括很多人依的俗讀,包括社會上已有人跟的何氏妖讀。
沒人跟的不必理會。
本字問題,有人使用的古音,也宜並容。
發表於 2008-10-15 20:54:54 | 顯示全部樓層
個人認為對于何氏音,須對照參考其它聲望較高的辭書(如廣州音字典、廣州話正音字典等)。如果一些音在其它流派的辭書都沒有收錄,而且根據修訂人員的經驗社會上使用的人極少(尤其是那些人民大眾不用,只有翡翠臺、本港臺用的,如「時奸」、「搶救」)的音,就可以判斷為妖音(或者是舊音),不予收錄。此外,對于何氏否認口語變調后產生的詞組怪音,例如「媽媽」maa1 maa1 ,「弟弟」dai6 dai6 ,「哥哥」go1 go1 等也可考慮不收錄。原因是如果用戶不記得變調的調號,只需要打單字就可以出來,如果要打詞組,則打變調版本 maa4 maa1, dai4 dai2, go4 go1 更符合習慣。當然,有些詞組本身就有兩種讀音的,例如公公,讀gong1 gong1 表示太監,讀 gong4 gong1 表示外公,那固然應兩者皆錄。
發表於 2008-10-15 21:31:42 | 顯示全部樓層

原帖由 Lucciora 於 2008-10-14 10:12 發表 鑒於今次輸入法製作加入咗詞表及音調,成品可能會影響年輕一代甚至再下一代人,所以任何問題都必須謹慎處理輸入法詞彙以台灣書面文用詞彙爲基礎,加入香港粵語成文所用嘅粵語詞彙,口音以廣州西關口音爲標準喺呢度提出幾個問 ...

1、關於何文匯對粵語正音嘅影響

我覺得古書有載之音都要酌量收

當然要標明「坊間大眾讀音」同「古音」,「舊音」等..

 

2、從俗問題

「來」字「lai4」「loi4」「lei4」音都合符普通音變規律,而且普通人都清楚,都應該收

「僆仔」一類比較冷門,而又唔係好sure嘅本字,最好唔好收 (個[leng1]音)

 

3、本字問題
雅俗都收,同時加註俗音古音,同其他備註就最好

 

4、字音嘅亦正亦誤問題
「尐」字要兩音都收

而[lyun1]音有「鬈」「蜷」「攣」各講法,不收為妙

 

5、對日語漢字嘅支持問題

有音讀之字就按則音轉成粵音

如果係只有訓讀之字,就「有邊讀邊」

發表於 2008-10-15 21:49:18 | 顯示全部樓層
有樣嘢大家要留意嘅係,我哋校對完嘅詞表主要係用嚟做輸入法嘅,做語料字典係次要目的。
用家只會根據自己嘅口語讀音打,如果打唔到想要嘅,就唔會選用我哋套輸入法。
我應該要顧及群眾基礎,收錄各類人口語讀音,太離譜、擺明錯嘅先至要叮走。
如果唔係嘅話,套輸入法會冇人用。

例如︰
如果冇「sijung使用」,大部份香港人都打唔落手。
發表於 2008-10-16 09:42:53 | 顯示全部樓層

基於新輸入法係現代輸入法,我認為應以現在流行用字為主.部分有爭議嘅字,如有帖嘅 衞 VS 衛 亁 VS 乾

有D字古時相通,後來分工,但於近代又從新通用,如此情況應以遵從現代人用字習慣來選字.

 

 

 



 

發表於 2008-10-16 09:55:59 | 顯示全部樓層

舊版貌似冇詞語靠前功能,都唔可以打兩個聲母就聯想出詞組,所以我只會用嚟打幾個難揾嘅粵語方言字,呢個係好遺憾嘅事。

 

And then~L君講嘅:「使si2用」、「搜索saak3」,資料顯示此爲古音,呢類音以前喺廣府話中不曾聽過,至少我由細到大住喺西關都未聽過啲老人家講廣州話係噉樣講……

 

呢句我唔同意囖。

 

 

[ 本帖最後由 gboss 於 2008-10-16 10:10 編輯 ]
 樓主| 發表於 2008-10-17 14:53:37 | 顯示全部樓層
原帖由 gboss 於 2008-10-16 09:55 發表 舊版貌似冇詞語靠前功能,都唔可以打兩個聲母就聯想出詞組,所以我只會用嚟打幾個難揾嘅粵語方言字,呢個係好遺憾嘅事。   And then~L君講嘅:「使si2用」、「搜索saak3」,資料顯示此爲古音,呢類音以前喺廣府話中不曾聽過, ...


眞係由細到大喺廣州都未聽過囉,香港都係近呢五年先至喺電視度聽到
發表於 2008-10-17 16:49:19 | 顯示全部樓層
原帖由 Lucciora 於 2008-10-17 14:53 發表 眞係由細到大喺廣州都未聽過囉,香港都係近呢五年先至喺電視度聽到


我都未聽過喔。。。可能又係舊音啦。
發表於 2008-10-29 21:42:31 | 顯示全部樓層

有很多讀音後生仔未聽過,但不等於不存在。

比如説 貓 文言讀音係 苗 。大概只有少數老人知道這個讀音。

這些讀音是客觀存在的,不能用民粹思想打壓。

 樓主| 發表於 2008-10-30 08:49:44 | 顯示全部樓層
我公公婆婆都係叫 miu1㗎

亦會有好多人唔接受何博士嘅「正音」,而會去用返今音,如果按照何博士所講,搜索讀「sau2 saak3」都未算,要讀「sau4 saak3」,噉呢個音又收唔收呢!?我哋嘅探討係就係需要搵個平衡點,但最驚就係非粵語爲母語嘅人喺借用輸入法學習粵語嘅時候學壞口型,噉就弊喇,因為現時粵語字典教材缺乏而且品質參差,借輸入法嘅音調表來學習眞係不足為奇

我提提馬萬千嘅建議,就係Desmond喺編寫輸入法嘅時候,將何博士嘅「正音」特登做多個database,寫多個front loader,將何博士嘅「正音」列為「可選加載項」,唔加載嘅情況下就係正宗嘅西關口音嘅粵語音調,噉會唔會好啲呢?
發表於 2008-10-30 09:31:26 | 顯示全部樓層

原帖由 Lucciora 於 2008-10-17 14:53 發表 眞係由細到大喺廣州都未聽過囉,香港都係近呢五年先至喺電視度聽到

 

嗯,的確係唔多,但唔可以話冇。

發表於 2008-10-30 09:57:05 | 顯示全部樓層
原帖由 Lucciora 於 2008-10-30 08:49 發表 我公公婆婆都係叫 miu1㗎亦會有好多人唔接受何博士嘅「正音」,而會去用返今音,如果按照何博士所講,搜索讀「sau2 saak3」都未算,要讀「sau4 saak3」,噉呢個音又收唔收呢!?我哋嘅探討係就係需要搵個平衡點,但最驚就係非粵語爲 ...


或者對于何氏音、舊音等,用不同的字體(如顏色)或者在旁邊加注(《舊》)等方式來同現今較廣泛使用的音區別開來咯。再比如有些字,變調版本已經占主流的,則原調旁可以標(《本》)。如:

sau2 saak3 (舊) 搜索
sau2 sok3 搜索
bok6 ce1 (舊) 泊車
paak3 ce1 泊車
caang4 (本) 橙
caang2 橙
kuai3 (本) 愧
kuai5 愧
您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則

Archiver|手機版|粵語協會

GMT+8, 2024-5-5 01:27 , Processed in 0.062868 second(s), 20 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回復 返回頂部 返回列表