tianyagukexie 發表於 2008-6-30 11:28:48

点解粤语字有咁多嘅多音字啊?

近日係网上揾到个比较权威嘅关于粤语读音嘅网站:《粤语审音配词字库》http://humanum.arts.cuhk.edu.hk/Lexis/lexi-can/<BR>呢个网站非常系统,有香港語言學學會、耶魯、耶魯(正統)、黃錫凌、萬國音標、廣州、劉錫祥七个注音系统。总共有13060个,我大概统计下,单独音字有8303个,即系话,多音字差唔多有5000个!!!<BR>收字範圍:本字庫以大五碼漢字為主要收錄對象。其中包括大五碼第一字面5401個漢字和第二字面7652個漢字。此外,另收錄7個倚天漢字。總收字數為13060個。<BR>從語音概念看,本字庫所收的漢字可大分為兩組,分別稱為「單讀音字」和「多讀音字」。 <BR>單讀音字:在本字庫中,漢字 C 被稱為「單讀音字」,若且唯若它只有一個公認的粵語讀音;否則漢字 C 屬「多讀音字」。 <BR>多讀音字:所謂「多讀音字」,按照其字音與字義之關係,可以再細分為三類,在本字庫中分別稱為「破音字」、「異讀字」和「異讀破音字」。 <BR>任何「多讀音字」,若(a)其讀音當中至少有兩個表示不同的意義;而且(b)其讀音之間並未構成下文所述之異讀關係者,皆屬「破音字」。例如「覺」字,當讀如時,意指「睡眠」;若讀如,則意指「對刺激的感受和辨別」、「醒悟」等等。 <BR>任何「多讀音字」,若其讀音之變化並沒有構成字義之別,皆屬「異讀字」。例如「曙」字,分別被注上、和三個不同的讀音,但基本意義不變。 <BR>任何「多讀音字」,若(a)其讀音當中至少有兩個表示不同的意義;而且(b)其讀音中至少有兩個構成上述異讀關係者,皆屬「異讀破音字」。例如「藉」字,在粵語中有、和三種讀法。當用以表達「依靠」之意時,分別被注上和兩個不同的讀音,兩者構成了異讀關係。當用以表達「踐踏」之意時,「藉」字讀。換句話說,在「藉」字三個粵語讀音當中,至少有和兩者表示不同的意義
好多都系我未听过嘅,比如:寺发两个音:zi2,zi6,它:ta1,to1,费:fei3,béi3....<BR>點解粵語有咁多嘅异讀字,多音字啊?

desmond 發表於 2008-6-30 16:21:44

<P>「睡覺」嘅「覺」字同「覺得」嘅「覺」字,普通話發音亦唔一樣。</P>
<P>本身呢個字就係多音字。</P>

tianyagukexie 發表於 2008-6-30 17:11:13

我本想做个粤语词语的读音码表,我找了一个四万多词组的词库,经过程序算出了一万多组码表,剩下三万多组都是因为词组中有多音字而无法确认词组的读音。

中二仔 發表於 2008-6-30 17:27:51

<P>你舉嘅例入面............</P>
<P>1.有好多根本係漢語異讀,如:覺,費,藉</P>
<P>2.調化為陰上,有時表達唔同意思,有時係文白異讀.......如:寺</P>
<P>3.根本係漢語古今異義而異讀,如:它</P>
<P>&nbsp;</P>
<P>你啲例真係唔係好掂/............</P>

tianyagukexie 發表於 2008-6-30 18:07:56

<P>呵呵,见笑喇,我嘅母语唔系讲粤语嘅,只系基本识听,不过我好中意粤语。因为我想做个粤语嘅码表,但捻唔到粤语嘅多音字(异读字)咁多。</P>
<P>以下嘅字读音多达6个(广州拼音方案):</P>
<P>啊&nbsp;a2&nbsp;a3&nbsp;a4&nbsp;ha2&nbsp;ha4&nbsp;<BR>阿&nbsp;a2&nbsp;a3&nbsp;nga3&nbsp;ag3&nbsp;o1&nbsp;ngo1<BR>苴&nbsp;ca1&nbsp;ca4&nbsp;za2&nbsp;za3&nbsp;cêu1&nbsp;zêu1<BR>那&nbsp;na5&nbsp;na6&nbsp;no1&nbsp;no4&nbsp;no5&nbsp;no6<BR>凹&nbsp;wa1&nbsp;ao1&nbsp;ao3&nbsp;ngao1&nbsp;leb1&nbsp;neb1<BR>欸&nbsp;ai2&nbsp;ei2&nbsp;é6&nbsp;ié6&nbsp;oi1&nbsp;oi2<BR>黮&nbsp;dam6&nbsp;tam2&nbsp;tam3&nbsp;tam5&nbsp;tan2&nbsp;sem6<BR>拚&nbsp;fan1&nbsp;fen3&nbsp;ping1&nbsp;pun1&nbsp;pun2&nbsp;pun3<BR>莞&nbsp;guan1&nbsp;gun1&nbsp;gun2&nbsp;wun1&nbsp;wun2&nbsp;wun5<BR>攒&nbsp;zan2&nbsp;zan6&nbsp;cün4&nbsp;zün1&nbsp;zün2&nbsp;zün6<BR>堨&nbsp;ad3&nbsp;ngad3&nbsp;oi2&nbsp;oi3&nbsp;ngoi2&nbsp;ngoi3<BR>踅&nbsp;zei6&nbsp;ci3&nbsp;zid3&nbsp;cüd3&nbsp;yüd6&nbsp;züd6<BR>厂&nbsp;em1&nbsp;ngem1&nbsp;ho1&nbsp;hon2&nbsp;hon3&nbsp;ngon6<BR>捻&nbsp;nen2&nbsp;nim1&nbsp;nim2&nbsp;nim5&nbsp;nin2&nbsp;nin5<BR>咯&nbsp;ked1&nbsp;lo1&nbsp;lo3&nbsp;gog3&nbsp;log3&nbsp;log6<BR>敦&nbsp;diu1&nbsp;dêu1&nbsp;dêu3&nbsp;dêu6&nbsp;dên1&nbsp;dên6<BR>垫&nbsp;dim3&nbsp;din2&nbsp;din3&nbsp;din6&nbsp;zin3&nbsp;dib6<BR>从&nbsp;cung1&nbsp;cung4&nbsp;sung1&nbsp;zung1&nbsp;zung3&nbsp;zung6</P>
<P>粤语字多音字(异读字)多达五千几个!!</P>
<P>我<IMG alt="" src="http://bbs.cantonese.asia/images/smilies/default/sweat.gif" border=0 smilieid="10"> ,狂晕!!<BR></P>

中二仔 發表於 2008-6-30 22:17:12

<P>原帖由 <I>tianyagukexie</I> 於 2008-6-30 18:07 發表 <A href="http://bbs.cantonese.asia/redirect.php?goto=findpost&amp;pid=90380&amp;ptid=10950" target=_blank><IMG onclick=zoom(this) alt="" src="http://bbs.cantonese.asia/images/common/back.gif" onload="attachimg(this, 'load')" border=0></A> 呵呵,见笑喇,我嘅母语唔系讲粤语嘅,只系基本识听,不过我好中意粤语。因为我想做个粤语嘅码表,但捻唔到粤语嘅多音字(异读字)咁多。以下嘅字读音多达6个(广州拼音方案):啊&nbsp;a2&nbsp;a3&nbsp;a4&nbsp;ha2&nbsp;ha4&nbsp;阿&amp; ... 睇過你上面堆例,我都暈.........<IMG alt="" src="http://bbs.cantonese.asia/images/smilies/default/sweat.gif" border=0 smilieid="10"> </P>
<P>譬如:从&nbsp;cung1&nbsp;<STRONG>cung4</STRONG>&nbsp;sung1&nbsp;zung1&nbsp;zung3&nbsp;zung6</P>
<P>欸&nbsp;<STRONG>ai2(ai3?)</STRONG>&nbsp;ei2&nbsp;é6&nbsp;ié6&nbsp;oi1&nbsp;oi2</P>
<P>只有上面<STRONG>一個音</STRONG>係常用,其他音我係一次都未聽過.............<IMG alt="" src="http://bbs.cantonese.asia/images/smilies/default/sweat.gif" border=0 smilieid="10"> </P>

highyun 發表於 2008-6-30 23:31:24

<P>上面列舉嗰啲所謂多音字,有好多音係古字通假音,平時基本冇機會噉讀。</P>
<P>審音配詞個使用凡例都講得幾清楚啦:<A href="http://humanum.arts.cuhk.edu.hk/Lexis/lexi-can/guide.php">http://humanum.arts.cuhk.edu.hk/Lexis/lexi-can/guide.php</A></P>

desmond 發表於 2008-7-1 08:34:48

<P>好明白樓主做粵語輸入法碼表遇到多音字嘅問題。</P>
<P>我亦係苦無對策啊。</P>

tianyagukexie 發表於 2008-7-3 09:32:00

<P>原帖由 <I>highyun</I> 於 2008-6-30 23:31 發表 <A href="http://bbs.cantonese.asia/redirect.php?goto=findpost&amp;pid=90414&amp;ptid=10950" target=_blank><IMG onclick=zoom(this) alt="" src="http://bbs.cantonese.asia/images/common/back.gif" onload="attachimg(this, 'load')" border=0></A> 上面列舉嗰啲所謂多音字,有好多音係古字通假音,平時基本冇機會噉讀。審音配詞個使用凡例都講得幾清楚啦:http://humanum.arts.cuhk.edu.hk/Lexis/lexi-can/guide.php ... </P>
<P>虽然你讲我举嘅例子好多系古音,但系审音配词全部都收入去,我要用时候就只能一个个挑出来。况且我系举嘅例子系要说明粤语嘅多音字多嘅程度,唔系平时有冇机会读嘅问题。生成词组嘅读音系由程序生成嘅,程序并冇办法判断边个字系古音,边个字平时冇机会读到,只可以将每个字嘅所有读音都参与运算,生成多个组合,再由人工挑选出正确嘅读音。呢个亦都系最棘手嘅难题,唔知你可唔可以理解我写呢篇贴嘅道理?</P>

中二仔 發表於 2008-7-3 13:46:51

<P>原帖由 <I>tianyagukexie</I> 於 2008-7-3 09:32 發表 <A href="http://bbs.cantonese.asia/redirect.php?goto=findpost&amp;pid=90943&amp;ptid=10950" target=_blank><IMG onclick=zoom(this) alt="" src="http://bbs.cantonese.asia/images/common/back.gif" onload="attachimg(this, 'load')" border=0></A> 虽然你讲我举嘅例子好多系古音,但系审音配词全部都收入去,我要用时候就只能一个个挑出来。况且我系举嘅例子系要说明粤语嘅多音字多嘅程度,唔系平时有冇机会读嘅问题。生成词组嘅读音系由程序生成嘅,程序并冇办法判断边 ... 平時唔用,就即話唔係<STRONG>粵語</STRONG>嘅多音</P>
<P>搞都咁多個音,恐怕都係字庫入面人手操作時候嘅問題.</P>
<P>將太多唔存在粵語嘅音收埋</P>

tianyagukexie 發表於 2008-7-3 14:42:40

所有嘅多音字同埋异读字加埋有5000左右多,我都想将嗰啲平时唔用到嘅音收埋,但我对粤语嘅读音重唔系好熟,好多还不敢确定。

外外星人 發表於 2008-7-4 01:16:50

尽量少收,若果有需要,日后再补充。噉做得唔得呢?

xiss 發表於 2008-7-4 02:04:27

個人認爲,粵語有咁多異讀,同粵語嘅規範工作做得比較遲,比較慢,規模比較小有關!
頁: [1]
查看完整版本: 点解粤语字有咁多嘅多音字啊?