先來看看通用拼音的宣稱:
------
http://abc.iis.sinica.edu.tw/main.htm (節錄)
華語通用拼音基本資料(Taiwan Tongyong Romanization)
一、華通拼音較符合英語直覺性,更適合作為地名路牌拼音。
漢語拼音用XQ表記ㄒㄑ,與國際英語習慣大大不同,造成大部分國際人士的不方便。因為至少百分之九十五以上的一般外國人,根本沒學過華文,也沒學過漢語拼音,他們是用英語的習慣在看拼音。華通拼音用「ji,ci,si與jh,ch,sh」表記「ㄐㄑㄒ與ㄓㄔㄕ」彼此對稱,而漢語拼音用「j,q,x與zh,ch,sh」表記。
二、漢語拼音用到電腦不方便的符號,而且系統較不一致。
華通拼音只用一種符號(yu)表記ㄩ(魚),例如「魚=yu、女=nyu、居=jyu」;而漢語拼音需動用到三種符號,不一致且電腦不方便,例如「魚=yu、女=n ü,居=ju」。
--
心得:真狹隘。
英文雖然是很國際化的語言,可是英文拼音無法表達出全部的中文音。
那這樣要用英文發音法來拼中文幹嘛,反正都是要學,就不要遷就英文了。
"
他們是用英語的習慣在看拼音。華通拼音用「ji,ci,si與jh,ch,sh」表記「ㄐㄑㄒ與ㄓㄔㄕ」彼此對稱"外國人看到 jh 就知道怎麼發了嗎?在下資質駑鈍,完全不會發這個音。
按這觀點看, jr 不是也不錯。
不過第二點我蠻認同的,不懂為什麼他一個注音符號要用不同的標法。
是因為變調的關係嗎?
這就扯到一個問題,這個拼音法,到底是想表達音標(表達字的真實讀音),還是只是想把這個字的音給標出來(取代字的型)。
------
http://jidanni.org/lang/pinyin/older.html
其實裡面他罵通用拼音的地方,對我來說大部份都不重要,反正我沒學過語言學,
重點是通用拼音常常改,讓人無所適從。
"漢語拼音被台北市政府弄得四不像。 民政局以大小寫來區分前後音節, 因此全沒有隔音符號。譬如我家附近的西安街, 叫做 XiAn St.。 可是在新版的捷運車站資訊中, 因為要全部大寫, 西安街卻變成 XIAN ST.;成了「仙街」。 可見, 一需將余氏法全大寫, 害人害己。"
這一段,以 IT 的角度來看,有利有弊,
同樣的系統,如果需要隔音符號,那平均每一個中文詞一定需要比較長的長度。
(如果這個隔音符號是如我想的,目的是讓漢語拼音成為Prefix-free_code)
http://en.wikipedia.org/wiki/Prefix-free_code
(20070727補充:
http://www.edu.cn/20011114/3009777.shtml
隔音符號真的就是 delimiter 而以,
不過還是一樣會比較長)
通用拼音用大小寫區分,在 plain text 未壓縮的狀態是比較短的,
但是壓縮過後,通用拼音因為 entropy 比較大,所以會占比較大的空間。
(雖然說 'a 和 A 對人來說資訊量是一樣,想來 entropy 應該是一樣的,
但是因為電腦不知道 A => 'a 這件事,所以 AaBbCc 的 entropy 比 'aa'bb'cc大。
而且漢語拼音也不是每個重音都會加 '。
但是但是但是,我個人比較喜歡看用小大寫表示。)
然後有些系統是不區分大小寫的,像 DOS8.3、email address 等等。
通用拼音在這地方會發生災難。
' 在某些地方也有可能會被列入特殊字元不能使用,
例如帳號名稱、檔名等等,雖然我還沒遇到啦。
------
我找不到大陸官方的網站上的漢語拼音文件說明,還蠻糟的。
另外, http://edu.cn/ 搞的像入口網站一樣,五顏六色害我找不到重點。
但是漢語拼音有個麻煩的地方,ü 的符號在標準106key英文鍵盤裡沒有。
這種也不知道要怎麼打,multibyte 想必不吃這種東西。
liùshísān yì qīqiān èrbǎi liùshíbā wàn sìqiān líng jiǔshíwǔ(六十三億七千二百六十八萬四千零九十五)
(20070727更正:http://local.joelonsoftware.com/mediawiki/index.php/The_Joel_on_Software_Translation_Project:%E8%90%AC%E5%9C%8B%E7%A2%BC
根據這裡的 ascii 表,似乎是吃的,不過要怎麼打還是一個麻煩。)
http://www.cccla-us.org/pinyin.htm
一個注音符號有三種漢語拼音標注法,麻煩阿。
我想用的只是用羅馬符號來代表注音符號而以。
http://www.edu.tw/EDU_WEB/EDU_MGT/MANDR/EDU6300001/allbook/kyjd/shen.html
《國語一字多音審訂表》說明 裡面說明了 :
7.連讀變調、變音:凡屬連讀變調、變音字不在審查範圍,如:「一、七、八、不的 變調」、「上聲連讀變調」、「句末語助詞變音」、「ㄦ化變音」等。
------
One-Soon Her. 2005c.〈「全球化」與「在地化」:從新經濟的角度看台灣的拼音問題〉(Between Globalization and Indigenization: On Taiwan’s Pinyin Issue from the Perspectives of the New Economy)。《人文及社會科學集刊》(Journal of Social Sciences and Philosophy) 17.4, 785-822. (TSSCI) (Download)6.7 的解套方法相當有趣,事實上Intel 已經做過類似的事情了。
請看 http://en.wikipedia.org/wiki/EM64T#Intel_64
關於轉換成本,有幾個現成的例子。
1. 換行符號 CR/LF (MS) , CR (mac) , LF (unix)。
2. 簡體/繁體文件轉換。
------
結論,還是用 IPA 吧.....
想要用26鍵打出中文拼音,沒有我想用的標準。
--
嗯,可是我想做的是只是把中文字給拉丁化,並不是想要標音標。
"Romanization" 應該是對應字,而不是音吧?
現在考慮用這個 http://www.unicode.org/charts/PDF/U3100.pdf