[PHP-dev 1515] Re: 絵文字 <-> Unicode 6.0 変換
Shinya Muramatsu
revulon @ gmail.com
2011年 8月 19日 (金) 01:30:21 JST
村松と申します。
HTML_Emoji という PHP の絵文字ライブラリを作って公開しているので、
その時の経験から意見を述べさせていただきます。
以下のコメントは、
http://d.hatena.ne.jp/rui_hi/20110813/1313242399
に書かれている、現時点での仕様に対するものですので、
そちらも合わせてご参照下さい。
なお、申し訳ないのですが、時間の都合もありまして、
まだ実際にソースコードを見たり、テストしたりはしておりません。
考えに誤りがあるかもしれませんので、参考意見くらいに捉えて下さい。
ユーザーの視点から見た仕様としては、上記のページに書かれているように、
・UTF-8-Mobile#xxx を新たに定義する
・SJIS-Mobile#xxx-PUA は SJIS-Mobile#xxx に統合する
のようにするのが、すっきりとして妥当だと思います。
エンコーディング名は、Ruby 1.9.2 以降のように、UTF-8-docomo, SJIS-docomo
のような名前にしても良いのかもしれません。
ただ、現在の実装は、
UTF-8 ←→ UTF-8-Mobile
UTF-8 ←→ SJIS-Mobile
のように Unicode 6.0 とのマッピングを用意しようとしているのだと思いますが、
そのようにすると、UTF-8-Mobile と SJIS-Mobile との間で変換をした時に、
一部の絵文字が破壊されてしまうのではないでしょうか?
ですので、UTF-8-Mobile と SJIS-Mobile との間の変換については、
UTF-8 ←→ UTF-8-Mobile ←→ SJIS-Mobile
のように、Unicode 6.0 を介さずに処理する方が良いのではないかと思うのですが、
いかがでしょうか? ご検討いただけると幸いです。
以上、よろしくお願い致します。
--
Shinya Muramatsu <revulon @ gmail.com>
PHP-dev メーリングリストの案内