[PHP-dev 1515] Re: 絵文字 <-> Unicode 6.0 変換

Shinya Muramatsu revulon @ gmail.com
2011年 8月 19日 (金) 01:30:21 JST


村松と申します。

HTML_Emoji という PHP の絵文字ライブラリを作って公開しているので、
その時の経験から意見を述べさせていただきます。

以下のコメントは、
http://d.hatena.ne.jp/rui_hi/20110813/1313242399
に書かれている、現時点での仕様に対するものですので、
そちらも合わせてご参照下さい。

なお、申し訳ないのですが、時間の都合もありまして、
まだ実際にソースコードを見たり、テストしたりはしておりません。
考えに誤りがあるかもしれませんので、参考意見くらいに捉えて下さい。

ユーザーの視点から見た仕様としては、上記のページに書かれているように、

・UTF-8-Mobile#xxx を新たに定義する
・SJIS-Mobile#xxx-PUA は SJIS-Mobile#xxx に統合する

のようにするのが、すっきりとして妥当だと思います。
エンコーディング名は、Ruby 1.9.2 以降のように、UTF-8-docomo, SJIS-docomo
のような名前にしても良いのかもしれません。

ただ、現在の実装は、

UTF-8 ←→ UTF-8-Mobile
UTF-8 ←→ SJIS-Mobile

のように Unicode 6.0 とのマッピングを用意しようとしているのだと思いますが、
そのようにすると、UTF-8-Mobile と SJIS-Mobile との間で変換をした時に、
一部の絵文字が破壊されてしまうのではないでしょうか?
ですので、UTF-8-Mobile と SJIS-Mobile との間の変換については、

UTF-8 ←→ UTF-8-Mobile ←→ SJIS-Mobile

のように、Unicode 6.0 を介さずに処理する方が良いのではないかと思うのですが、
いかがでしょうか? ご検討いただけると幸いです。

以上、よろしくお願い致します。

--
Shinya Muramatsu <revulon @ gmail.com>


PHP-dev メーリングリストの案内