[PHP-dev 674] Re: Fwd: [PHP-DEV] I18N

Moriyoshi Koizumi php-dev@php.gr.jp
Thu, 26 Dec 2002 14:52:02 +0900


小泉です。

tsukada takuya <tsukada@fminn.nagano.nagano.jp> wrote:

> こんにちは、塚田卓也と申します。
> 
> 小泉さん:
> > 
> > 別の所で php の国際化の動きがあるようです。
> > 個人当てに来たものですが、了承を取りましたので転送します。
> > 
> > この ICU (http://oss.software.ibm.com/icu/) というライブラリが
> > 気になっていたところにちょうどメールが来たので、正直驚いています。
> > まだ試してはいませんが、正規表現エンジンも実装しているようなのです。
> 
> ICUを利用しようという話は、以前にも何度かあって、
> 実際に作業していた人も居ました。(お名前は覚えていませんが、)
> 
> ICUのような本格的な国際化フレームワークを利用しようとすると、
> 内部処理はワイド文字を使うという方向になりますが、なかなか賛同が
> 得られないという状況になると思います。
> また、一部の機能を利用するにしても、ライブラリが巨大で、
> すでにPHPにある機能と重複するものがあるので、
> 既存の関数をICUの機能を使って置き換えるか、icu_*()という
> 関数のモジュールを作るのか、議論が分かれるところだと思います。
> そういったことで、私はICUを使うことは、面白そうだと思いつつも、
> 真剣に取り組むことはありませんでした。

ICUを使うという話はあくまで議論上のネタであって、実際のところ私も慎重です。
実際メールを頂いた方には、(ICUは)ちょっとユニコード指向すぎて
日本やその他の東アジアの国で要求される文字コード処理のニッチを
満たしていない、と返しましたし。

ただ、特筆すべきは ICU のページに置かれている XML で書かれたUnicode 変換テ
ーブルです。個人的には、まあ、tsv の方がよかったのですが、とりあえずこれを
利用することで、変換テーブルの自動生成が容易になりますし、動的ローディング
もできるなあ、と勝手に思っております。

Unicode も石像ではなく生き物ですから(本当は石像であってほしいのですが)、
変換テーブルを機械的に生成できる仕組み、これは今後間違いなく必要だと思いま
す。
塚田さんの新しい変換エンジンは、副集合の変換を組み合わせて
cp932 と sjis などの差異に対処されていますが、これは私が理想とする実装でし
たので驚いていたところなのですが、テーブルはどのように生成したのでしょう?