[PHP-users 4767] Re: sjis で echo ”能”

Tatsuo Ishii php-users@php.gr.jp
Thu, 17 Jan 2002 10:20:44 +0900


石井です.

> > 内部エンコーディングに関しては、マルチバイト処理を含めた処理効率を考えると
> > Java等と同様にUCS-2/UCS-4等のワイドキャラクターとするのが理想的でしょう。
> 
> とりあえずZend Engine 2ついてのみ考えてみても、現状の実装を見る限りワイ
> ドキャラクターを内部エンコーディングとして使用するのは結構厳しいかな、と
> (残念ながら)感じています(この辺は廣川さんも重々ご承知かとは思いますが)。
> まず構文解析器を何とかしないとことには始まらないのですがflexでは厳しいで
> すよねぇ。

PHP4のパーサを実際に見ずにあれこれ言うのも何ですが,PostgreSQLをいじっ
た経験から言うと(PostgreSQLのパーサもflexです),どうしてもワイドキャラ
クタにしなければ処理が大変,という場所ってそんなに多くないような気がし
ます.
# 正規表現処理くらいかな.

また,内部コードは所詮内部コードですから,既存のUTF-8やEUCにする必要も
ないはずです.処理上もっとも都合の良いエンコーディングを人工的に作って
もいいのではないでしょうか.UTF-8にしてもEUCにしても一長一短ですからね.

# もう完全に php-dev ネタですね.
--
Tatsuo Ishii