[PHP-users 9458] Re: 多国語対応のサイト構築について

Masaki Fujimoto php-users@php.gr.jp
Fri, 23 Aug 2002 10:10:36 +0900


ふじもとです。

なにぶんあちらの事情にはあまり詳しくないので伝聞が多くなってしまいますが。

On Thu, 22 Aug 2002 13:16:11 -0600
Rui Hirokawa <rui_hirokawa@ybb.ne.jp> wrote:
-snip-
> 現在は、文字コードの検出とUnicodeとの相互変換がメインですので、
> この辺のところまで考慮はまだされていません。
> スクリプトの中にBIG5を記述した場合、ご指摘のとおりSJISと似たような問題が
> 起きる可能性があります。(程度の差はあるでしょうが。)

ですね。BIG5の第2バイトの範囲は0x40-0x7E, 0xA1-0xFEということなので0x5c
を始めとして色々と問題はおきると思います。

> 藤本さんのスクリプトエンコーディング拡張をBIG5対応にすることになるでしょ
> うか。
> 現時点でスクリプトを書くとしたら、UTF-8 or EUC-TWでしょうか。

となると思います。一応Shift_JISやBIG5といったISO-2022非準拠な文字エンコー
ディングに対応するフレームワークはあるので、Postgres等を参考にして:)一応
一通りは動くものを作っておいて、後の細かい点や方言(BIG5+, CP950等)への対
応は、BIG5等を激しく使っている方に修正をお願いする予定でいます。

という状況なのですが聞いたところではあちらではやはりBIG5が広く使われてい
るそうなので(EUC-TWはほとんどつかわれていないとか)、早急に対応する必要が
あるのかもしれません。

というか、そもそもあちらではどのくらいPHPが普及しているのでしょうか。あ
まりユーザがいない、需要が無い、ということであれば後回しにしようかな、と
も思ったり:)

何にせよ現状ではBIG5を使うのはなかなか難しいと思われますのでUTF-8で書く
のが良いのかな、と考えています。

# 石井さんには釈迦に説法なのは承知で...

--
藤本 真樹

アストラザスタジオ
fujimoto@studio.co.jp
fujimoto@php.net