[PHP-users 3540] Re: xml_parseを使う場合の XML ファイルの文字コード

Junichi Kuroki php-users@php.gr.jp
Wed, 14 Nov 2001 19:53:02 +0900


 黒木です。

> > いえいえ、XMLドキュメントは全部 EUC ですよ。
> > 
> > XML(EUC-JP) → [PHPで読み込み  EUC-JP > UTF-8   ] → 続く
> >                [SourceEncoding UTF-8  > 内部表現] → 続く
> >                <<<     Parser    構文解析     >>> → 続く
> >                [TargetEncoding 内部表現 > UTF-8 ] → 続く
> >                [ハンドラ内     UTF-8  > EUC-JP  ]
> 
> となると、ひとつ疑問が出ます。
> 読み込ませるXMLファイルのXML宣言はどのようにしているのでしょうか。

 ドキュメントの XML宣言は EUC-JP ですが、パーサ生成時に UTF-8
とソースエンコーディングを直接指定してるから問題無いと思いますよ。
実際問題無く動作してます。
こちらでエンコーディングを直接指定してるのにパーサがドキュメント
のエンコーディングを優先する仕様なら問題あるかもしれませんね。
マニュアルでは構文解析のみで検証までは行わないと書いてるのでそこ
まで厳密にやらずに手を抜いてます(^^;

(: )('')( :)(..)(: )('')( :)(..)(: )('')( :)(..)

  黒木淳一 : kuroki@mycc.co.jp
  P.S.R.C.  http://www.chamise.jp/mera/index.html

(..)( :)('')(: )(..)( :)('')(: )(..)( :)('')(: )