[PHP-users 3529] Re: xml_parseを使う場合の XML ファイルの文字コード

Ryuzi Kambe php-users@php.gr.jp
Wed, 14 Nov 2001 16:04:31 +0900


>  というわけで、ハンドラ内では UTF-8 から EUC に変換して使用すればいいという
> 事になるのではないかと思います。

ハンドラ内ではEUCに変換するというところは、マニュアルにある、
「PHP におけるドキュメントの内部表現は、常に UTF-8でエンコードされます」
という部分に反しませんか?

黒木さんのやり方は、

XMLのソースファイル(UTF-8)->ハンドラ内(EUC-JP)

ということのようですね。

私の方は、

XMLのソースファイル(EUC-JP)->ハンドラ内(不明)
#php.iniで指定したmbstring.internal_encodingはEUC-JP
XMLのソースファイル(UTF-8)->ハンドラ内(不明)
#php.iniで指定したmbstring.internal_encodingはUTF-8

という感じで逆のようですね。

どっちでもいいんでしょうか。

> ちなみに、domxml の方は将来仕様が変わる可能性があるという事なので全く手を
> つけずに独自フォーマット(甘美な響きだ(笑))で処理してます。 解析した後は
> 多次元連想配列の中に格納してるので情報の取り出しはものすごく直感的かなと
> 思います。でもものすごく長ったらしいソースになります(笑)
> 
> dom っぽいけど嘘の dom という事で Fake dom と勝手に呼んでます。これで情報
> 検索がメモリ上とDB上で可能になればものすごく快適な XML アクセスが出来る様
> になるのですが今のところ苦戦してます。 全部 PHP で処理してるのでものすご
> く処理は重たいのがネックになっています。

自前で作成されるとは本当にパワフルですね。

そういえば、同じようにPHPDOMという独自のライブラリを公開している方が
いらっしゃいますね。

PHPDOM入門
http://www18.tok2.com/home/koumori27/xml/phpdom_menu.html

こちらは、サーバ上でdomxmlが組み込まれていない場合に
同様の機能を提供するため、というこれまたパワフルなものです、

ちなみに、tok2.comは、[PHP-users 1254]で紹介されている
フリーウェブスペース。今度入ってみようかな。

あと、domxmlについては、ここを見る限りでは今後しばらくは
機能拡張はあっても仕様の変更はなさそう、といえるのでしょうか。

PHP Function Table / Implementation & Documentation
domxml extension (php4/ext/domxml)
http://zugeschaut-und-mitgebaut.de/php/extension.domxml.html

--
Ryuzi Kambe
kambe@mc.kcom.ne.jp