[PHP-users 21226]Re: ネストされたタグを正規表現で抽出する場合
Katsuo Mogi
mogi-k2 @ msg.biglobe.ne.jp
2004年 4月 9日 (金) 15:29:23 JST
茂木です。
In the message [PHP-users 21216] Re: ネストされたタグを正規表現で抽出する場合
<4075f843.2757%ml @ elf.no-ip.org>
Tadashi Jokagi <ml @ elf.no-ip.org> wrote:
> 上鍵です.こんにちわ.
> Katsuo Mogiさんの<u1xmyx966.wl%mogi-k2 @ msg.biglobe.ne.jp>から
> >tidyって、php5から使えるものではないのでしょうか?
> >できればphp4で動くコードを作りたいと思ってます。
> php 4 でも動作します(正確にはするようですですが)
> http://pecl.php.net/packages.php?catpid=10&catname=HTML
ありがとうございます。
PEARはよく覗くのですが、peclは頭から抜けていました。
試してみます。
> 後自分で使ったことないですが(tidy もですけど)html_parse ってのもある
> みたいですね.その他 XHTML が対象なら PHP 標準モジュール・PEAR などの
> 各種 XML パーサーも使用できるのではないでしょうか?
実は、snoopyでWebサーバとやりとりして、
取得したHTMLをPEAR::XML_Unserializerで配列にして
処理していこうと思っていたのですが、
一部分、parseエラーになるのでUnserializerに渡したい
部分だけあらかじめ抜き出そうと思った次第です。
なんか、実現に近づくほど複雑な事態に陥ってる気がします。
# すいません、また化ける文字打ってしまいました。
--
---------------------------------
茂木克夫
mogi-k2 @ msg.biglobe.ne.jp
---------------------------------
PHP-users メーリングリストの案内