[PHP-users 21226]Re: ネストされたタグを正規表現で抽出する場合

Katsuo Mogi mogi-k2 @ msg.biglobe.ne.jp
2004年 4月 9日 (金) 15:29:23 JST


茂木です。

In the message [PHP-users 21216]	Re: ネストされたタグを正規表現で抽出する場合
               <4075f843.2757%ml @ elf.no-ip.org>
Tadashi Jokagi <ml @ elf.no-ip.org> wrote:

>       上鍵です.こんにちわ.

> Katsuo Mogiさんの<u1xmyx966.wl%mogi-k2 @ msg.biglobe.ne.jp>から
> >tidyって、php5から使えるものではないのでしょうか?
> >できればphp4で動くコードを作りたいと思ってます。

>       php 4 でも動作します(正確にはするようですですが)

> http://pecl.php.net/packages.php?catpid=10&catname=HTML

ありがとうございます。
PEARはよく覗くのですが、peclは頭から抜けていました。
試してみます。

>     後自分で使ったことないですが(tidy もですけど)html_parse ってのもある
>     みたいですね.その他 XHTML が対象なら PHP 標準モジュール・PEAR などの
>     各種 XML パーサーも使用できるのではないでしょうか?

実は、snoopyでWebサーバとやりとりして、
取得したHTMLをPEAR::XML_Unserializerで配列にして
処理していこうと思っていたのですが、
一部分、parseエラーになるのでUnserializerに渡したい
部分だけあらかじめ抜き出そうと思った次第です。

なんか、実現に近づくほど複雑な事態に陥ってる気がします。

# すいません、また化ける文字打ってしまいました。

--
---------------------------------
 茂木克夫
    mogi-k2 @ msg.biglobe.ne.jp
---------------------------------


PHP-users メーリングリストの案内