[PHP-users 19740]Re: リンク切れHTMLファルのチェック

Teruyuki Wakamatsu terupost @ mxa.mesh.ne.jp
2004年 1月 7日 (水) 13:50:21 JST


早川 様

> 差し支えのない範囲で教えていただけると嬉しいのですが、
> PHPの学習として作られているのでしょうか?
学習ではないです。数万件のURLリストの中の無効URLを
リストアップしたいのです。デットリンクという言葉が間違って
いたのかもしれないです。すみません。

> サイト内を全部チェックするのは、
> (PearにHTMLパーサーがあるかどうか把握していませんが)
> HTMLパーサーを利用してページ中のリンクをリスト化、
> あとはサイト内を幅優先で順に繰り返してチェック、
> という感じでいいかと思います。
なるほど。これもぜひとも探して試してみます。
今、Pearのサイトへ行って探してみます。

>
> ただ、デッドリンクをチェックさせるプログラムを書くのは、
> 小規模な自サイトのチェックくらいでしたらあまり問題にならないでしょうが、
> 汎用的なことを考慮すると例外的な処理や意味的なものの考慮などが必要になって
> 結構やっかいな作業になるかと思います。
そうですね。もろもろ理想を目指すと(私には)大変な作業に
なるのだと、調べながら理解しました。
とりあえず、今の段階では全てのURLをチェックする手間が
なくなるだけでも、かなり有益と考えてます。

> コマンドライン版を(組み合わせて)使ってみられてはいかがでしょう。
ありがとうございました。
とりあえずのものができた後で是非、試してみます。



PHP-users メーリングリストの案内