[PHP-users 19749]Re: リンク切れHTMLファルのチェック

HAYAKAWA Hiroshi hayakawa @ sam.hi-ho.ne.jp
2004年 1月 7日 (水) 18:45:17 JST


早川@名古屋 です。

on 04.1.7 1:50 PM, Teruyuki Wakamatsu at terupost @ mxa.mesh.ne.jp wrote:

>> 差し支えのない範囲で教えていただけると嬉しいのですが、
>> PHPの学習として作られているのでしょうか?
> 学習ではないです。数万件のURLリストの中の無効URLを
> リストアップしたいのです。デットリンクという言葉が間違って
> いたのかもしれないです。すみません。

そうでしたか。それは失礼しました。
わざわざPHPで実装されるのは面倒じゃないかなと思ったからですが、
実務的にチェック結果のみを必要とされるのでしたら
出来合いのツールを利用された方が楽ですよ。
Windows用のFreeのツールとかもありそうですが(推測)。
もちろん、学習も兼ねてとかでしたらその限りではありません。

でも数万件とは多いですね。
何でどのようにつくられているかにもよっても大きく違うでしょうが、
何時間かかかりそうな気がします。
(数万サイトではなく、リンク数が数万として)

>> ただ、デッドリンクをチェックさせるプログラムを書くのは、
>> 小規模な自サイトのチェックくらいでしたらあまり問題にならないでしょうが、
>> 汎用的なことを考慮すると例外的な処理や意味的なものの考慮などが必要になって
>> 結構やっかいな作業になるかと思います。
> そうですね。もろもろ理想を目指すと(私には)大変な作業に
> なるのだと、調べながら理解しました。
> とりあえず、今の段階では全てのURLをチェックする手間が
> なくなるだけでも、かなり有益と考えてます。

そうですね、全部手作業よりは断然楽ですね。
ただステータスコード200以外は、
チェックさせた後に人間の<判断>が必要ですので、
それが結構手間といえば手間です。

自作される場合でも、出来合いのツールを使われる場合でも、
ウェブサーバーやブラウザの仕様やバグにどこまで対応しているか、
一例として
Netscape-Enterprise HEAD 404
で検索してみていただくといいのですが、
こういうのに対応していないツールもありますので注意が必要です。


-----
With your dreaming, with your smile.
Hayakawa, Hiroshi <hayakawa @ sam.hi-ho.ne.jp>
Nagoya,Aichi,JAPAN ☆彡



PHP-users メーリングリストの案内