[PHP-users 19716]リンク切れHTMLファルのチェック

Teruyuki Wakamatsu terupost @ mxa.mesh.ne.jp
2004年 1月 6日 (火) 13:25:05 JST


こん○は

初めましてwakaです。
デッドリンクチェックをして一覧化する作業をしています。
<?php
//--------------------------------------------
$URL="www.aaaaaaaaa.com";

$purl=parse_url($URL);

if(!$purl["port"]) $purl["port"]=80;

//開く
$fp=fsockopen($URL,$purl["port"]);

if (!$fp) {
 //失敗データとして保存
 echo "失敗データとして保存";
} else {
 //成功データとして保存
 echo "成功データとして保存";
}
//--------------------------------------------
?>
ここまでは良いのですが、$URL="www.aaaaaaaaa.com";の部分で
www.aaaaaaaaa.com/bbbb.html
のようにhtmlファイルレベルまでチェックしようとすると、if文の失敗
になってしまいます。
マニュアルではInternetドメイン、Unixドメインにてストリーム接続を
初期化と書いてありますが、もともとこういうものなのでしょうか?
また、ドメイン下位のファイルレベルまでチェックするするには
どんな方法がおありでしょうか?
自分でも調べてはいるのですが、この辺の関数に不慣れで
時間がかかり過ぎているのでヒントをご教授いただけると嬉しいです。
とりあえずhttps://のファイルはほとんどないのでhttp://前提
で考えてます。

環境

Redhat Linux 7.0
PHP Version 4.1.2




PHP-users メーリングリストの案内