[PHP-users 23481]Re: 挟まれた文字列からのリンクの抽出
Mashiki
mashiki @ yanah.com
2004年 10月 13日 (水) 01:29:58 JST
Mashikiです。
>>おそらく、正規表現系の関数でスマートに取り出せると思います。
>>ファイルURLのサンプルも見せていただけますか。
:
><html>
><head>
><title>Sample html</title>
></head>
><body>
><!--前略-->
><!--PAUSE-->
> <a href="http://example.com/sheadline/">ヘッドライン</a>
> <a href="http://example.com/newbb/">フォーラム</a>
> <a href="http://example.com/news/">ニュース</a>
> <a href="http://example.com/contact/">お問い合わせ</a>
> <a href="http://example.com/mydownloads/">ダウンロード</a>
>
><!--/PAUSE-->
><!--後略-->
><body>
></html>
ざっくり書くならこんな感じ。
<?php
$data = file_get_contents("URL");
$matchA = $matchB = array();
preg_match('/pause(.+)\/pause/is', $data, $matchA);
preg_match_all('/href="([^"]+)"[^"]/i', $matchA[1], $matchB);
echo "<pre>\n";
var_dump($matchB[1]);
?>
これでもサンプルから、urlを切り出せます。
用途に合わせて調整してみてください。
PHP-users メーリングリストの案内