[PHP-users 23481]Re: 挟まれた文字列からのリンクの抽出

Mashiki mashiki @ yanah.com
2004年 10月 13日 (水) 01:29:58 JST


 Mashikiです。

>>おそらく、正規表現系の関数でスマートに取り出せると思います。
>>ファイルURLのサンプルも見せていただけますか。

 :

><html>
><head>
><title>Sample html</title>
></head>
><body>
><!--前略-->
><!--PAUSE-->
>    <a href="http://example.com/sheadline/">ヘッドライン</a>
>    <a href="http://example.com/newbb/">フォーラム</a>
>    <a href="http://example.com/news/">ニュース</a>
>    <a href="http://example.com/contact/">お問い合わせ</a>
>    <a href="http://example.com/mydownloads/">ダウンロード</a>
>
><!--/PAUSE-->
><!--後略-->
><body>
></html>

ざっくり書くならこんな感じ。

<?php
  $data = file_get_contents("URL");
  $matchA = $matchB = array();
  preg_match('/pause(.+)\/pause/is', $data, $matchA);
  preg_match_all('/href="([^"]+)"[^"]/i', $matchA[1], $matchB);

  echo "<pre>\n";
  var_dump($matchB[1]);
?>

これでもサンプルから、urlを切り出せます。
用途に合わせて調整してみてください。


PHP-users メーリングリストの案内