[PHP-users 28965] 特定タグの文字を抽出するには

大塚 哲治 goroneko @ pop17.odn.ne.jp
2006年 4月 11日 (火) 00:22:13 JST


大塚と申します。質問を投げさせていただきます。

htmlで特定タグの文字を抽出したいと思っています。

以下の内容が$mojiに入っています。(htmlをgetした物)
---
・・・前省略・・・
<tr>
<td nowrap>
2006-2-4
</td>
<td>
  芸能人A
</td>
<td><a href="/hoge/020492">題名A</a></td>
<td>50 MB</td>
<td>
<span>
<img border="0" src="http://hoge.com/hoge.gif"></span>
</td>
<td style="color: blue;">&nbsp;</td>
</tr>
・・・上記の内容が同じように繰り返す・・・
---
この文字列から配列に
human["芸能人A"]="題名A"
human["芸能人B"]="題名B"
   ・・・
と自動生成したいと思っています。

ポイントは必ず<tr></tr>の間に入っている事とその間のタグ・文言の並び順は常に
同じです。
ですが、$mojiのヘッダとフッタにはhtml特有の文言が含まれています。

正規表現を使って取り出せばいいと思いますが、どの命令でどのような正規表現で取
り出せるかわかりません。

ご存知の方、ご教授いただけると幸いです。





PHP-users メーリングリストの案内