[PHP-users 27721] 定型フォーマットのログ変換

dearsallychan@yahoo.com.au dearsallychan @ yahoo.com.au
2005年 12月 1日 (木) 19:59:29 JST


こんにちは、sally と申します。
宜しくお願いします。

環境は
・PHP v4.4.1
・Apache v1.3
です。

昔利用していたCGI掲示板(KENT WEB の YY-BOARD)の過去ログが、HTMLのファイルでたくさんあります。
このログファイルから純粋な投稿データのみを取り出して、新たにログを保存したいです。
つまり、ログの移行をしたいのですが、preg_replace を使うとものすごく複雑になってしまいます。

////////////// ログフォーマット(ループの部分) /////////////

 <tr>
  <td align="center"><img src="icon/1.gif" border="0" width="10" 
height="10"></td>
  <td>No.1 タイトルはここ<br>
<table cellspacing="0" cellpadding="0" border="0" bgcolor="white">
 <tr valign="top">
  <td><a href="mailto:my @ homepage.com">my @ homepage.com</a></td>
  <td><a href="http://homepage.com" 
target="_top">http://homepage.com</a></td>
 </tr>
 <tr valign="top">
  <td colspan="2">投稿内容。たまに<a href="http://yahoo.co.jp" 
target="_top">リンク</a>もあります。</td>
 </tr>
</table>
  </td>
 </tr>

//////////////////////////////////////////////////////

このログフォーマットから、番号(No)、アイコン、タイトル、メールアドレス、ホームページ、コメントの内容を抜き出し、別ファイルにタグ区切りで保存したいです。
上記の場合だと、

+-------------------------------------------
|
|1    1.gif    タイトルはここ    my @ homepage.com    http://homepage.com 
投稿内容。たまに<a href="http://yahoo.co.jp" target="_top">リンク</a>もあります。
|
+-------------------------------------------

になります。

是非皆さんお知恵を貸してください。
宜しくお願いします。 




PHP-users メーリングリストの案内