[PHP-users 15356]WordとPDFの内容について

唐澤 慎 karasawa @ cit-net.co.jp
2003年 5月 19日 (月) 06:02:27 JST


お世話になります。

 からさわです。

 PHPでWord(.doc)/PDFファイルの中身を検査したいのですが、術が全く分か
りません。

 Googleなどの検索サイトではWordファイル・PDFファイルなどの中に書き込ま
れた文章からも検索できるので、PHPでも可能かな?と予想しています。

 たとえば、Googleで「PHP filetype:pdf」というキーで検索すれば文字列「PHP」
の入ったPDFファイルを検索できますし、同様に「PHP filetype:doc」とすれば
Wordファイルが検索できます。


 Wordファイル「abc.doc」に「あいうえお」と記してあるとき、

 $ret = 関数("abc.doc");

 のような関数で$retに「あいうえお」と入る関数を探しています。


 方法か参考になるページ・本などありましたらご紹介をお願いいたします。


******************************
     唐澤 慎
     Shin Karasawa
  karasawa @ cit-net.co.jp
******************************



PHP-users メーリングリストの案内