[PHP-users 33024] ファイルの内容が同一のファイルを検索するには

ごろ猫 goroneko0622 @ king.odn.ne.jp
2007年 12月 13日 (木) 11:17:03 JST


ごろ猫と申します。

PHP5を使っています。
ファイルの内容が同一(ファイル名が異なる)のファイルを検索するプログラムをPHPで作ろうと思っています。hash_fileという関数がありますので、その関数でハッシュ値を抽出して重複チェックを行う事を考えています。

しかし、hash_fileで1G(ギガ)位のファイルハッシュ値を求めると2分くらいかかるようで大量にあるファイルを処理できません(md5,sha256の両方で試しました)。ハッシュ値なので100%の同一性は求めません(無理なので)が、もっと高速に実行する方法は無いのでしょうか?

フリーの重複チェックプログラムについては、もっと高速に行っているようです。
何かご存知の方はご回答いただけると幸いです。


PHP-users メーリングリストの案内