[PHP-users 34289] MacのUnicodeテキストファイルの処理

Toshio KANEKO kim-t @ r3.dion.ne.jp
2009年 2月 16日 (月) 09:57:12 JST


Linuxサーバでapache+PHP5で開発をいています。

テキストファイルを送信して、そのテキストファイルをスクリプトで処理、
DB登録を行います。

テキストファイルはタブ区切りです。

元ファイルはMacのiTunesでプレイリストの書き出しで作成したファイルで、
Trapad で開きますとUnicode, CRと判断されています。

これを普段は、TerapadでUTF-8N、CR+LFに変換してからサーバに送っている
のです。これでは処理が想定どおりに行われます。

しかし、元のMacが出力したファイルをそのまま送信したいと考え、いろいろと
実験したのですが、うまくいきません。

元々はファイルをオープンして、fgetsしてsplitでタブで分割していたのです
が、今回はファイルを一括で読み込んで、開業コードで、splitし、さらに
各行ごとにタブでsplitするのですが、どちらもうまくいきません。・


Bzでバイナリデータを見たのですが、改行は「0D 00」タブは「09 00」なのが
わかりました。

また、UnicodeというのもUTF16-LEであるのもわかりました。

splitしたいだけなのですが、よろしくお願いします。
-- 
金子 稔男(KANEKO Toshio)
kim-t @ r3.dion.ne.jp
(sub:kim1688 @ mac.com)
http://www.ab.auone-net.jp/~kim1688/


PHP-users メーリングリストの案内