[PHP-users 34289] MacのUnicodeテキストファイルの処理
Toshio KANEKO
kim-t @ r3.dion.ne.jp
2009年 2月 16日 (月) 09:57:12 JST
Linuxサーバでapache+PHP5で開発をいています。
テキストファイルを送信して、そのテキストファイルをスクリプトで処理、
DB登録を行います。
テキストファイルはタブ区切りです。
元ファイルはMacのiTunesでプレイリストの書き出しで作成したファイルで、
Trapad で開きますとUnicode, CRと判断されています。
これを普段は、TerapadでUTF-8N、CR+LFに変換してからサーバに送っている
のです。これでは処理が想定どおりに行われます。
しかし、元のMacが出力したファイルをそのまま送信したいと考え、いろいろと
実験したのですが、うまくいきません。
元々はファイルをオープンして、fgetsしてsplitでタブで分割していたのです
が、今回はファイルを一括で読み込んで、開業コードで、splitし、さらに
各行ごとにタブでsplitするのですが、どちらもうまくいきません。・
Bzでバイナリデータを見たのですが、改行は「0D 00」タブは「09 00」なのが
わかりました。
また、UnicodeというのもUTF16-LEであるのもわかりました。
splitしたいだけなのですが、よろしくお願いします。
--
金子 稔男(KANEKO Toshio)
kim-t @ r3.dion.ne.jp
(sub:kim1688 @ mac.com)
http://www.ab.auone-net.jp/~kim1688/
PHP-users メーリングリストの案内