[PHP-doc 369] Re: [PHP-dev 1095] Re: mbstringのエンコーディング名

Tadashi Jokagi ml @ elf.no-ip.org
2005年 1月 17日 (月) 12:46:49 JST


      ぢょ〜@よくきたなです.

#php-doc にもふります

ayanosukeさんの「[PHP-dev 1095] Re: mbstringのエンコーディング名」から
>こんにちは。綾乃介です。
>
>Subject: [PHP-dev 1093] Re: mbstringのエンコーディング名
>Date: 2005/01/15 13:26:36
>Tadashi Jokagi <ml @ elf.no-ip.org> wrote:
>>       上鍵です.こんにちは.
>> 
>> ayaさんの<20050115013946.1EBB.AYA @ big.or.jp>から
>> >こっちでは、Shift_JISに対応してると書いてあります。
>> >Shift_JIS=SJISの用に書いてありますが。
>> >
>> >どうもCSVのドキュメントを見てみるとShift_JISをサポートしてる?
>> 
>>       CVS すよね.日本語マニュアルは残念ながら追いついていないことが
>>     多いので,英語マニュアルも参照したいところですが,とりあえず実験
>>     しました.iconv コマンドと mbstring モジュール・iconv モジュール
>>     です.結果的にはすべて意図どおりの処理をしています.
>
>あいたた。CVSです・・。
>英語マニュアルだとdefault_charsetだけShift_JIS になってますね。
>他はSJISという記述。
>
>実験結果を考えるとShift_JISでも有効と言うことかと思いますが。
>マニュアルをSJISからShift_JISにしませんか?(まだ確認は必要だと思います)
>その方がよりユーザフレンドリーな言語になると思います。

      前から気になっていたのですが,mbstring の一次的マニュアルは
    en か ja かどっちなのでしょうか? 多分 en だと思うのですが.

      で,ja が SJIS なのはひとつの言い方に「マニュアルの ja が en に
    追いついていない」というのがあるのではないかと思います.

http://elf.no-ip.org/~elf/php/phpdoc/status-ja.html
    の「reference/mbstring/functions (44)」の辺りを見ると結構追いつい
    ていません.って全体的にですけど(苦笑

#ja も有志の方が精力的に更新されていますが,en の更新速度に全然追いつ
 けない…

>あと、SHIS-WINはWindows-31Jキャラクタコードセットという記述をMLのアーカ
>イブで見つけました。だとしたら通常使うのはSJISで良さそうです。
>あとは、Shift_JISがSJISなのかSJIS-WINなのかが気になるところです。

      一応試してみました.maru-one.txt に SHIFT_JIS な「(1)」を入れま
    した.

[elf @ server cacti]$ php -r 'echo mb_convert_encoding( file_get_contents( "maru-one.txt"), "EUC-JP", "SHIFT_JIS");' | iconv -f eucjp-win -t utf-8
(1)

    (1)はそれぞれ 3 バイト ASCII じゃなくいわゆる機種依存文字で,UTF-8
    なターミナルで正常にが出てきました.

      以前 iconv で変換するときに「EUCJP-WIN」とかを知らなかったために
    機種依存文字の変換ができず,mbstring に逃げたことがあります;-(

-- 
----.----1----.----2----.----3----.----4----.----5----.----6----.----7
Tadashi Jokagi/Shibuya city mailto:elf @ elf.no-ip.org
YokukitanaII http://elf.no-ip.org/
Yokukitawiki http://elf.no-ip.org/wiki/
Yokukitablog http://elf.no-ip.org/blog/


PHP-doc メーリングリストの案内