[PHP-doc 369] Re: [PHP-dev 1095] Re: mbstringのエンコーディング名
Tadashi Jokagi
ml @ elf.no-ip.org
2005年 1月 17日 (月) 12:46:49 JST
ぢょ〜@よくきたなです.
#php-doc にもふります
ayanosukeさんの「[PHP-dev 1095] Re: mbstringのエンコーディング名」から
>こんにちは。綾乃介です。
>
>Subject: [PHP-dev 1093] Re: mbstringのエンコーディング名
>Date: 2005/01/15 13:26:36
>Tadashi Jokagi <ml @ elf.no-ip.org> wrote:
>> 上鍵です.こんにちは.
>>
>> ayaさんの<20050115013946.1EBB.AYA @ big.or.jp>から
>> >こっちでは、Shift_JISに対応してると書いてあります。
>> >Shift_JIS=SJISの用に書いてありますが。
>> >
>> >どうもCSVのドキュメントを見てみるとShift_JISをサポートしてる?
>>
>> CVS すよね.日本語マニュアルは残念ながら追いついていないことが
>> 多いので,英語マニュアルも参照したいところですが,とりあえず実験
>> しました.iconv コマンドと mbstring モジュール・iconv モジュール
>> です.結果的にはすべて意図どおりの処理をしています.
>
>あいたた。CVSです・・。
>英語マニュアルだとdefault_charsetだけShift_JIS になってますね。
>他はSJISという記述。
>
>実験結果を考えるとShift_JISでも有効と言うことかと思いますが。
>マニュアルをSJISからShift_JISにしませんか?(まだ確認は必要だと思います)
>その方がよりユーザフレンドリーな言語になると思います。
前から気になっていたのですが,mbstring の一次的マニュアルは
en か ja かどっちなのでしょうか? 多分 en だと思うのですが.
で,ja が SJIS なのはひとつの言い方に「マニュアルの ja が en に
追いついていない」というのがあるのではないかと思います.
http://elf.no-ip.org/~elf/php/phpdoc/status-ja.html
の「reference/mbstring/functions (44)」の辺りを見ると結構追いつい
ていません.って全体的にですけど(苦笑
#ja も有志の方が精力的に更新されていますが,en の更新速度に全然追いつ
けない…
>あと、SHIS-WINはWindows-31Jキャラクタコードセットという記述をMLのアーカ
>イブで見つけました。だとしたら通常使うのはSJISで良さそうです。
>あとは、Shift_JISがSJISなのかSJIS-WINなのかが気になるところです。
一応試してみました.maru-one.txt に SHIFT_JIS な「(1)」を入れま
した.
[elf @ server cacti]$ php -r 'echo mb_convert_encoding( file_get_contents( "maru-one.txt"), "EUC-JP", "SHIFT_JIS");' | iconv -f eucjp-win -t utf-8
(1)
(1)はそれぞれ 3 バイト ASCII じゃなくいわゆる機種依存文字で,UTF-8
なターミナルで正常にが出てきました.
以前 iconv で変換するときに「EUCJP-WIN」とかを知らなかったために
機種依存文字の変換ができず,mbstring に逃げたことがあります;-(
--
----.----1----.----2----.----3----.----4----.----5----.----6----.----7
Tadashi Jokagi/Shibuya city mailto:elf @ elf.no-ip.org
YokukitanaII http://elf.no-ip.org/
Yokukitawiki http://elf.no-ip.org/wiki/
Yokukitablog http://elf.no-ip.org/blog/
PHP-doc メーリングリストの案内