[PHP-users 25325] Re: mb_convert_encoding/mb_detect_encoding について

神 谷 djr_kamiya @ hotmail.com
2005年 4月 8日 (金) 13:11:45 JST


神谷@SSWです

>マニュアルではそのように書かれていますが、最近の PHP(4.3.4 以降) では設定
>によってはそのようにはならないようです。
>
>http://jp2.php.net/manual/ja/function.mb-detect-order.php
勉強不足でスイマセン。
危なく世界に恥を晒すとこでした。

>榎本さん
バグではなく何らかの修正で挙動が変わったということのようですね。

文字コード種別の自動判定は非常に難しく、誤認識する場合があって当たり前だと
私は思っています。
実際、今回の榎本さんのパターンにおいては先頭部分の文字が

SJIS'商社' <=> EUC-JP'盾堅'
SJIS'小売業' <=> EUC-JP'醇嫡挙'

のようにコードマップが被っているところなので「何文字分をサンプルとして文字
コード識別を行うか」
によって結果が変わってくると思います。

> 4.3.11 の ChangeLog には含まれてない処理である.
と書かれていますが、同じmb_string内の他の関数については変更が入っているの
で、
共通で使用しているコード分に変更があった場合には他の関数でも影響が出るで
しょうし、ChangeLog自体にはソースの修正内容まで書かれていないので、可能性
という点では他の関数のバグフィックスに起因するものかもしれません。

ソース見てみましたが私にはちょっと難しすぎました。^^;

中途半端なレスですいません。

_________________________________________________________________
MSN Hotmail で開運メルアド占い実施中 
http://promotion.msn.co.jp/hotmail/fortune/input_un.asp 



PHP-users メーリングリストの案内