[PHP-users 16056]Re: 機種依存文字や外字について

Hirotane Numano numano @ jpta.scs.co.jp
2003年 6月 20日 (金) 10:17:31 JST


沼野です。

> SJISコード「fa5c」で試した場合、「ed40」とコードが変化するのは
> 何故でしょう?

mb_convert_encodingの実装形態が分からないのですが、
JIS X 0208で規定されているSJISの範囲は
1バイト目:0x81-0x9F, 0xE0-0xEF
2バイト目:0x40-0x7E, 0x80-0xFC
となっているので、mb_convert_encodingは忠実にこの範囲内にある
文字コードだけを変換しているのではないでしょうか。
この辺の問題は、海外製のミドルウェアで困った経験があります。

また、外字領域をSJIS→EUC-JPに変換する場合、EUC-JP側の割り当てコード領域は
定められているのでしょうか? もしご存じの方がいたら教えてください。

いずれにしても、外字領域を変換する場合はmb_convert_encodingの代わりに
自力で変換関数を用意するのが無難かと思います。

======================================
営業からお茶くみまで何でもやるサラリーマン
沼野 博胤
              ※最近転職しました
======================================




PHP-users メーリングリストの案内