[PHP-users 16081]Re: 機種依存文字や外字について

neweb junneko @ ma.neweb.ne.jp
2003年 6月 20日 (金) 15:12:50 JST


YOSHIです。

> また、外字領域をSJIS→EUC-JPに変換する場合、EUC-JP側の割り当てコード領域は
> 定められているのでしょうか? もしご存じの方がいたら教えてください。

最近、EUC-JPの状態で外字をはじこうと悩んでいたので非常にタイムリーなので
すが・・・、↓が参考になるかもしれません。

http://www.opengroup.or.jp/jvc/cde/sjis-euc.html

計算式を出すのがしんどかったので途中で放り投げてしまったのですが。。。


On Fri, 20 Jun 2003 10:17:31 +0900
"Hirotane Numano" <numano @ jpta.scs.co.jp> wrote:

> 沼野です。
> 
> > SJISコード「fa5c」で試した場合、「ed40」とコードが変化するのは
> > 何故でしょう?
> 
> mb_convert_encodingの実装形態が分からないのですが、
> JIS X 0208で規定されているSJISの範囲は
> 1バイト目:0x81-0x9F, 0xE0-0xEF
> 2バイト目:0x40-0x7E, 0x80-0xFC
> となっているので、mb_convert_encodingは忠実にこの範囲内にある
> 文字コードだけを変換しているのではないでしょうか。
> この辺の問題は、海外製のミドルウェアで困った経験があります。
> 
> また、外字領域をSJIS→EUC-JPに変換する場合、EUC-JP側の割り当てコード領域は
> 定められているのでしょうか? もしご存じの方がいたら教えてください。
> 
> いずれにしても、外字領域を変換する場合はmb_convert_encodingの代わりに
> 自力で変換関数を用意するのが無難かと思います。
> 
> ======================================
> 営業からお茶くみまで何でもやるサラリーマン
> 沼野 博胤
>               ※最近転職しました
> ======================================
> 
> 
> _______________________________________________
> PHP-users mailing list
> PHP-users @ php.gr.jp
> http://ns1.php.gr.jp/mailman/listinfo/php-users




PHP-users メーリングリストの案内