[PHP-users 32797] script_encodingとinternal_encodingの違い (was Re: Re: 半角カタカナのファイルを require するとエラー)

goungoun gounx2 @ gmail.com
2007年 11月 4日 (日) 03:20:34 JST


こんにちは。

On Sat, 03 Nov 2007 08:34:45 +0900
shin-1 @ ca2.so-net.ne.jp wrote:
:
> いい機会なんで、script_encodingとinternal_encodingの違いに
> ついて、聞いてもいいですか。

自分の復習も兼ねてまとめてみました。


---
mbstring.internal_encoding

PHP: mb_internal_encoding - Manual:
http://jp.php.net/manual/ja/function.mb-internal-encoding.php
> encoding は、HTTP 入力文字エンコーディング 変換、HTTP 出力文字
> エンコーディング変換および mbstring モジュールに より定義された
> 文字列関数においてデフォルトの文字エンコーディングとして 使用されます。

たとえば、mb_convert_encoding()の第三引数のデフォルトとして
使われるものです。

# スクリプトのエンコーディングを指定するものではありません。
# つまり、mbstring.internal_encoding=SJIS としても
# SJISで記述したスクリプトを正しく扱えるようにはなりません。
# ("ソ"とか使うとエラーになります)


---
mbstring.script_encoding

# 公式ドキュメント上はみつけられませんでしたが、

スクリプトのエンコーディングを指定します。
(PHPはこのエンコーディングでスクリプトを読み込み実行します)

ただし、条件があって --enable-zend-multibyte
付きでコンパイルされたPHPでのみ使用できます。

# --enable-zend-multibyte でコンパイルされたPHPの上で、
# mbstring.internal_encoding=SJIS とすることで、
# SJISで記述したスクリプトを扱えるようになります。


---
両者の設定が異なるときですが、例えば
mbstring.script_encoding=SJIS
mbstring.internal_encoding=EUC-JP
としたとき、
・スクリプトはSJISで記述する。
・mb_convert_encoding($str, "SJIS") は
  mb_convert_encoding($str, "SJIS", "EUC-JP")
  と等価になります。


---
あと、スクリプト中に
declare(encoding="SJIS");
と書くことで「これ以降をSJISで記述」と指定できるようです。
(mbstring.script_encoding を動的に指定できるイメージっぽいです)

# 公式ドキュメントでまったく触れられていないようなので、
# この方法は勧められない方法なのかも。。。


-- 
goungoun <gounx2 @ gmail.com>
http://goungoun.dip.jp/app/



PHP-users メーリングリストの案内