[PHP-users 7405] Re: $_POSTの文字化け

Naomasa Numajiri php-users@php.gr.jp
Mon, 13 May 2002 17:57:09 +0900


こんにちは、
本題とは関係ないですが、

| DAIです。
| 解決したので報告します。
| 
| 「文字化け」というキーワードで過去ログを検索してたのですが、
| なぜかひとつも引っかからなかったので、
| 「文字 化け」とするといくつか出てきて閲覧すると、

ちょっと茶筅(*1)に「文字化け」という文字列を処理させてみました。
unix> $ chasen sample1.txt
unix> 文字    モジ    文字    名詞-一般
unix> 化け    バケ    化け    名詞-一般
unix> EOS
unix> $ cat sample1.txt
unix> 文字化け
unix> $
茶筅で「文字化け」という文字列を処理させると「『文字』という
名詞と『化け』という名詞」の2つの単語の組み合わせとして
認識します。(ユーザー辞書をいじれば変わりますが)

*1 http://chasen.aist-nara.ac.jp/index.html.ja

といことで、
* キーワード抽出に茶筅を使用していて
* 「文字化け」のために辞書をカスタマイズしていない
というような全文検索システムでは、「文字化け」という文字列では
ヒットしないはずです。

| php.inの設定が怪しいと思い、
| php.iniを探してみるとなかったのでphp.ini-distをコピーして
| magic_quotes_gpc = Offにすると解決しました。
| 
| ありがとうございました。

このように
* どこでつまづいていたのか?
* どのように打開したのか?
* その後の進展
を書いていただけると助かります。(さんくすです)