[PHP-users 21415]Re: 五十音順による分類

愛猫 lovecat @ yk.rim.or.jp
2004年 4月 20日 (火) 18:07:40 JST


愛猫です♪

yahoo.co.jpさんは書きました♪
>どうもPHPのみでは五十音順による分類は難しいようです。
>PHPは国際化しつつといっても多言語に対応できる機能についてはまだ大きな問
>題が残ります。今後のPHP版にもっと正確にマルチバイト対応できるといいですね。

ちょっと待って。。。
# PHPじゃなければできる(?)みたいな感じにまとまっちゃったみたいなので、、、
# っていうか、国際化とかマルチバイト対応とかっていうのは、、、?

通常(マルチバイト)文字コード体系っていうのは、ただ単に文字の形にコードを
割り当ててスクリーンの表示に使うってことだけで、文字の読み方とは何の関係も
ありませんから、文字の形(っていうか文字コード)と読み方の関連づけは、別途
何か作るとかしないと、どんな開発ツールや言語や処理系を使ってもそれだけで
解決することはできないと思います。

「そういう日本語処理」が難しいのは、文字コード一つにいくつの読みが関連づけ
されるかが決まっていないのと、その複数の読みのうちのどの選択肢をどんな条件
で選択すればいいのかという法則が全く存在しないからです。

マルチバイト対応とかUnicodeとか国際化とかっていうのは、単に
「表示できる文字の形や種類を増やすこと」
であって、字形と読みの関連づけとかAIみたいなカナ漢字変換ができるようになる
ことではないんじゃないかと思います。。。


PHP-users メーリングリストの案内