[PHP-users 18107]Re: 住所文字列の分割

FURUTA Takeshi furuta @ ed-contrive.co.jp
2003年 9月 26日 (金) 19:45:43 JST


ふるたです。

On Fri, 26 Sep 2003 19:12:09 +0900
FURUTA Takeshi <furuta @ ed-contrive.co.jp> wrote:

> ふるたです。
> 
> On Fri, 26 Sep 2003 11:53:37 +0900
> Osamu Shigematsu <m5issige @ mr.hitachi-medical.co.jp> wrote:
> 
> > 重松です。こんにちは。
> > 
> > > 元が正しく書かれている住所だとしすれば JIS X0402:1994 の市区町村コード
> > > 表を元にマッチさせればいいのではないでしょうか。数千件なので、配列で検
> > > 索してもなんとかなるかな。
> > > 
> > > データは探してみればどこかしらにあると思います。
> > > 例) http://www.pref.gifu.jp/s11655/tebiki1/sanko.htm#s-3
> > > 
> > > 合併などで更新がよくありますが、これをどうチェックするか工夫する必要は
> > > あるでしょう。
> > 
> > JIS X0402:1994 の市区町村コード表は知りませんでした。
> > 賢さが 3pt 位アップした感じ。 :)
> > 
> > 最近は、合併が多いので、注意が必要ですが、それ以前の問題として、合併前の
> > 住所のままだと、検索できないので、やはり手動になる部分は出てきそうですね。
> 
> 合併情報なら下記のサイト
> http://www.webstore.jsa.or.jp/webstore/JIS/html/jp/CommuneCode.htm
> に乗っています。
> 
> 既存のJISデータに関しては、郵政公社の郵便番号データから作成してたら良い
> と思います。
> 
> > 
> > > 東京都東村山市などで困りそう:-)
> > 
> > まあ、他にも、四日市市もアウトですね。 ;-P
> > # あくまでも単なる手法の紹介ということで。
> > 
> 
> 文字の区切りで区別はなかなか難しいですね。
> 
> ちなみに、今の段階で同名の市は、
> 
> 東京都府中市と広島県府中市だけだと思います。
> 
> #そういえば、茨城県の鹿島が市になるとき、漢字が被るから鹿嶋市になったよ
> #うな。

あと、郵政公社のデータを使うときに気をつけた方が良いのが異体字の存在です。

例)
宮城県塩釜市が郵政公社のデータでは塩竃市になっています。
(一般的にユーザ情報では塩釜市で入力されると思いますので。)
他にも有ると思います。桧山と檜山とか

では。

ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ
 ED-CONTRIVE INC.
  M:I 古田 武士        
 mail:furuta @ ed-contrive.co.jp
   東京都千代田区岩本町2-13-6
    TEL:03-5821-3300 Fax:03-5821-3700
  http://www.zaiko-check.com/
ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ



PHP-users メーリングリストの案内