ここ数日の住所に関する騒動の発端はこちらのツイートですよね。
河野太郎がマイナンバーカードの住所照合についてデジタル音痴ぶりを如何なく発揮した件
— 杉原航太 (@kota_sugihara) June 4, 2023
河野大臣『問題は住所が「港区赤坂一丁目2の3」と書く人もいれば、「港区赤坂1-2-3」と書く人もいる…(中略)将来的にはAIの技術を使って表記揺れを判断することがあり得るかもしれない。』… pic.twitter.com/aF2jzwtBkN
ネットで適当に暴論を投げると識者が寄ってたかって正しい情報を持ち寄ってくるという、古式ゆかしいネット仕草が今回もみられたというところでしょうか。元ツイートした人がそこまで狙ってたのか、素でやってたのかはわかりませんけどね。
識者の方が速攻でとにかく日本の住所のヤバさをもっと知るべきだと思いますという記事を書いてくださったし、2023年6月9日には識者が集まってうわっ…日本の住所表記、ヤバすぎ?解決策をダラダラ語る会なんてイベントも開催されました。私自身、不動産テックで3年ほど働いて住所には散々苦しめられた経験がありますので、半分げらげら笑いながら、半分はこれやっぱりしゃれならんよねと思いながら観ていました。参加者が400人以上もいたそうで、日本の住所ヤバいという認識を持った人がそんなにたくさんいるんだなと思えたのも嬉しかったです。ともあれ、今回の騒動で日本の住所がヤバいという認識が少しは世間に広がったと思うので、それはとてもよかったなぁと思います。結果を良しとして、冒頭の暴言を許すわけではないのですが。
というところで、私なりの日本の住所の問題点をここで少し整理しておきたいと思います。まず住所の正規化問題と言っても二つの問題があって、一連の騒動の中でもあまり分けて語られてなかったなと思うのでここで明確にしておきます。もちろん識者の皆さんはそんなことは知ってて当然という前提で話しているとは思うんですけどね。
一つは手入力されたフリーダムな文字列から適切な住所に割り当てる正規化。そもそもの河野大臣の挙げてる問題もこちらですね。1丁目2番地3を1-2-3と入力されるとかそういうのですね。この例だけだとそんなの簡単やろと思えるんですが、実際にはそんな簡単な問題ではないのですよ。なお手書きの文字列が読めなくて問題を挙げてる人もいましたが、それはOCRの領域だと思いますのでここでは除外して考えたいと思います。
もう一つの問題は、そもそも日本の住所が正規化された構造になっていないこと。最上位階層の都道府県からして4種類もありますし、次の階層である市区町村も4種類。しかも政令指定都市ならその下に行政区が入ってくる。それでもここまではJISにもなってるくらいなのでまだマシ。その下の町・字や丁目・小字レベルになるともうほんとにカオスで大変なことになっています。デジタル庁の方々などがが一生懸命整理してアドレス・ベース・レジストリを取りまとめてくださっていたりするのですが、それでもまだ全部の問題が解決してはいないのですよ。でも早急に解決しなきゃいけない問題ではあるんですけどね。
こうして問題点が明らかになってくると、いろんな人が解決策を提示しています。それぞれ一理はあるのですが、そもそも根本的なところとして住所とは何かという理解がないといけないんですね。住所と同じかそれ以上に沼である文字もそもそも文字というモノに対する理解が不可欠です。深まっていくと、1文字と区別する基準はどこにあるんだろうかとか、この文字と文字は同じであるか違う文字であるのか異体字なのかと、非常に複雑な問題が絡んできてるのですね。だからUnicodeで解決しようとしたけれど、今はかえってカオスになってしまってたりするわけでして。
話を住所に戻して、そもそも住所とは何か。というか何に対して住所を割り振るかって時点で、少なくとも三つの立場があるんですね。一つは土地、もう一つは建物、最後は部屋。地番は土地に対して振っていますし、住居表示は建物に、郵便番号は土地・建物・部屋のどれにも対応しうるし、なんなら複数の土地に対して一つの郵便番号にまとめてしまってたりする。解決策を示している人の中には郵便番号を使えという人もいましたが、郵便番号が住所コードとして使い物になるのって都市部の一部だけなんですよね。
また既存の住所はいずれも人が住んでいるか利用している土地が対象になっているという問題もあります。原野や山野はまるごと一つの住所になっていたりしますし、無番地の問題もあります。番地がふってあるところも分筆と合筆を繰り返して地番がカオスになっていたりとかして、もうほんとに何がどうなってるんだかって状態なのが今の日本の住所です。これほんとどうしたらいいんでしょうね。
住所を割り振るときの視点の問題もあります。地図を広げて全体を見通す視点、実際にそこに暮らしているコミュニティの視点、道を歩いて住所を訪ねていく視点。それぞれにとって最適な住所の在り方が違いますから、それらを統合して使いやすい住所にするというのも大変に難しい問題です。
とはいえいつまでも逃げてるわけにもいきません。私なりに考える解決策は、デジタルに向いた機械的な住所を新レイヤーとして既存の住所とは別個に定義することですかね。こちらは緯度経度をベースに機械的に割り振った住所にします。緯度経度は大地震で移動してしまうって問題はありますが、そんな大地震は滅多に起こらないので履歴を持たせることで解決できるのではないかと思います。まあ、既存の住所と新レイヤーとのマッピングをどうする問題はあるので、既存の住所の整理も並行して行う必要があるのですけれども。
複数の住所を使い分けるのは大変って話はありますが、既に地番と住居表示の二つの住所を使い分けているわけですので、そこに一つ追加されるだけという考え方もあるのではないかと思います。