データサイエンスとは、あらゆる技術を用いてデータに価値を与えるもので、その領域は多岐にわたります。その技術はシミュレーションや自然言語処理、地理情報システム (GIS) など様々なものが存在します。本記事では、GISとプログラミングの技術を用いて、都市計画の領域がどのように分析がされているのかを紹介したいと思います。
データサイエンスの第一歩
市川研究室では、特に研究などにおいて何かを分析したいとなったときに、まずは社会問題を発見するところから始めます。発見方法は新聞やニュース、インターネットなど様々で、自分が興味のある社会問題をピックアップします。
今回は「免許返納」を取り上げたいと思います。昨今、高齢者による交通事故は頻繁にメディアに取り上げられており、社会問題となっています。対策として、免許の自主返納制度が存在しますが、2019年時点で75歳以上における免許返納率は10%にも満たない状況です1)。免許返納しようと思った高齢者も「車がないと生活が不便」という理由から免許返納に踏み出せていません2)。交通事故のリスクを減らすことは、都市計画の観点からも重要です。そこで免許返納を促進できる「徒歩で生活しやすい都市」とはどのような都市なのかを分析していこうと思います。
データサイエンスの手法 〜情報収集編〜
徒歩で生活しやすい都市を評価するにあたり、高齢者が日常的に利用する施設が重要となってきます。徒歩で生活しやすい都市なら、それらの施設へのアクセスが容易でないといけません。ここでは、日常的に利用する施設が歩ける範囲にあればアクセスしやすいと捉えました。そこで、日常的に利用する施設が何人の高齢者人口をカバーできているかで市町村を評価していきます。
この高齢者が日常的に利用する施設に関して、どのような施設があるのかを選定しなければいけません。それらの情報は先人たちの似たような分析をしている論文や、インターネットの情報を参考にしながら選定します3)。選定し終わったら、それらの施設の住所を集めなければいけません。ここでは、施設の住所情報が一覧で記載されている「iタウンページ」というウェブサイトを参考に情報を集めます。情報を集める際に、数千、数万の住所を一つ一つ検索してはメモして・・・を繰り返すのは非効率的ですよね?そういった、非効率的な作業を効率的に変える技としてプログラミングが登場します。プログラミングができる技の一つに、インターネットの情報を自動で取得する、というものがあります。それが「スクレイピング」と呼ばれている技です。ここでは、Pythonというプログラミング言語を使って、これらの住所のデータを自動的にエクセルデータに変換させることができます。

次に、これらの情報を地図上にプロットしていきます。ここで地理情報システム、通称GISと呼ばれるソフトウェアを使用します。GISとは、住所や特定の範囲などの地理データを可視化し、分析することができるソフトです。代表的なものに、「ArcGIS Pro」や「QGIS」などがあります。本記事では「ArcGIS Pro」を使用しています。
ここで、住所のデータを入れる際には、「〇〇県△△市・・・」などの住所データではなく、住所を定量的に表した緯度経度 (地理座標) の情報を入力する必要があります。住所を地理座標に変換することを「ジオコーディング」と呼びます。ジオコーディングの方法も、数千・数万の住所データを手作業で行うのは果てしない時間がかかるので、プログラミングを用いて行います。GISのジオコーディングサービスに自動アクセスし、変換したデータを自動でエクセルデータに保存してくれます。これにより、あっという間に施設の地理座標データを入手できました。これでようやくGISに情報を入力することができます。
例として実際に全国のコンビニエンスストアの住所データを「iタウンページ」からスクレイピングし、ジオコーディングの処理をして地図上に可視化してみました。1枚目は皇居周辺のコンビエンスストア、2枚目は全国の分布、3枚目は全国の分布を三次元で可視化したものです。データ取得を自動化することができればこのような大規模な分析も可能になります。



データサイエンスの手法 〜GIS編〜
GISに入力すると下のような点の情報が出現し、施設の住所が可視化されます。ここから、GISの分析が始まります。
一旦情報を整理します。本来の目的は「徒歩で生活しやすい都市を評価する」ことで、その手段として「高齢者が日常的に利用する施設が、何人の高齢者をカバーしているかを算出する」ことです。そして、GIS分析の目的は「選定した高齢者施設が何人の高齢者をカバーしているかを算出する」ことです。ここでの「カバーしている」は、「その施設へアクセスしやすいエリアに何人の高齢者が存在しているか」、ということを意味しています。高齢者にとってアクセスしやすいとは、国土交通省の資料を参考に500mの範囲と定義しました4)。つまり、選定した施設から500m範囲内に何人の高齢者が居住しているのかを算出します。
GISに戻ります。整理した情報から、まずは各施設から500mの範囲を導き出す必要があります。GISには「到達圏解析」という機能があります。到達圏とは、任意の場所から“道路上の距離で”到達できる範囲を表しており、単純な500m範囲円よりも正確な500mを表すことができます。


この到達圏解析を行うことで、以下のような図ができます。ちなみに、同じ技術を使えば東京のある地点から車で50分、100分、150分で到達できるエリアもこのように可視化できます。
GIS解析の最後のピースとして、可視化した範囲内に何人の高齢者がいるのか、高齢者人口データが必要になってきます。高齢者人口データは、国土交通省が公開しているウェブサイトから、「500mメッシュ別将来推計人口」というデータを使用します5)。500mメッシュとは、日本全体を500m四方に区切った区画で、各区画ごとに男女別の人口や5歳階級ごとの人口などのデータが含まれています。このデータから、まずは各メッシュごとの高齢者人口の人口密度を算出します*1。そして、この人口密度に到達圏解析で算出した面積を乗算することで、各施設からの高齢者人口を算出します。このような過程を踏むことで、各施設からの高齢者人口を算出することができ、都市の評価をすることができます。500m範囲内に高齢者人口が多ければ多いほど、その施設へ容易にアクセスできる人口が多いこととなります。つまり、算出した人口が多いほどその都市は高齢者にとって生活しやすいこととなります。

データの見せ方・捉え方
一般的に、数値だけを見せられても、人間はその数値の意味を理解しにくいです。算出したデータをどのように見せるかも考えるべきポイントです。今回は算出したデータについて、レーダーチャートで出力してみます。選定した施設が多いので、それぞれ「買い物」「趣味・娯楽」「医療」「暮らし」「交通」という分類に分けて可視化しました。また、今回は比較として、埼玉県内における評価値が高い5つの市町村を比較してみました。その結果、以下のようなレーダーチャートができました。


この結果から、蕨市のみ非常に高い評価値であることがわかります。そこで、蕨市について着目し、なぜこのような値になっているのか考察してみました。蕨市の都市計画を調査すると、蕨市は「コンパクトシティ蕨」という政策を掲げていました。コンパクトシティとは、都市に必要な機能を近接させることで、効率的で持続的な都市を目指す、都市計画の一種です。主なメリットとしては、人が住むエリアが絞られることで、公共施設や商業施設の密集化が進み、施設同士でアクセスが容易になることから、徒歩での移動が簡単になることです。これにより、公共交通機関のニーズの増加と自転車の交通量減少が期待され、結果的に徒歩で生活しやすい都市が誕生します。つまり、今後高齢者が求める理想的な都市形態として、コンパクトシティが考えられます。
ここまで、「都市×データサイエンス」というテーマで、実際に市川研のメンバーが行っている研究を紹介してきました。データサイエンスとは、技術なども重要ですが、それ以上に思考力が重要だと思います。どんな社会問題があるのだろうか、どのような技術を用いれば解決できるのだろうか、どのようにデータを見せると良いのだろうか。これらの思考力は最初はみんな持っていません。実際に考え、壁を乗り越えることで、それが経験として積み重なり、新たな思考・思想に繋がります。
もし、この記事を見て興味を持った方がいましたら、研究室まで足を運んでみてください。見学だけでもOKです。私たちはあなたたちと一緒に研究室生活を送れることを楽しみにしています。
補足
*1:実際の研究では、500mメッシュの他に「土地利用細分メッシュ」というデータを使用しています。こちらは500mメッシュより細かい250mメッシュ単位で人の居住地を表しているデータで、より精密な分析が可能になります。気になる方は市川研メンバーの総合研究内の、「交通視点における高齢者が生活しやすい都市指標」をご覧ください。
参考文献
- 警察庁:運転免許統計,https://www.npa.go.jp/publications/statistics/koutsuu/menkyo.html
- 警察庁:運転免許証の自主返納に関するアンケート,https://www.npa.go.jp/koutsuu/kikaku/koureiunten/kaigi/3/siryoh/shiryo4.pdf
- 例えば、原拓也・石坂公一・大橋佳子(2009),「地方中核都市における高齢者の徒歩アクセシビリティ特性からみた住宅地の評価」,日本建築学会計画系論文集 Vol.74No.635,pp.129-135
- 国土交通省:アクセシビリティ指標活用の手続き(案),http://www.nilim.go.jp/lab/jcg/index.files/accessibility.pdf
- 国土交通省: 500mメッシュ別将来推計人口データ, https://nlftp.mlit.go.jp/ksj/gml/datalist/KsjTmplt-mesh500h30.html