JA talk:Import Bus stop from 国土数値情報

From OpenStreetMap Wiki
Jump to: navigation, search

試しにやってみた

神奈川県のデータをGPXファイルに変換し、JOSMでバス停を"トレース"出来るかどうか検証してみた。

ためしにGPXファイルへ変換してみた
基盤地図情報「地名」と同じ技法にて変換。
トレース方法も同じ。

地名(大字・町・丁目)をトレースする方法

  • データが多すぎてJOSMが動かない!
  • とりあえず動くがとても遅い!
  • 作業ができないほど遅い!
(神奈川県で約8500ノード)
  • ゆえに、分割が必要
  • バス路線毎?
  • バス会社毎?
  • 分割するならインデックス情報も作成する必要あり。
インポートデータはどんな感じか?
  • ノードはひとつしか無い
通常、2つあるバス停の中間の位置にポイントが設定してあるようだ
「100m以内に複数のバス停がある場合にはひとつにまとめた」という説明書きがあった。意識してデータをひとつにまとめているようです。
  • OSMの位置とはずれている(30mぐらいかな)
  • バス停の「名前」と、ここを経由する「バス路線」の情報がある
「シェルター」や「退避帯」などの情報はない
もちろん、時刻表や料金もない


既存のバス停データへの配慮

  • バス停はBingでは描けないので、既存のバス停は全てsurver or knowledge によるものと考えられる。
  • 既存データの有無は、半径50mほどの範囲に他のバス停が存在するかどうかを目視でチェックするしかないようだ。
「妥当性」のチェックでは検知できない。
なにかいい方法はないか?
  • OSMサーバーにアクセスして直接OSMデータをダウンロードすることに成功した。インポートするバス停の周囲100m以内のOSMデータをダウンロードして、「bus_stop」を含むノードがあれば”既存データあり”と判断することが可能となった。

評価試験

変換プログラム(2015-02-21版)を使って神奈川県のデータをインポートすると、 8,466件のデータがインポートされることになります。(busstop8466.osm

JOSMで表示すると、

BusstopP11 8466.png


この状態だと既存のバス停データの付近に新たにバス停を作ってしますので、インポートNODEの付近300m四方にバス停ノードが存在していたらインポート対象から外す処理を加えてみました。

その結果が下記の画像。インポートデータは3,810件に減ります。(busstop3810.osm

BusstopP11 3810.png

神奈川県中央部から東側にかけての地域が活発に活動されているマッパーがいるようでインポートの必要がなくなっているのがわかります。

しかし、すでにバス停が入力されているはずの中央部(大和市付近)地域にもところどころインポートデータが残っているのでZoomしてよく見てみると、 常泉寺入口 (1277019896)の172m離れた位置にインポートしようとしているのがわかりました。

他のインポートデータも殆どが150m以上離れている場所にバス停タグが存在しているのがわかりました。

ならば、チェック範囲を300m四方から広げて500m四方〜600m四方に広げると、今度はインポートの必要があるデータまで対象外にしてしまう恐れが出てきてしまう。

そこで、

  • 300m四方に既存バス停がある場合はインポート対象から外す。
  • 600m四方に同一名称のバス停がある場合にはインポート対象から外す。

の二本立てでチェックをかけてみます。

なぜ最初から名称チェックを行わないかというと、名称にカッコ書きでローマ字表記がわざわざ追記されている場合(例:"駒大高校裏 (Komadai Koukou Ura)")が多く見受けられるからです。
(やめてほしいものです。name:enなりname:roを使ってください)
では、前方一致でチェックすればいいじゃないか? この場合は、「〇〇駅」と「〇〇駅北口」があるとか、「〇〇」と「〇〇裏」とかいろいろと問題があるので、位置が近いものは名称にかかわらず同一バス停とみなすことにしました。

その結果、インポートデータは3,770件になり、40件減りました。(busstop3770.osm

BusstopP11 3770.png

いい感じになっていると思います。

私の近所の海老名市はコンプリートしたと思っていましたが、2件の入力漏れがあることも、ここからわかりました。

みなさんの入力地域のバス停はいかがでしょうか?

神奈川県版は、「busstop3810.osm」からダンロードできます。

神奈川県以外の地域でも、変換プログラム(2015-02-22版)を使って簡単にチェックできますので興味のある方は是非トライしてみてください。


インポートでもOKなのか?

  • 基盤地図情報が"トレース"なのに、国土数値情報は"インポート(変換)"OKの出典元はどこ?

--> インポートすることに問題はないようだ。


インポートファイルをOSMメンバーに配布できないか?

既存の「バス停」と二重に登録されることを回避するために、例によって人力による力技が必要になる?

  • 国土数値情報の"ダウンロードとデータ変換"の作業は、煩雑・めんどくさい・楽しくない
どんなファイル?
  • バス路線ごとにOSMファイルを作成することは可能
  • バス路線ごとにカバレッジ率をWEB上に公開するのは可能だ!
(1) まだマッピングされていない路線を見つける!
(2) 数値情報をダウンロード
(3) GPXファイルに変換
(4) GPXのウェイポイントをトレースする
(5') バスルートをマッピング


評価試験の結果

変換プログラム(2015-02-22版)によって上記の問題はクリアされます。

  • 既存バス停付近をインポート対象から外す機能により、人力による力技が必要ありません。
  • ダウンロードとデータ変換"の作業は、非常に簡単になりました。
  • 実はバス路線ごとにOSMファイルを作成する機能が昨年の6月から追加されていました。バス停だけでなく、バスルートのトレースも可能です。



誰がやるのか?

  • マッピングジャンキー(likes me)
特殊な人々、絶対数が少ないのが問題
  • 地元のマッパー
大多数は自分の領域外までインポートしようとは考えない
  • バスマニア
まだOSMの存在を知らないようだ
  • バス運営者(バス会社、自治体など)
マッパーになってくれれば理想的


いまのところはジャンキーに頼るしか無いが、OSMの「ビジネス利用促進」の観点から「バス運営者自身」で自らのバス路線を描いてもらうのが理想的ではないか?
特に、自治体やコミュニティバスは路線図の作成費や印刷費に悩んでいるのではないだろうか?
WinWinの関係が成立する関係になると考える。(たぶんバス運営者は地図の精度やらカバー率など面倒なことはいわないとおもう)


評価試験の結果

変換プログラムによって既存データのチェックも含めて高速に処理できるようになった(神奈川県8,466件のデータをCore2マシンで3分ぐらいで処理できます。)ので、1人で47都道府県のすべてをインポートすることも可能になりました。

既存データとのチェックがあるので、入力が最も少なくなると思われる日の出前ぐらいの時間に実行するのが良いと思います。