Import/Catalogue/Japan eStat 2015 Exam

From OpenStreetMap Wiki
Jump to: navigation, search

Japan Chome (neighbourhood) level boundary Data from eStat@Japan government

こちらのページでは、日本政府・総務省が管理を行っているeStatに含まれる、丁目レベルの行政区境データについて、解説を行います。

このデータは非常に有効なデータであり、このページではOpenStreetMapで利用するための条件について検討を行います。ただし、いくつかの観点により、現状、 "インポートを即座に行うことはできません"。

インポートを行うために必要な要件についてもまとめますので、インポート作業は「絶対に行わないでください」。

インポートを検討する場合、必ず、インポートガイドラインおよびその必要な手続きに従ってください。

メタデータ

  • 配布元: 総務省 統計局, eStat
  • ライセンス: 政府標準利用規約 第二版ベース
  • EPSG: 4612
  • データ作成時期: 2015年
  • 位置精度: 不明
  • 二次配布について(on Github)

もともとの配布形式であるShapefileに修正が加えられたデータが、CC0で配布されています。

ただし、データに対して手が加わっているとはいえ、その大部分はeStatに由来しています。後々のことを考えても、総務省に対して説明をしておくことは有意義です。

総務省の担当官については、 @nyampire から連絡が可能です。

データカラム

以下、カラムの内容について解説を行うとともに、OSMで利用するにあたってのタグ提案を行います。

繰り返しますが、「絶対にインポートは行わないでください」。

原典カラム 意味 要不要 OSMタグ
AREA 面積 不要 -
PERIMETER 周辺長 不要 -
H27KAxx_ 内部ID 不要 -
H27KAxx_ID 外部ID 不要 -
KEN 都道府県番号 不要 -
CITY 市区町村番号 不要 -
KEN_NAME 都道府県名 不要 -
SITYO_NAME 支庁・振興局名 不要 -
GST_NAME 都市・特別区・政令指定都市名 不要 -
CSS_NAME 区町村名 不要 -
HCODE 分類コード 要検討 ref:XXXX = YYYY (?)
KIHON1 町字コード 要検討 ref:XXXX = YYYY (?)
DUMMY1 ダミー ("-") 不要 -
KIHON2 丁目、字などの番号 要検討 ref:XXXX = YYYY (?)
KEYCODE1 マッチング番号 不要 -
KEYCODE2 町丁・字等別結果マッチング番号 不要 -
AREA_MAX_F 面積最大フラグ 不要 -
KIGO_D 特殊記号D(飛び地、抜け地フラグ) 不要 -
N_KEN 抜け地県番号 不要 -
N_CITY 抜け地市区町村番号 不要 -
KIGO_E 特殊記号E(町丁・字等重複フラグ) 不要 -
KIGO_I 特殊記号I(島フラグ) 不要 -
MOJI 町丁・字等名称 必要 name=YYYY
KBSUM 基本単位区(調査区)数 不要 -
JINKO 人口 要検討 population=YYYY
SETAI 世帯数 不要 -
X_CODE 図形中心点X座標(10進経度) 不要 -
Y_CODE 図形中心点Y座標(10進緯度) 不要 -
KEYCODE1 町丁・字等番号 要検討 ref:XXXX = YYYY (?)
KEY_CODE 図形と集計データのリンクコード 不要 -

ウェイへのタグ

  • boundary=administrative

リレーションへのタグ

  • place = quarter (大字/町名) or neighbourhood (小字/字/丁/丁目)
  • admin_level = 9 (大字/町名) or 10 (小字/字/丁/丁目)
  • name = YYYY

変更セットへのタグ

  • source = JP_eStat_boundary

インポート用特別アカウント

TBD

作業に当たっての課題

ライセンス

元データは政府標準利用規約で配布されています。

修正を行ったGithubリポジトリではCC0で配布を行っていますが、データの活用について、総務省への申し入れを行う必要があるかと考えています。

  • OSM wikiへの掲載
  • OSMでの著作権表示方法について、総務省向けの説明文書を作成
  • 説明文書を作成して総務省へ説明、フィードバックをうける

作業方法、作業方針

1つのデータセットに含まれるデータ量が非常に多いため、作業分量が非常に大きくなることが予想されます。

誰かが1人で対応できる分量ではなく、チームでの対応が望ましいと考えています。

複数人で作業対応するにあたっては、Tasking Managerの利用を含め、適切な大きさでの作業分量切り分け、および作業フローの確立・ドキュメント化が必要です。

タグの付与について・住所階層との適合性

丁目レベルのデータ階層は、place=quarterとplace=neighbourhoodの2つに分割されます。

どのような単位でインポート用のデータを作成するか、name:enなどのデータをどのように作成するか、ogr2osmの変換ルール策定を含め、議論が必要です。

既存データとの整合性確保

海上の境界線の取り扱いについて

現在、OpenStreetMap日本における都道府県(admin_level=4)、および市町村(admin_level=7 & 8)のデータは、海上で境界線が作成されています。

丁目レベルデータセット(admin_level=9)でのデータ作成は、陸上および海上の境界線が混在しています。この部分で、どのような形でデータを作成するか、議論と取り決めが必要です。

既存の県境、および市町村境とのデータマージ方法の詳細取り決め

基本的に、既存の県境データ・市町村データを優先してマージすることがよいと考えますが、それでよいか、議論が必要です。

2015年以降のデータ改定について

2015年以降に行われた丁目レベルのデータ変更の履歴は、国土地理協会のページで確認することができます。

これらのデータに対してあらかじめ対応を行うのか、あるいは作業を優先して、修正作業は別途実施とするのか、議論と取り決め、将来的な計画策定が必要です。