Sk:MinvSKAddress

From OpenStreetMap Wiki
Jump to navigation Jump to search

MinvSKAddress je import adries poskytnutých Ministerstvom vnútra (ďalej MV) Slovenskej republiky. Myšlienka na zrealizovanie importu sa začala materializovať v roku 2017 po tom, ako si členovia komunity všimli, že dáta boli prelicencované pod OSM-kompatibilnou licenciou CC-0. Komunita import odsúhlasila a konkrétnejšie kroky a príprava na import začala v decembri 2017.

Zdôvodnenie

Presnosť a úplnosť adresných dát je veľmi dôležitým prvkom pri navigovaní v mestách. To, že je o takéto dáta záujem možno často pozorovať napr. v užívateľských recenziách navigácii využívajúcich OSM podklady (MapFactor Free, maps.me).

Okrem toho kompletnejšie adresy umožnia alebo aspoň uľahčia importovať mnohé ďalšie dáta, pri ktorých z rôznych dôvodov (často nejasný alebo licenčne nepoužiteľný zdroj) nie je možné použiť geografické súradnice.

Licencia

Údaje pochádzajú z https://data.gov.sk/dataset a sú dostupné pod licenciou CC0, ktorá je plne kompatibilná s licenciou ODbL (pozri Import/ODbL_Compatibility). Zmeny budú označené nasledovne:

comment = $NAZOV OBCE$ - minvskaddress (by $USER$)
source = minvskaddress YYYY-MM

Predpokladá sa výhradné použitie editora JOSM.

Základné princípy

  • Už existujúce (zmapované) čísla (súpisné či orientačné) v OSM majú väčšiu váhu ako dáta z MV. Toto však neplatí, ak adresa pochádza z importu KaporSKAddress.
  • Obecné úrady spravidla disponujú presnejšími a aktuálnejšími údajmi týkajúcich sa názvoslovia ulíc. V prípade pochybnosti, navštívte webstránky obce (príp. ich priamo kontaktujte).
  • Kombinácia reštaurácia, obchod, úrad a podobne + adresa nie je považovaná za adresný bod.
  • Je neprípustné, aby jedna obec používala rozdielnu formu zápisu toho istého mena, teda rôzne formy zápisu názvu (B. Němcovej vs B. Nemcovej).
  • Všetky úpravy budú vykonávané pod vyhradeným účtom minvskaddress_bot (meno užívateľa bude obsiahnuté v komentári ku zmene).
  • Pre diskusiu nejasností je ideálnym miestom google skupina osm_sk.
  • Pri vývoji skriptov je snaha o minimalizovanie závislosti na "tretej osobe". Maperi podieľajúci sa na importe ho tak budú mať možnosť pripraviť si dáta "doma".
  • KaporSKAddress je považovaný za predchodcu tohto importu. Nakoľko obsahuje viac chýb a nie je naďalej aktualizovaný, postupne ho nahradí MinvSKAddress.

Popis vstupných dát

Štruktúra vstupných dát je popísaná na stránkach data.gov.sk:

  • register vchodov: [[1]]
  • register ulíc: [[2]]
  • register budov: [[3]]
  • register obcí: [[4]]

Rozsah a kvalita vstupných dát

Dáta z MV obsahujú približne 1 112 000 adresných bodov, z toho 574 000 je orientačných. Vizuálnou kontrolou bolo zistené, že približne 9 000 bodov z nich má prehodenú zemepisnú šírku a výšku - súradnice takýchto bodov budú počas spracovania opravené. Niekoľko adries obsahuje súradnice mimo územia SR - tieto budú použité len na prípadné doplnenie chýbajúcich súpisných čísiel.

Na prvý pohľad vyzerajú dáta kompletne, no približšom skúmaní a porovnaní s OSM možno nájsť:

  • Ulice, ktorých čísla takmer úplne absentujú,
  • chýbajúce súpisné čísla záhradkárskych oblastí (tie poväčšinou možno nájsť v KaporSKAddress),
  • chýbajúce adresné body pre obce Čamovce a Podrečany,
  • gramatické a typografické chyby a preklepy v názvoch ulíc.

Tagovanie

Import sa týka nasledovných tagov:

addr:street

Pôvodné meno ulice/námestia, tak ako ho sprístupňuje MV, je upravené nasledovne:

  • slovo Ulica/Ul. je odstránená (Ul. Májová -> Májová)
  • slovo nám. je rozvinuté na námestie (Nám. slobody -> Námestie slobody)
  • za bodku je vložená medzera (1.mája -> 1. mája)
  • medzera na začiatku a konci je odstránená ("Tehelná " -> "Tehelná")
  • slová ako námestie, mieru, svätého, partizánov, park, cesta.. sú prepísané malými písmenami, ak sa nejedná o prvé slovo v názve (Námestie Mieru -> Námestie mieru)
  • zjavné gramatické chyby a preklepy sú opravené - to sa týka predovšetkým nesprávne použitých diakritických znamienok (Dlha -> Dlhá, Hájská -> Hájska)

Takto upravený názov je považovaný za oficiálny.

Hodnota addr:street musí byť zároveň použitá v kľúči name prislúchajúcej cesty.

addr:conscriptionnumber

Súpisné číslo stavby tak, ako ho zverejňuje MV (cisla budov).

addr:streetnumber

Orientačné číslo vchodu tak, ako ho zverejňuje MV (vchody).

addr:housenumber

Pre obce, ktoré majú pomenované ulice a domy osadené orientačnými číslami je hodnota tohto kľúča:

   addr:conscriptionnumber / addr:streetnumber

Pre zvyšné obce tento tag duplikuje hodnotu addr:conscriptionnumber.

Hromadná úprava hodnôt tohto kľúča bude vykonaná v záverečných fázach importu, dovtedy bude slúžiť ako podklad pri vypĺňaní hodnôt pre súpisné a orientačné čísla.

name / alt_name

Názvy ulíc po úpravách (pozri addr:street). V prípade, že v OSM má cesta rozvinutejší tvar s pridanou informáciou (Janka Kráľa miesto J. Kráľa, Ivana Krasku miesto I. Krasku), táto sa prekopíruje do alt_name.

source:addr:* / source:name

Pre nové/upravené tagy na existujúcich elementoch bude pridaný príslušný tag source:addr:* alebo source:name vyplnený hodnotou minvskaddress. Pre nové elementy bude použitá kombinácia source=minvskaddress.

Fázy importu

Prípravná fáza

4Q 2017 + 1Q 2018 (dokončená)

V rámci príprav sa zisťujú nasledovné skutočnosti:

  • importu sa plánuje aktívne účastniť zopár jednotlivcov - skúsených maperov
  • súradnice umiestnenia vchodov nie sú natoľko presné, aby mohli slúžiť ako ukazateľ skutočnej polohy vchodu (niekedy vstup do garáže a pod.)
  • údaje na niektorých miestach zaostávajú za realitou aj o niekoľko rokov
  • databáza môže obsahovať niekoľko verzii názvu objektu, toto je treba zohľadniť a do úvahy vziať vždy najaktuálnejšiu revíziu
  • názvy ulíc obsahujú mnoho chýb (diakritika, nesprávne veľké/malé písmená, rozdiely medzi obcami, ale aj v rámci jednej obce)

Nakoľko je v záujme OSM komunity dbať na kvalitu importovaných dát, je vyvinutá snaha o opravu problematických názvov ulíc podľa kľúča uvedeného v sekcii o tagovaní addr:streetnumber. Na zreteľ však je brané aj to, ako veľmi konkrétna obec na názve trvá (najvyššiu váhu pritom ma VZN na stránke obce). Ak to vyzerá tak, že sa sama obec nevie dohodnúť, ako má názov ulice znieť, je vybraný gramaticky správny a/alebo častejšie používaný, prípadne ten, ktorý už je použitý v OSM.

Ujednotenie názvov ulíc

1Q 2018--2020 (prebieha)

Pre ďalší postup je nevyhnutné, aby bolo možné použiť addr:street, resp. názov ulice ako spoločný kľúč identifikujúci ulicu medzi OSM a údajmi z MV. Je teda potrebné, aby sa napr. ulica J. Kráľa udávala takto v oboch zdrojoch (a nie napr. Janka Kráľa vs J. Kráľa). Pre tento účel sú vytvorené zoznamy, ktoré obsahujú body pomenované podľa názvu ulice, ku ktorej prislúchajú.

Úlohou mapera je skontrolovať či addr:street (adresné body) i name (ulica) obsahuje rovnakú hodnotu ako pripravené dáta. Následne nezrovnalosti buď opraviť alebo - v prípade pochybností - nahlásiť do mailing listu. Úpravy budú prebiehať postupne - po obci.

Pôvodné názvy ulíc sú presunuté do tagu alt_name, ak obsahujú užitočnú informáciu (typicky "rozbalené" krstné meno osobnosti).

Tagovanie

  • name - upravený názov z dát MV
  • alt_name - (voliteľne) pôvodný obsah name v prípadoch, kedy obsahuje dodatočnú informáciu
  • source:name - nastavený na minvskaddress

Doplnenie chýbajúcich tagov

2020 (plánovaná)

Využitím spoločného kľúča medzi dátami OSM a MV a príbuznosťou podľa hranice obce sú doplnené nasledovné tagy:

  • addr:conscriptionnumber (spoločný kľúč addr:street a addr:streetnumber)
  • addr:street (spoločný kľúč addr:conscriptionnumber a addr:streetnumber)
  • addr:streetnumber (spoločný addr:conscriptionnumber a addr:street)
    • v prípade budovy s viacerými vchodmi v tejto fáze nie sú vchody do OSM pridávané (pridávame tagy, nie nové elementy)

Riešenie konfliktných tagov

2020 (plánovaná)

Vygenerované zoznamy kolidujúcich tagov (napr. addr:street + addr:streetnumber ukazuje v oboch datasetoch na iný addr:conscriptionnumber) sú podrobené kontrole jednotlivca. V prípade, že konflikt nie je možné vyriešiť, údaje v OSM ostanu bez zmeny.

Kontrola/oprava výrazných polohových rozdielov

2021/2021

Pridávanie nových elementov

2021

Team

  • Jose Riha (koordinátor)
  • Malin (website s prehľadom importu)
  • Durko_freemap
  • elfenlied
  • segi
  • synalik

Poďakovanie takisto patrí:

  • Poťovi za kontrolu a konzultáciu
  • pánovi Radovi Garabíkovi a pani Jarmile Čásarovej za konzultáciu pri opravovaní gramaticky nesprávnych názvov ulíc

Prispievanie

Záujem o pomoc s importom vyjadruje maper v diskusnej skupine osm_sk@googlegroups.com. Následne mu bude zaslané heslo k uploadovaciemu účtu minvskaddress_bot a ďalšie inštrukcie. Od mapera sa očakáva dobrá znalosť editoru JOSM.