DE:Konsolidierung der PLZ-Relationen in Deutschland 2013

From OpenStreetMap Wiki
Jump to: navigation, search
An English summary of this page: This is a project to consolidate and check the mapping of the German postal code areas. Before the start of this project some postal codes were tagged on admin boundary relations, duplicates existed and a lot of postal codes were wrong, obsolete or missing. After this project all 8201 postal code areas in Germany have their own postal_code relation. (You can view a likely awful automatic translation to roughly understand this page's content if you cannot read German.)

Ausgangslage

In den aktuellen OSM-Daten findet sich ein generelles Schema für die Beschreibung von Gebieten, für die in Deutschland eine bestimmte Postleitzahl gilt. Das jeweilige Gebiet wird durch eine Grenzrelation beschrieben, d.h. eine Gruppe von Grenzlinien, die Flächen ergeben.

Ursprünglich wurden für diese Gebiete an Stellen, an denen flächenmäßig identische Relationen für Gemeindegrenzen vorhanden waren, diese mit postal_code=* versehen. Wo dies beispielsweise aufgrund einer Gemeinde mit mehreren Postleitzahlen nicht möglich war, wurden eigene Grenzrelationen erstellt.

Aufgrund dieses "doppelten Schemas" wurden auch andere politische Grenzen mit dem Tag versehen, wodurch sich im Laufe der Zeit Inkonsistenzen ergaben.

Hauptartikel: Import/Catalogue/Postleitzahlen Deutschland 2010

Hauptartikel: DE:Postleitzahlenänderungen in Deutschland

Zielsetzung

Da sich bei maschinellen Auswertungen der PLZ-Gebiete Schwierigkeiten von "Datendoppelungen" gezeigt haben und PLZ-Gebiete allgemein unabhängig von Gemeindegebieten sind, sollen die PLZ-Gebiete nur noch mit eigenständigen PLZ-Relationen abgebildet werden, d.h. entkoppelt von den politischen Grenzrelationen.

Somit lautet das Ziel dieser Aktion:

  1. alle durch PLZ-Relationen abgebildeten Postleitzahlen sollen gültig/aktuell sein
  2. für jede in Deutschland gültige Gebietspostleitzahl (d.h. keine PLZ für Postfächer oder Gruppengroßempfänger) soll es nur eine einzige eigenständige Relation geben.
  3. von allen politischen Grenzrelationen sollen ggf. vorhandene Merkmale von postal_code=XXXXX entfernt werden.

Umsetzung

Für Gebiete, bei denen noch keine eigenständige PLZ-Relation existiert (und somit der Schlüssel postal_code wohl noch an der politischen Grenzrelation hängt), muss eine neue PLZ-Relation angelegt werden. Hierfür soll die bestehende Relation (z.B. mit JOSM) kopiert und die Kopie gemäß den hier angegebenen Tags angepasst werden. Bei der politischen Grenzrelation sind postal_code und ggf. postal_code_level zu entfernen.

Bei der Umwandlung in eine PLZ-Relation ist auch die Korrektheit und Eindeutigkeit für die vorherige politische Grenzrelation zu überprüfen. Ggf. kann es auch notwendig sein, kleine Grenzbereiche auszuschließen bzw. Bereiche benachbarter Gemeinden einzuschließen.

Definitionen der Elemente

Postleitzahlen sollen ausschließlich als Grenzrelation nach folgendem Schema erfasst sein:

Schlüssel Wert Beschreibung des Wertes optional? Verbreitung
type boundary Relationstyp als Grenze, ggf. ersetzen, wo multipolygon nein 100%
boundary postal_code Typ der Grenzrelation nein (100%)
postal_code <PLZ> (5 Ziffern) Die Postleitzahl des Gebietes nein (100%)
postal_code_level 8 Markiert die Relation als Postleitgebiet, z.B. im Gegensatz zur Postleitzone (ja) 100%
note <PLZ> <Gemeindenamen> Bezeichnung des PLZ-Gebietes mit führender PLZ und Liste (,) betroffener Gemeinden nein 100%

Die Relation beschreibt das Gebiet, in dem diese Postleitzahl zutreffend ist. Dies bedeutet, dass sie nur in den sehr seltenen Fällen einer Gültigkeit zweier Postleitzahlen an der selben Stelle überlappend sein dürfen.

Der Schlüssel note steht unter Vorbehalt einer zukünftigen Umbennung durch einen geeigneteren Namen.

Mit der Umstellung auf PLZ-Relationen ist die Entwertung des postalischen Tags einer Grenzrelation vorgesehen (Beispiele siehe unten).

Verbreitete PLZ-Tags bei den Administrativen Grenzrelationen

In den verschiedenen nationalen OSM-Communities und auch innerhalb Deutschlands haben sich verschiedenste postal-Tags verbreitet. Neben dem bekannten addr:postcode für Hausadressen, gibt es für Grenzrelationen neben postal_code teilweise auch postcode (Beispiel Dänemark).

Im Sinne der Eindeutigkeit von postal_code für (deutsche) PLZ-Relationen, sind als Ersatz für Verwaltungsrelationen verschiedene postalische Schlüssel mit verschiedener Semantik entstanden. Die folgende Auflistung zeigt postalische Schlüssel mit ihrer Häufigkeit in den über 19.000 deutschen Grenzrelationen (boundary=administrative).

Schlüssel Bedeutung level 8 Gesamt
postal_code (Einheitliche) Postleitzahl eines Gebietes 0 0
postcode einfache Umbenennung für Eindeutigkeit von postal_code 101 101
is_in_postal_code PLZ der Gemeinde (geteilt mit anderen Gemeinden) 42 42
de:plz PLZ der Gemeinde (nur in dieser Gemeinde) 198 198
admin_centre:postal_code PLZ der Gemeindeverwaltung 1555 1568

Datenstand: 07.02.2014

Im Zuge der Konsolidierung der PLZ-Daten wird auch angestrebt, dieses Tagging zu harmonisieren bzw. sämtliche PLZ-Angaben aus deutschen Admin-Relationen zu entfernen.

Werkzeuge zur Prüfung

Hinweis: Die PLZ-Karte der Deutschen Post AG ist i.d.R. keine geeignete Quelle, da die Grenzverläufe dort oft schlecht, falsch oder veraltet sind.

statistische Auswertung

Als PLZ-Gebiete in Deutschland werden hier nur echte PLZ-Grenzen (boundary=postal_code) und Gemeindegrenzen (admin_level=8) einbezogen.

Stand echte PLZ-Relationen PLZ nur in Admin-Relation irgendwie erfasste PLZ DPAG-PLZ-Gebiete Bemerkung
2013-10-20 6043 2164 (1095 mit postal_code_level=8) 8188 8206 Düsseldorf fehlt
2013-11-11 6128 2080 (1075 mit level 8) 8207 8206 Düsseldorf fehlt
2013-11-22 6244 1966 (986 mit level 8) 8208 8206
2013-11-23 6266 1942 (978 mit level 8) 8208 8206
2013-11-24 6273 1936 (973 mit level 8) 8208 8206
2013-11-25 6289 1917 (960 mit level 8) 8206 8206 2 Taggingfehler
2013-11-26 6299 1909 (953 mit level 8) 8208 8206
2013-11-27 6330 1878 (923 mit level 8) 8208 8206
2013-11-28 6340 1868 (914 mit level 8) 8208 8206
2013-11-29 6345 1863 (911 mit level 8) 8208 8206
2013-11-30 6377 1832 (886 mit level 8) 8208 8206 PLZ 37327 doppelt
2013-12-01 6566 1642 (751 mit level 8) 8208 8206
2013-12-02 6690 1518 (628 mit level 8) 8208 8206
2013-12-03 6731 1477 (603 mit level 8) 8208 8206
2013-12-04 6827 1381 (524 mit level 8) 8208 8206
2013-12-05 6873 1335 (503 mit level 8) 8208 8206
2013-12-06 6902 1306 (485 mit level 8) 8208 8206
2013-12-07 6906 1302 (482 mit level 8) 8208 8206 28845 eingefügt, falsch!
2013-12-08 6918 1291 (475 mit level 8) 8209 8206
2013-12-09 6912 1278 (467 mit level 8) 8190 8205 33333, 60310, 04861 fehlen
2013-12-10 6981 1220 (431 mit level 8) 8201 8205
2013-12-11 7116 1085 (348 mit level 8) 8201 8205
2013-12-12 7279 922 (272 mit level 8) 8201 8205
2013-12-13 7360 842 (257 mit level 8) 8201 8205 77743 doppelt
2013-12-14 7516 685 (209 mit level 8) 8201 8205
2013-12-15 7662 539 (175 mit level 8) 8201 8205
2013-12-16 7810 391 (104 mit level 8) 8200 8205 Taggingfehler bei 58300
2013-12-17 7900 301 (84 mit level 8) 8200 8205
2013-12-18 7967 234 (59 mit level 8) 8201 8205
2013-12-19 8100 101 (15 mit level 8) 8201 8205
2013-12-20 8185 16 8201 8205
2013-12-21 8201 0 8201 8205
2014-02-08 8200 0 8200 8205 06725 entfernt
2014-02-09 8201 0 8201 8205 99819 entdeckt
2014-02-13 8202 0 8202 8205 16552 entdeckt
2014-02-14 8204 0 8204 8205 09634, 04862 entdeckt
2014-02-22 8205 0 8205 8205 60306 entdeckt
2014-02-25 8204 0 8204 8205 28845 entfernt
2014-02-26 8203 0 8203 8205 99843 entfernt
2014-03-22 8202 0 8202 8205 82282 entfernt
2014-03-25 8201 0 8201 8205 83739 entfernt
2014-04-24 8203 0 8203 8205 82475, 24367 entdeckt
2014-06-10 8204 0 8204 8206 25867, 99707 eingeführt;

04574 aufgelöst

Anmerkung: Der Status 2013-12-09 ist ein Sonderfall, da einerseits einige Korrekturen vorgenommen wurden (veraltete PLZ entfernt und ersetzt) und andererseits durch Taggingfehler kurzzeitig einige Relation herausgefallen sind.

Die Angabe der Anzahl Postleitzahlen ("DPAG-PLZ-Gebiete") ist errechnet aus Angaben der Dt. Post AG (Stand Mai 2013) und davon abgezogenen/hinzugerechnet PLZ, die laut Mitteilungsblättern der Post seitdem gestrichen wurden.

Durchschnittlich kamen im Projektzeitraum (2013) 34,8 PLZ-Relationen pro Tag hinzu.

Grafiken

Gegenüberstellung "echter" PLZ-Gebiete, administrativer PLZ-Gebiete und ihrer Überlappungen.

1.12.2013 ca 19:00 Uhr
1.12.2013 ca 18:15 Uhr
1.12.2013 vs. 20.12.2013
Postleitgebiete, -regionen und -zonen, 22.12.2013 ca 21:00 Uhr