DE:Operation Cowboy/TIGER

From OpenStreetMap Wiki
Jump to navigation Jump to search
Was ist das?   Teilnehmen   eigene Mappingparty   TIGER und Co   Promotion   Ergebnisse    

Besonderheiten beim USA Mapping

Beim Bearbeiten der Daten für die USA gibt es eine Reihe von Besonderheiten zu beachten. Diese folgen zum Teil direkt aus Besonderheiten der USA selbst:

  • Das Land ist sehr(!) groß.
  • Bis auf einige Gebiete an der Ost- und Westküste ist das Land eher dünn bis sehr dünn besiedelt.

Der Bundesstaat Montana ist z.B. flächenmäßig etwas größer als Deutschland, hat aber weniger Einwohner als Köln. Da OSM in den USA auch noch nicht so bekannt ist wie in Europa, gibt es große Landstriche, in denen es fast keine oder gar keine Mapper vor Ort gibt. In vielen Gegenden haben wir auch keine GPS-Tracks vorliegen. Andererseits ist man in den USA erfreulicherweise der Ansicht, dass Daten, die auf Kosten des Steuerzahlers erfasst oder erstellt wurden, dann bitte auch dem Steuerzahler zur Verfügung stehen sollten, ohne dass dieser noch ein zweites Mal dafür zur Kasse gebeten wird. Daher gibt es eine Vielzahl von Daten aus öffentlichen Quellen, die prinzipiell für OSM genutzt werden können und teilweise auch importiert wurden. Diese Datensätze sind von sehr unterschiedlicher Qualität, und die Nutzung bzw. der Import wurden teilweise sehr unterschiedlich und unterschiedlich gut gehandhabt.

Die wichtigsten Datenquellen

TIGER

Der TIGER-Datensatz wird eigentlich erstellt, um Geodaten für die Organisation der Volkszählung in den USA bereitzustellen. Damit sollen also einfache Karten erstellt werden, anhand derer die Helfer bei der Volkszählung ihr Arbeitsgebiet abstecken können und prüfen, dass sie überall waren. Verantwortlich für die Bereitstellung der Daten sind die einzelnen Counties (entspricht etwa den deutschen Landkreisen), die ihre Daten jeweils in den zentralen Pool einbringen. Im Datensatz enthalten sind Straßen mit Namen und einer Klassifikation, welche die Art der Straße und ob diese öffentlich zugänglich ist beschreibt, Eisenbahnlinien, Strom(-hochspannungs)-leitungen, Pipelines, Grenzen und in neueren Versionen von TIGER auch Gewässer. Es wird jedes Jahr eine neue Version von TIGER veröffentlicht. Ein Teil der Daten aus der Version von 2005 (Straßen, Bahnlinien, Stromleitungen, Pipelines und ein Teil der Grenzen) wurde in den Jahren 2007 und 2008 in OSM importiert und ist für weite Teile der USA immer noch unverändert in der OSM DB vorhanden. Die Straßendaten aus den Versionen von 2011 und 2012 stehen auf einen WMS-Server von OSM-US bereit und können als Hintergrundlayer in OSM Editoren eingeblendet werden.

Probleme mit den TIGER-Daten

Die TIGER fixup Seite (englisch) beschreibt die Problem mit dem TIGER Datensatz; die wichtigsten hier nochmal auf deutsch:

Unverbundene und überlappende Wege

Da die Daten pro County bereitgestellt werden, gibt es an den Countygrenzen zum einen das Problem, dass sich grenzüberschreitende Linien (Straßen, Stromleitungen, Bahnlinien etc. zwar berühren, aber nicht miteinander verbunden sind. Es liegen einfach nur die Endknoten von beiden Seiten an der gleichen Stelle. Bei Linien, die genau an der Grenze verlaufen, ist oft von beiden Counties eine Version vorhanden, die sich dann dort überlappen. Es liegen dann also zwei Linien (unverbunden) übereinander. Beide Sorten Fehler sind auf der Karte rein optisch schwierig bis garnicht zu erkennen, machen aber u.a. das Routing über dieses Wegenetz unmöglich. Glücklicherweise erkennen die meisten OSM-Qualitätssicherungswerkzeuge wie KeepRight oder der JOSM-Validator diese Probleme.

Falsch verbundene Wege

In den TIGER-Daten ist nicht erfasst, ob zwei Wege miteinander verbunden sind oder sich nur kreuzen (z.B. über eine Brücke). Um ein verbundenes Wegenetz zu erhalten wurden beim Import automatisch Verbindungen hergestellt, die es in der Realität nicht immer gibt. Teilweise haben auch Reparatur-versuche mit Bots zu weiteren Fehlern geführt, wo beispielsweise Straßen mit Stromleitungen verbunden wurden.

Wege nur sehr skizzenhaft dargestellt

Wege sind teilweise annähernd richtig in der Form, aber viel zu groß, zu klein und/oder ein gutes Stück von der richtigen Position entfernt eingetragen. Manchmal ist statt dessen die Position und Größe halbwegs richtig, dafür die Form des Wegverlaufs fehlerhaft. Der Anteil dieser Fehler war im Datensatz von 2005 noch sehr hoch (mit deutlichen Unterschieden zwischen einzelnen Counties); die Daten von TIGER 2011 sind erheblich besser, aber keineswegs perfekt. Insbesondere (aber nicht nur!) viele Feld- und Waldwege sind teilweise immer noch genauso fehlerhaft wie 2005.

Scan- und Tippfehler bei Namen

Vielfach wurden die Namen von Straßen etc. wohl mit OCR-Geräten eingescannt. Fehler bei der Schrifterkennung führen teilweise zu Effekten wie "Outbck" statt "Outlook". Oft ändert sich im Verlauf einer längeren Straße der Name so, dass in einem kleinen Abschnitt der Straße ein Buchstabe des Namens fehlt oder anders ist.

Abgekürzte Namen

Namen werden normalerweise abgekürzt, wobei ein Standard-Abkürzungsverzeichnis zum Einsatz kommt. Diese Namen wurden ursprünglich in abgekürzter Form importiert und später teilweise von einem Bot "entkürzt". Das führte gelegentlich zu Pannen, so gibt es in Montana (Staats-abkürzung "MT") zahlreiche Straßen namens "Mount Highway" in den OSM-Daten, weil Mt auch die Abkürzung für Mount ist und teilweise falsch expandiert wurde. Möglicherweise ist dieser Fehler auch schon bei der Erstellung der Original TIGER Daten passiert.

Falsche Straßenklassifikation

Darunter fallen eigentlich zwei verschiedene Probleme: Zum einen ist die Klassifikation in den TIGER Daten oft schlicht falsch: Hauseinfahrten werden oft als "normale" Straße klassifiziert, ungeteerte Feldwege werden gerne mal zur nicht-öffentlichen Zufahrtsstraße, usw. Das andere Problem ist, dass beim Import der 2005-Daten die "Standard"-Straßenklasse als highway=residential importiert wurde. Das ist zwar in Stadtgebieten oft richtig, in ländlichen Gebieten aber meistens nicht: Oft wäre highway=unclassified richtig, noch öfter ist es aber eher ein highway=track.

Nicht (mehr) existierende Straßen

Manche Counties haben auch geplante, aber nie gebaute Straßen in ihren Datensatz aufgenommen, und manche der 2005 noch existierenden Straßen gibt es inzwischen nicht mehr.

Fehlende Straßen

Nach 2005 neu angelegte Straßen fehlen im Import und daher oft auch in OSM.

GNIS

USGS GNIS ist die offizielle US-Datenbank für Namen geographischer Features. Der auf die USA bezogene Teil dieser Datenbank wurde 2009 in OSM importiert. Die DB enthält Namen, zugehörige Koordinaten incl. Höhenangabe, ggf. alternative Namen und eine Kategorie, was mit diesem Namen an dieser Stelle denn bezeichnet wird oder wurde. Die Quelldaten sind auf geonames.usgs.gov zu finden. In den importierten Daten in OSM steht u.a. der key gnis:feature_id, mit dem Wert dieses Tags kann man den zugehörigen Eintrag in der GNIS DB abfragen.

Probleme mit GNIS

nicht mehr existierende Features

Einträge in der GNIS DB werden niemals gelöscht, denn die DB gibt an, an welcher Stelle ein Objekt mit einem bestimmten Namen zu finden ist oder war und macht keine Aussage darüber, ob das Objekt noch existiert. Manchmal werden Einträge aktualisiert und bei nicht mehr existierenden Objekten dem Namen ein "(historical)" incl. der Klammern hinzugefügt. Leider wurden auch diese "(historical)" Objekte mit importiert; sofern man einen solchen findet, ist es meistens sinnvoll, den Eintrag zu entfernen. Aber auch ein Name ohne diesen "(historical)" Anhang bedeutet nicht, dass es das Objekt noch geben muss. Manchmal kann man leicht erkennen, dass dem so ist, wenn beispielsweise ein See trockengelegt wurde oder eine Insel in einem Stausee untergegangen ist. Auch in einem solchen Fall kann man den POI entfernen.

Ungenaue Positionsangaben

Die Positionsangaben in der GNIS DB liegen gerne mal ein paar Dutzend Meter daneben; gelegentlich sind sie auch nur grob geschätzt (letzteres steht dann im Detaileintrag für diesen Punkt in der GNIS DB, diese Information wurde aber nicht mit importiert). Für Namen ausserhalb der USA, die teilweise auch importiert wurden, kann der Positionsfehler übrigens auch mehrere Kilometer betragen.

Punkte statt Flächen

Importiert wurden die Daten als Punkte; viele der Namen bezeichnen aber flächige Objekte (Gebäude, Seen, Friedhöfe, Staudämme, ...). Wenn möglich, sollte man die Objekte dann als Flächen einzeichnen. Dabei kann man den importierten POI als einen Punkt der Fläche verwenden und dann die Tags vom Punkt entfernen und bei der Fläche hinzufügen. Von den gnis:*-Tags ist dabei eigentlich nur das gnis:feature_id Tag wichtig, die übrigen gnis:*-Tags können dabei entfernt werden. Besonderheit bei Friedhöfen: Diese wurden als amenity=grave_yard importiert, was bei OSM nur für Kleinstfriedhöfe verwendet werden soll. Beim Zeichnen als Fläche ist es meistens sinnvoll, statt dessen landuse=cemetery zu verwenden.

NHD

Der National Hydrography Dataset ist eine USA-weite Gewässerdatenbank. Diese wurde in einzelnen Gebieten importiert, aber (noch?) nicht in allen.

Probleme mit NHD

Diese Importe wurden in vielen Fällen leider nicht mit der gebotenen Sorgfalt durchgeführt, daher gibt es auch mit diesen Daten eine Reihe von Problemen:

Wege mit zu hoher Punktdichte

Die NHD-Daten enthalten im Original Punkte im Abstand weniger Zentimeter. Beim Import wurden die Wege generell etwas vereinfacht, enthalten aber oft immer noch so viele Punkte, dass diese Wege schlecht zu handhaben sind.

Irrelevante Wasserläufe

Die NHD Datenbank enthält auch Gewässer, die nur zeitweise (z.B. nach mehrwöchigem Regen) Wasser führen oder Gewässer mit sehr geringen Wassermengen, die ein ungeschulter Beobachter auch vor Ort gar nicht wahrnehmen würde. Diese Gewässer wurden vielfach mit importiert (als waterway=stream oder waterway=ditch) und führen zu Verwirrung bei vielen Kartennutzern, da diese den in der Karte aufgeführten Bach vor Ort nicht sehen.

veraltete Daten

Viele dieser Daten sind schon vor langer Zeit erfasst worden und entsprechen nicht mehr dem heutigen Zustand, z.B. trocken gelegte Seen, an deren Stelle heute eine Wohnsiedlung steht. Oft wurden diese Gewässer trotzdem importiert.

Kein Abgleich mit vorhandenen OSM-Daten

Bei einigen Importen wurde darauf verzichtet, die importierten Daten mit existierenden Daten in OSM abzugleichen. Daher gibt es oft Überschneidungen von Strassen und Wasserläufen, ohne das die dort vorhandenen Brücken oder Durchlässe eingezeichnet wurden. Auch existieren teilweise Gewässer, die vor dem Import schon von Hand eingezeichnet wurden nach dem Import dann doppelt.

USGS Topo Maps

Die topographischen Karten der USA vom USGS können (teilweise?) als Grundlage für OSM benutzt werden. In JOSM wird ein Scan dieser Karten automatisch als mögliches Hintergrundbild angeboten, sobald man auf dem Gebiet der USA arbeitet. Die Positionierung dieser Scans als Hintergrundbild ist aber teilweise etwas ungenau, diese Hintergrundebene muss man also üblicherweise anhand anderer Daten erst passend zurechtschieben. Wenn man das gemacht hat, sind diese Karten aber sehr hilfreich, um z.B. Gewässerläufe im Wald, die auf dem Luftbild evtl. schlecht erkennbar sind, vervollständigen zu können. Auch die Position von aus GNIS importierten Berggipfeln lässt sich damit oft noch etwas verbessern.

Luftbilder

Die Luftbilder von BING sind in den ganzen USA von guter Qualität. Für viele Gebiete gibt es auch noch weitere Luftbildangebote, z.B. vom US Landwirtschaftsministerium (USDA) oder von MapQuest OpenAerial. In JOSM werden diese im passenden Gebiet automatisch als weitere mögliche Hintergrundlayer angeboten.

Landesspezifische Eigenheiten

Es gibt einige Dinge, die ein US-Mapper möglicherweise gar nicht erzählen würde, weil sie für ihn vollkommen "normal" sind, die einem Mapper aus der Ferne aber ungewohnt vorkommen könnten:

Straßennamen

Das Straßennetz in vielen Orten basiert auf einem rechtwinkligen Gitter von Straßen. Dabei endet der Straßenname z.B. bei den "waagerechten" Straßen immer auf "Street" und bei den "senkrechten" auf "Avenue" oder umgekehrt, man erkennt also am Straßennamen, in welcher Richtung eine Straße in einem bestimmten Ort verläuft. Im wesentlichen durch die Mitte des Gitters oder an seinem Rand verläuft waagerecht und senkrecht meist je eine hervorgehobene Straße, die in vielen Fällen "Main Street", "Central Avenue" oder ähnlich heisst. Die benachbarten Straßen werden dann oft (aber nicht immer) durchnumeriert und enthalten ein Richtungspräfix oder -suffix. Nehmen wir als Beispiel an, in einem Ort hätten wir eine durch die Ortsmitte in Nord-Süd-Richtung verlaufende "Central Avenue" und am Südrand der Ortschaft eine "Main Street" in Ost-West-Richtung. Dann heisst die erste östliche Parallelstraße der Central Avenue oft "First Avenue East", die zweite dann "Second Avenue East" usw.; die erste westliche Parallelstraße wäre die "First Avenue West" gefolgt von der "Second Avenue West" usw. Die erste nördliche Parallelstraße der Main Street wäre dann die "First Street", danach die "Second Street". Da diese Straßen in der Regel die "Central Avenue" kreuzen, wird dann auch oft bei der jeweiligen Straßenhälfte ein Himmerlsrichtungssuffix angehängt, die östliche Hälfte der "Second Street" wäre dann also "z.B. Second Street East". Wenn es sowohl bei den waagerechten als auch bei den senkrechten Straßen Nachbarn in beiden Richtungen gibt, kann das ein bisschen kompliziert werden. Relativ oft haben auch einzelne der Nachbarstraßen statt der Nummer oder zusätzlich dazu noch einen "normalen" Namen. Die "numerischen Straßennamen" werden üblicherweise mit Verwendung von Ziffern geschrieben, also "1st Avenue", "2nd Street" usw.

Zuliefergassen

Die meisten "Gitternetz"-Straßen sind highway=residential. Zwischen zwei solchen Straßen verläuft oft (aber nicht immer) noch parallel eine Zuliefer- oder Hinterhofgasse (highway=service mit service=alley). Diese Gassen sind nicht für den normalen Verkehr gedacht, sondern führen normalerweise zu Garageneinfahrten oder Mülltonnen-Abstellplätzen und sind oft auch nicht befestigt.

Hausnummern

In amerikanischen Adressen kommt die Hausnummer vor den Straßennamen. Für den Bereich zwischen jeweils zwei nacheinander kreuzenden Gitternetzstraßen ist ein Hunderterblock von Hausnummern vorgesehen, von denen jeweils nur wenige (meist nicht direkt aufeinanderfolgende) vergeben sind. In unserer oben beschriebenen Beispielstadt könnte also ein Haus, das zwischen der First und der Second Street an der Central Avenue liegt, die Adresse "123 Central Avenue" haben.

Trailer Parks

Mit Trailer Park kann in seltenen Ausnahmefällen ein auf Wohnwagen und Wohnmobile spezialisierter Campingplatz gemeint sein. Normalerweise ist damit aber ein Gelände gemeint, auf dem sehr einfache, auf ein Fahrwerk montierte Fertighäuser aufgestellt und an das öffentliche Versorgungsnetz angeschlossen werden. Solche Trailer Parks gibt es auch in kleineren Ortschaften, manchmal auch mehrere in einem Ort. Die Standorte und Namen vieler solcher Trailer Parks wurden beim GNIS-Import in OSM übernommen und die dabei angelegten Nodes als place=hamlet getaggt. Dies ist offensichtlich falsch, da es sich nicht um eigenständige Ortschaften sondern um Gelände innerhalb anderer Orte handelt. Eine allgemein akzeptierte Methode zum Taggen dieser Trailer Parks hat sich aber noch nicht herausgebildet.

Friedhöfe

Viele Friedhöfe in den USA sehen anders aus als in Deutschland: einzeln umfriedete oder mit Beeten oder Platten bedeckte Gräber sind unüblich; statt dessen befindet sich am Kopfende eines Grabes ein Marker aus Holz oder Stein, stehend oder liegend mit den üblichen Daten und manchmal am Fußende noch ein einfacher Marker. Der Rest der Grabfläche unterscheidet sich aber oft nicht von der direkten Umgebung, also je nach Gegend und Jahreszeit Rasenfläche, Wüstenboden, ... Daher sehen Friedhöfe für "Luftbildmapper" anfangs etwas ungewohnt aus.

Kläranlagen

In den eher ländlichen Gegenden bestehen Kläranlagen normalerweise nur aus 3 bis 8 Absetzbecken, in denen sich Feststoffe im Abwasser absetzen können. Sobald in einem Becken zuviel Klärschlamm enthalten ist, wird es aus dem Abwasserfluß ausgeklinkt und nach einiger Ruhezeit ausgebaggert für die nächste Verwendung. Gebäude oder grössere technische Einrichtungen findet man in solchen Klärwerken oft nicht.

Fernstraßen-relationen

Es gibt in den USA numerierte Fernstraßen sowohl auf Bundes- als auch auf Bundesstaatsebene. Ausserdem betreiben einige Behörden noch ein eigenes Fernstraßennetz, z.B. das "Bureau of Indian Affairs" in einigen Reservaten. Auf Bundesebene sind dies die "Interstate Highways", die nach dem Vorbild deutscher Autobahnen entworfen wurden, und die "US Highways" als andere vom Bund betriebene Fernstraßen. Die Fernstraßen auf Ebene der Bundesstaaten werden je nach Staat unterschiedlich gehandhabt: Die meisten Staaten haben einfach nur eine Sorte "State Highways", manche Bundesstaaten aber auch mehrere unterschiedliche. Der Staat Montana unterscheidet z.B. zwischen "State Highways" und "Secondary State Highways". Eine Besonderheit der amerikanischen Fernstraßen sind "Highway Shields": Speziell gestaltete Schilder mit der Highwaynummer, wobei die Art des Schildes von der Art der Straße abhängt. Es ist in amerikanischen Straßenkarten üblich, die Straßennummer in einer Miniversion des passenden Schildes darzustellen, einige OSM-Renderer tun dies auch. Unter anderem damit dies einfacher möglich ist, werden die einzelnen Wege, aus denen sich eine solche Fernstraße zusammensetzt, in einer Relation vom type=route, route=road verbunden. Bei Interstates und auch einigen anderen Fernstraßen gibt es getrennte Trassen pro Richtung. Teilweise sind beide Trassen in einer gemeinsamen Relation, teilweise gibt es getrennte Relationen pro Richtung und eine übergeordnete "Super-Relation", welche die beiden Richtungskomponenten zusammenfasst. Beide Arten kommen vor, werden aber für eine einzelne Fernstraße üblicherweise nicht gemischt. Die Beschilderung bei solchen Straßen enthält üblicherweise noch eine Richtungsangabe (North, South, East oder West) unter der Straßennummer. Diese Richtungsangabe bezieht sich auf den Gesamtverlauf der Fernstraße und kann im Einzelfall durchaus das Gegenteil der Richtung eines einzelnen Straßenabschnitts sein. Wenn zwei getrennte Relationen pro Richtung verwendet werden, enthält die Relation auch ein Tag "direction" mit der Angabe der jeweiligen Richtung. Wie die Straßenrelationen in einem bestimmten Bundesstaat zu taggen sind, findet sich oft auf der Wiki-Seite zum Bundesstaat oder einer passenden Unterseite. Wenn nicht, sollte man sich an der Wikiseite United States roads tagging orientieren.

Eisenbahnstrecken ohne Bahnhöfe

Die meisten Bahnstrecken in den USA dienen nur (noch) dem Güterverkehr; es ist also vollkommen normal, wenn eine Bahnlinie einen Ort durchquert, ohne dass es da irgendwo Bahnsteige oder ein Empfangsgebäude gibt.

eingleisige Bahnstrecken mit langen Ausweichgleisen

Die allermeisten Bahnstrecken in den USA sind eingleisig. Das gilt auch für Strecken mit starker Nutzung in beiden Richtungen. Damit das funktioniert, gibt es immer wieder längere Abschnitte mit einem zweiten Gleis, wo ein Zug für eine Überholung oder zum Ausweichen "auf die Seite" genommen werden kann. Diese Ausweichgleise sind meistens an beiden Enden an das Hauptgleis angeschlossen und erhalten ein zusätzliches Tag service=siding.

Regeln, Koordination und Community

Es ist sinnvoll, sich die Wiki-Seite für die USA anzusehen und die dort verlinkten Seiten für die einzelnen Bundesstaaten, in denen man mappen will. Ansonsten gibt es noch die Mailingliste talk-us und das (sehr wenig genutzte) Forum users: United states.

Operation Cowboy United States