Qualitätsuntersuchung

From OpenStreetMap Wiki
Jump to navigation Jump to search

Raumzeitliche Qualitätsuntersuchung von OpenStreetMap

Im Februar 2010 habe ich (Alexander Strunck) meine Diplomarbeit "Raumzeitliche Qualitätsuntersuchung von OpenStreetMap" an dem Geographischen Institut in Bonn abgegeben. Mitte Juni habe ich eine 2 für diese Arbeit von dem Prof. Dr. A. Zipf erhalten.

Inhalt

  • 1. Einleitung
  • 2. Einführung in die Thematik
  • 2.1. Freie Geodaten
  • 2.1.1. OpenStreetMap
  • 2.2. Proprietäre Geodaten
  • 2.2.1. TeleAtlas
  • 3. Datenqualität
  • 3.1. Allgemeine Qualitätsmerkmale
  • 3.2. Datenqualität von OpenStreetMap
  • 3.3. Datenqualität von TeleAtlas
  • 4. Methodik
  • 4.1. Datenaufbereitung
  • 4.2. Analyse der beiden Datensätze
  • 4.2.1. Positionsgenauigkeitsanalyse
  • 4.2.2. Rasterzellenanalyse
  • 4.2.3. Wachstumsanalyse
  • 5. Ergebnisse
  • 5.1. Positionsgenauigkeitsanalyse
  • 5.2. Rasterzellenanalyse
  • 5.3. Wachstumsanalyse
  • 6. Bewertung der Ergebnisse
  • 6.1. Positionsgenauigkeitsanalyse
  • 6.2. Rasterzellenanalyse
  • 6.3. Wachstumsanalyse
  • 7. Fazit und Ausblick
  • 8. Danksagung
  • 9. Literaturverzeichnis
  • 9.1. Internetquellen
  • 10. Anhang


1.Einleitung

In der folgenden Arbeit wird die Beteiligung von Freiwilligen an der Informationsgewinnung im Internet – bekannt unter dem Begriff „Web 2.0“ - untersucht. Die Erarbeitung, Bearbeitung und Bewertung von Inhalten durch Nutzer hat das Internet revolutioniert.

Dies gilt auch für Geoinformationen, die durch Nutzer gesammelt und bearbeitet werden, das sog. Volunteered Geographic Information1. Die Daten liegen beispielsweise bei dem OpenStreetMap-Projekt kostenlos für jedermann bereit und können in allen erdenklichen Formen bearbeitet und genutzt werden. Diese freien Geodaten entstehen durch die Aufnahme mit Global Positioning System (GPS)-Geräten durch Freiwillige oder werden durch Datenspenden bzw. -übernahmen erweitert. Da bei der Datenaufnahme und -bearbeitung keine Kontrollen existieren, wird die Frage immer lauter, in wie weit man die erstellten Informationen nutzen und ihnen ertrauen kann.

Im Gegensatz dazu sind die Anbieter von proprietären Geodaten zu betrachten. Diese bieten Geodaten in einem meist monopolartigen Markt zum Kauf an. Die Daten werden durch präzise Vorgehensweisen geplant, gewonnen und kontrolliert. Die Daten bieten meist eine hohe Genauigkeit und sind z. B. in Autonavigationsgeräten sehr weit verbreitet.

In dieser Arbeit wird sowohl das Wachstum und die Vollständigkeit des gesamten Datensatzes für Deutschland untersucht, als auch die Positionsgenauigkeit der Points of Interest (POI) von OpenStreetMap (OSM) mit dem proprietären Datensatz MultiNet (Stand 2/2008 und 1/2009) von TeleAtlas (TA) verglichen. Der TeleAtlas Datensatz wird dabei als Optimum angesehen. Diese Vorgehensweise bei der Untersuchung wurde von den Arbeiten von Haklay2, Ather3 und Zielstra4, die die Positionsgenauigkeit für Straßen untersucht haben, übernommen und für die Points of Interest angepasst.

Um das Wachstum des OpenStreetMap-Datensatzes für Deutschland einschätzen zu können, werden die einzelnen Geometrien (Punkte, Linien, Polygone), verschiedene Gruppen (Verkehr, Points of Interest, Namen, Sonstiges) und unterschiedliche Einzugsgebiete betrachtet. Die Vollständigkeit wird im Vergleich zu TeleAtlas anhand der Points of Interest und der Straßenkilometer untersucht. Zusätzlich wurde Deutschland in quadratkilometergroße Flächen aufgeteilt und für jede Fläche wurde untersucht, welcher Datensatz bei der Anzahl der Points of Interest „vollständiger“ ist.

Die Erarbeitung der Ergebnisse wurde über eine PostrgeSQL-Datenbank mit Post-GIS-Erweiterung durchgeführt und mit Hilfe von Desktop-GIS-Software visualisiert. Die Datengrundlage für diese Arbeit bilden: Zum einen die frei verfügbaren OpenStreetMap-Daten, die im Internet kostenlos zum Download bereit stehen und zum anderen der MultiNet-Datensatz von TeleAtlas, der von der Arbeitsgruppe Kartographie der Universität Bonn zur Verfügung gestellt wurde.

Zu Beginn dieser Arbeit wird der aktuelle Stand in der Theorie dargestellt. Zunächst werden die Begriffe „Web 2.0“ mit einigen Beispielen und „Freie Geodaten“ erläutert. Hierbei liegt der Fokus auf dem Projekt OpenStreetMap, welche aus freien Geodaten entstanden ist. Die Funktionsweise, Größe und Ziele von OpenStreetMap werden anschließend dargelegt. Aktuelle Berichte und Artikel mit dem Thema OpenStreet-Map werden am Ende des Kapitels 2.1.1 bearbeitet. Im Anschluss werden proprietäre Daten anhand des Datensatzes vom Anbieter TeleAtlas untersucht.

In Kapitel 3 werden Qualitätsaspekte von Geodaten besprochen, insbesondere für OpenStreetMap und TeleAtlas. Im Anschluss folgt die Erklärung der Methodik und der damit verbundenen Datenaufbereitung. Kapitel 4 stellt die daraus resultierenden Ergebnisse vor, die dann in Kapitel 5 bewertet werden. In Kapitel 6 werden diese diskutiert und ein Fazit gezogen. Des Weiteren wird ein möglicher Ausblick auf die Entwicklung von OpenStreetMap skizziert.

Untersuchung

  • Positionsgenauigkeitsanalyse der POI zw. OSM und TeleAtlas
    • Heraussuchen von vergleichbaren POI Tags
    • Buffer von 5m, 10m, 20m wurden um die POI der vergleichbaren Tags von OSM gelegt und untersucht in welcher Entfernung der entsprechende POI von TeleAtlas lag
  • Rasterzellenanalyse der POI
    • Einteilung Deutschlands in 1x1km Zellen
    • Vergleich der Anzahl der POI je Zelle von OSM und TeleAtlas
  • Wachstumsanalyse von OSM im Vergleich zu TeleAtlas
    • Betrachtung der einzelnen Geometrien,
    • Wachstum der Nutzerzahlen,
    • Einteilung der Geometrien in die Gruppen Verkehr, POI, Namen, Sonstiges.
    • Aufgrund regionaler Unterschieder wurden neben einer gesamtdeutschen Betrachtung auch unterschiedliche Räume (Großstädte, Mittelstädte, Dörfer) anhand von fünf Beispielen untersucht.

Interesse?

Bei Interesse kann die Diplomarbeit als PDF verschickt werden, Anfragen bitte an A.Strunck@gmx.net

Literatur

1 Vgl.: Goodchild, M. F. (2007): Citizens as sensors: the world of volunteered geography. In: Geojournal, Band 69, Heft Nr. 4, Seite 211-221

2 Vgl.: Haklay, M. (2008): How good is OpenStreetMap information? A comparative study of OpenStreetMap and Ordnance Survey datasets for London and the rest of England. In: Environment & Planning B, 28 Seiten

3 Vgl.: Ather, A. (2009): A Quality Analysis of OpenStreetMap Data, M.Eng. Dissertation, Department of Civil, Environmental & Geomatic Engineering, University College London, 81 Seiten

4 Vgl.: Zielstra, D. (2009): Datenqualität und Anwendbarkeit von Volunteered Geographic Information. Vergleich von proprietären und frei verfügbaren Geodaten. Diplomarbeit, Geographisches Institut der Rheinischen Friedrich-Wilhelms-Universität Bonn, 102 Seiten