FR:Completeness
Mesurer la complétude est un des défis pour la communauté OpenStreetMap.
Indices de complétude
Les études ci-dessous résultent de différentes approches pour évaluer la complétude :
Comparaison avec des Données Externes
- Une comparaison numérique stricte (comptage, sommation) des éléments dans une zone géographique est faite avec des sources externes. C'est la mesure la plus simple à réaliser, nécessitant uniquement la consistance des zones comparées. Cette méthode permet l'usage de tests statistiques classiques.
- Comparaison unitaire des caractéristiques indifférenciées. Surtout utilisé pour les réseaux routiers à coordonner avec les données disponibles selon les sources. Permet la comparaison numérique ainsi que l'évaluation de la précision (en assumant que la source externe est plus précise que OpenStreetMap). Requiert obligatoirement une source de données externe fiable. Ce genre d'informations n'est généralement pas ouvert, seul les chercheurs peuvent y accéder.
- Comparaison unitaire des caractéristiques correspondantes. Nécessite la "conflation" de deux bases de données. Limite le risque de faux positifs et faux négatifs (ex : un même établissement catégorisé comme un bar ou un restaurant selon la source).
- Évaluation relative à la Population Il est possible de réaliser une estimation des éléments à partir du nombre d'habitants, en général sur 100000. Si les données sont disponibles (via Wikidata pour les administrations) les évaluations sont possibles pour une localisation délimitée.
Comparaison Interne à OpenStreetMap
La capacité d'utiliser les données OpenStreetMap pour évaluer la complétude est importante en particulier pour les régions manquant d'informations statistiques ou de données officielles.
- Comparaison entre Zones. Un lieu considéré comme cartographié de façon convenable peut servir de référence pour la quantité d'éléments en fonction du développement économique qui serait un indice entre les zones. Pour être utilisable il serait utile de regrouper les lieux similaires (ex : les villes européennes avec 250000 à 500000 habitants, idem pour les villes aux États-Unis ou au Canada).
- Accumulation d'Éléments. On estime que l'évolution du nombre d'éléments cartographiés dans un lieu tend vers une asymptote correspondant à la totalité des éléments présents. Ces asymptotes présentent une limite, un lieu pouvant indiquer une saturation résultant simplement de l'absence de cartographes locaux.
- Densité d'Élément. Le nombre d'éléments rapportés par unité d'aire était un indice utilisé par le passé. Cet indice est probablement soumis à la subjectivité dans la méthode de cartographie et de données importées, mais peut être utile pour identifier les zones manquant d'informations.
Liste d'Éléments en lien avec la Complétude
Liste de cartes, rendus, articles et études :
- Barrington-Leigh and Millard-Ball - Comparaison mondiale de la complétude des réseaux routiers (2017).
- Mapbox CIA worldfact book comparison - Livret de données sur le réseau routier mondial.
- Carte des lieux non cartographié par Pascal Neis, voir son blog.
- Hall of Fame/Streets complete - Liste des lieux complétement cartographiés par rapport à la base complète des rues issues des listes gouvernementales.
- CheckAutopista [1] - Évaluation de complétude des autoroutes.
Royaume uni :
- OSM and OSL differences analysis ([2]) - Évaluation de complétude par ITO World selon les données OS Locator
- Muki Haklay "OpenStreetMap completeness evaluation – March 2010"
- Lonely buses - Localisation des rues manquantes à partir de l'import de stations de bus
- UK Mapping Priorities - Comparaison du nombre d'habitants et de la taille des fichiers .osm
- ONS Completeness Metrics (GB)
- Bike Shop Locator - Comparaison des données OpenStreetMap avec une liste de l'Association of Cycle Traders
- Dracos postbox locator - Basée sur une liste de Royal Mail
- Postbox completeness overview map - Données sous licence de Royal Mail
Suisse :
Brésil :
La carte n'est jamais complète
La carte est-elle complète ? Dans le style wiki, la réponse est que la carte ne pourra jamais être complète. Il y aura toujours des détails à ajouter à la carte dans une zone. Néanmoins, les niveaux de complétude varient fortement selon les régions. Alors qu'une zone peut contenir une grande quantité de détails tels que le nom des établissements, leurs adresses, leurs horaires, l'accessibilité, etc (voir Completeness/example), les zones avoisinantes pourraient se résumer à un réseau routier basique. Certaines parties du monde sont encore vierges.
OpenStreetMap est un projet collaboratif. Il est nécessaire que la population s'investisse pour contribuer à créer une carte du monde. Une zone est incomplète lorsque l'activité n'est pas assez attrayante pour la population locale. L'objectif est de donner envie aux habitants de cartographier leur environnement et de créer une carte à leur image. En attendant, il reste possible pour n'importe qui de combler ce manque en cartographiant ces zones. Une carte incomplète est une opportunité pour quiconque voulant cartographier !
Mesurer la Complétude
De nombreux individus cherchent à suivre l'avancement du projet. D'autres sont intéressés dans l'utilisation des données et ont besoin de savoir l'état de complétude. Certains auront juste envie de savoir où sont les meilleures opportunités de cartographier. Pour ces raisons, il est important de pouvoir mesurer la complétude à l'aide d'indices, si possible pouvant être visualisables.
Problèmes de Licence
OpenStreetMap doit maintenir une approche transparente dans l'ajout de données, il peut y avoir des problèmes lors de l'usage de données sous licence pour la mesure de complétude. Cela est justifiable si l'on considère que toute carte de complétude peut être utilisée par la communauté les poussant là où les données manquent. Remarquer qu'une route spécifique est manquante ou erronée pousse à l'idée de plagiat. Cela fait partie d'une zone grise de la loi qu'il est préférable d'éviter en bannissant entièrement l'utilisation de données propriétaires.
De ce fait il est déconseillé d'utiliser des cartes existantes pour mesurer la complétude d'OpenStreetMap. Ce qui pose un défi de taille. Comment mesurer la complétude ? Dans les liens sus-cités, de multiples méthodes sont décrites en utilisant plus ou moins des données ouvertes.
Voir aussi
- Research pour les documents scientifiques
- Stats pour les données statistiques
- Quality Assurance pour des outils de suivi
- List of OSM-based services pour la comparaison de cartes