WikiProject France/WikiProject Base Adresses Nationale Ouverte (BANO)

From OpenStreetMap Wiki
< WikiProject France(Redirected from BANO)
Jump to: navigation, search
Plaque-adresse-42.jpg

La Base Adresses Nationale Ouverte (BANO) est une initiative d'OpenStreetMap France. Elle a pour objet la constitution d'une base la plus complète possible de points d'adresse à l'échelle de la France. Vous trouverez sur cette page les accès aux différentes problématiques soulevées par la constitution d'une base "Adresses" nationale.

La BANO

La Base Adresses Nationale Ouverte (BANO) est une initiative d'OpenStreetMap France. Elle a pour objet la constitution d'une base la plus complète possible de points d'adresse à l'échelle de la France.

Son propos principal, dans un premier temps, est de rendre accessible, sur la couverture la plus large (a minima toutes les communes vectorielles du cadastre), la réalisation d'opérations de géocodage (quelle position correspond à cette adresse) et de géocodage inversé (quelle(s) adresse(s) correspond(ent) à cette position).

Il n'y a pas à ce stade de prétention de couvrir en sachant les distinguer les adresses au pas de porte, à la boîte aux lettres, au point d'accès piéton et au point d'accès pour automobile. Il y a suffisamment peu de matière combinant ces nuances aujourd'hui pour que le propos de la BANO soit centré sur un besoin "primaire" de fournir un point par adresse.

Pour mieux comprendre BANO, vous pouvez aussi lire:

Tâches actuelles pour les contributeurs

Voir la page dédiée Contribuer à la BANO.

Mode de constitution (macro)

Sources

3 types de sources sont sollicités pour constituer la BANO :

  • les adresses fournies en Open Data (liste complète ici)
  • les adresses présentes dans OSM
  • les adresses présentes dans le cadastre vectoriel

Licence du résultat

La base de données composite résultante est proposée sous licence ODbL (nécessaire vu la présence de données issues d'OSM donc sous licence ODbL ainsi que certaines données adresse en opendata elles aussi sous licence ODbL).

Toutes les sources utilisées doivent donc être compatibles avec l'ODbL.

Règles de priorités entre sources

  1. Source prioritaire par défaut: les adresses présentes dans OSM, en gérant les différents formalismes : relations ou tags, sur node, sur way, sur relation multipolygon. Une adresse sans inclusion dans une relation et sans tag addr:street n'est pas exploitable. Penser à dédoublonner lorsque plusieurs POIs (shop, amenity, entrance) ont chacun un tag addr:housenumber (par exemple, transformer le tag addr:housenumber=* en contact:housenumber=* [1].)
  2. Source secondaire : les jeux de données OpenData d'adresse existants (en faire l'inventaire ci-dessous avec liens de téléchargement).
  3. Source complémentaire (= source "à défaut") : les adresses du cadastre sur les communes vectorielles.

OSM est mis comme source primaire pour permettre de prendre en compte les corrections collaboratives qui y seront faites. C'est aussi le moyen d'accélérer l'intégration des données adresses au sein d'OSM.

Dans la constitution du jeu de données France, un système de white-list doit permettre d'indiquer, quel-qu’en soit la raison, la priorité d'une source sur les autres dans une commune, une voie voire une adresse donnée.

Modèle de données

Adresse avec numéro

Une adresse comportant un numéro devra a minima contenir les informations suivantes :

  • longitude
  • latitude
  • numéro
  • voie
  • code FANTOIR de la voie
  • commune
  • code INSEE de la commune
  • code postal de l'adresse

Il faut prévoir en information additionnelle les notions de :

  • hameau / lieu-dit
  • résidence / cité
  • quartier
  • bureau distributeur (par exemple cas particulier des codes postaux 94100/94210 même commune St-Maur des Fossés, mais 94210 La Varenne St Hilaire).

comme attributs optionnels (compléments d'adresse).

Dans la mesure où chaque numéro d'une voie donnée n'est présent qu'une seule fois dans toute la base, la combinaison code INSEE+code FANTOIR+numéro est unique et peut donc assurer le rôle d'identifiant pour l'adresse. Cette logique ne s'applique pas uniformément : certaines voies ne trouvent pas de correspondance dans FANTOIR (au moins dans un premier temps).

Adresse au lieu-dit

Le modèle doit reprendre la même structure que pour les adresses au numéro. À voir si un distinguo (de stockage) est même nécessaire entre les deux.

Dans la mesure du possible, les lieux-dits seront traités sous forme surfacique et non ponctuelle.

Code postal

Le code postal de chaque adresse est relativement simple à renseigner dans toutes les communes à code postal unique. Il sera plus compliqué de le renseigner avec pertinence dans les communes pluri-distribuées : ce chantier doit avancer dans OSM en parallèle, autant que possible.

Métadonnées à prévoir attachées à chaque adresse

  • identifiant de l'objet dans la source : pas toujours disponible, notamment dans le cadastre. Ce sera l'OSM id pour la source OSM, et, en priorité, un identifiant issu des sources Open Data.
  • date d'inclusion dans le jeu de données courant (date d'intégration)

Avancement

  • 2013-10-22 : Première annonce d'un outil d'extraction d'adresses : des scripts à exécuter localement
  • 2014-01-03 : Accès aux scripts via une page web
  • 2014-02-26 : Annonce du service web de pré-intégration des adresses
  • 2014-05-08 : Test des scripts de collecte automatique
  • 2014-05-10 : Rendu 'BANO' disponible
  • 2014-05-13 : Tableau d'avancement
  • 2014-05-14 : Premier fichier expérimental publié
  • 2014-05-19 : 60 départements publiés (encore expérimental)
  • 2014-05-21 : 75 % des départements traités
  • 2014-05-23 : compte à rebours des 10 derniers département à traiter
  • 2014-04-23 : publication au format .csv sur Github
  • 2014-05-24 : première publication du jeu de données complet sur data.gouv.fr
  • 2014-06-21 : seuil des 15 millions d'adresses dédoublonnées et disponibles
  • 2014-06-27 : seuil des 600K voies rapprochées OSM <-> Cadastre
  • 2014-11-21 : le nombre de voies non rapprochées passe sous les 400K
  • 2014-12-17 : le nombre de voies rapprochées dépasse les 700K
  • 2015-05-23 : le nombre de voies rapprochées dépasse les 800K
  • 2016-02-09 : le nombre de voies rapprochées dépasse les 900K, celles des voies non-rapprochées est à 245K

Pour suivre l'état des rapprochements: Munim OpenStreetMap

Rendu BANO

Exemple de rendu des premiers cumuls au 10 mai 2014 :

BANO-premiers-pas.png

Légende

  • vert : adresse présente dans OSM
  • mauve: adresse présente dans OSM mais sans rapprochement avec FANTOIR (différence de nom ou inexistant actuellement dans FANTOIR pour les toutes nouvelles rues)
  • bleu : adresse issue du cadastre
  • rouge : adresse issue du cadastre sans rapprochement avec un highway=* dans OSM (soit la route n'est pas tracée, soit elle ne porte pas de nom ou un nom trop éloigné de celui du cadastre)
  • orangé : adresse disponible en opendata
  • gris: adresse de la BAN (en italique les "pseudo" adresses: numéros 0 ou supérieurs à 5000)
  • bleu ciel: voie sans adresse rapprochée avec FANTOIR
  • nom grisé: voie signalée dans http://cadastre.openstreetmap.fr/fantoir comme comportant ou étant une erreur dans FANTOIR

Le rendu "BANO" montre toutes les adresses disponibles, les vertes (OSM) étant dessinées par-dessus les orangées (opendata) elles même dessinées par-dessus les bleu/rouge (cadastre) et par-dessus les grises (BAN).

Pour faciliter le repérage des adresses non rapprochées des noms de voies présents dans OpenStreetMap, celles-ci sont entourées:

Pour les adresses provenant de la BAN, sont indiquées:

  • en pointillé rouge: celles ayant pu être rapprochées de FANTOIR, mais absentes d'OSM
  • en pointillé gris: celles n'ayant pas pu être rapprochées de FANTOIR

Utilisation pour éditer

Le rendu BANO peut être visualisé comme une imagerie dans un éditeur avec cette adresse :
http://{switch:a,b,c}.layers.openstreetmap.fr/bano/{zoom}/{x}/{y}.png

  • dans JOSM (recommandé) : menu Imagerie > Préférences d'imagerie, puis ajouter un flux tms (le niveau de zoom maximum est 20) ;
  • dans ID : bouton Paramètres du fond de carte (dans le menu de droite), cocher Personnalisé, puis renseigner l'adresse.

Lieux-dits dans le rendu BANO

Les lieux-dits extraits à partir du cadastre sont visibles sur le rendu BANO depuis mi-septembre 2014. Ceux-ci sont encore très expérimentaux et n'ont été ajouté au rendu que pour avoir un retour sur cette première extraction.

Il est pour l'instant préférable de ne pas utiliser ceux-ci pour compléter les données OSM.

Les noms en gras correspondent aux lieux-dits considérés comme habités dans le fichier FANTOIR.

Formats et lotissement du produit

Fichiers téléchargeables

Les données BANO sont disponibles en 3 formats :

  • fichiers CSV
  • fichiers shapefile (WGS84)
  • fichiers RDF (turtle)

Les données sont disponibles département par département sur http://bano.openstreetmap.fr/data/

Services dérivés

Services expérimentaux de géocodage utilisant les données BANO

Outil de comparaison de géocodage (différents algorithmes et base de données adresses)

Communication

La BANO n'est pas un produit dérivé uniquement du contenu de la base OpenStreetMap.

Il peut être opportun de communiquer sur cette initiative directement sur son nom, quitte à rappeler le lien avec OpenStreetMap à chaque communication. Les domaines 'projet-bano.org' et 'projet-bano.fr' sont par exemple disponibles.

Canaux de discussion

Articles au sujet de BANO

Notes

  1. Voir House numbers/Bremen Schema#Motivation