FR:France/Base Adresses Nationale Ouverte (BANO)

From OpenStreetMap Wiki
Jump to navigation Jump to search
Plaque-adresse-42.jpg

La Base Adresses Nationale Ouverte (BANO) est une initiative d’OpenStreetMap France. Elle a pour objet la constitution d’une base libre la plus complète possible de points d’adresse à l’échelle de la France. Vous trouverez sur cette page les accès aux différentes problématiques soulevées par la constitution d’une base d’adresses.

Son propos principal, dans un premier temps, est de rendre accessible, sur la couverture la plus large (a minima toutes les communes vectorielles du cadastre), la réalisation d'opérations de géocodage (quelle position correspond à cette adresse) et de géocodage inversé (quelle(s) adresse(s) correspond(ent) à cette position) et leur réutilisation dans des outils et bases de données libres dont OpenStreetMap.

Il n’y a pas à ce stade de prétention de couvrir en sachant les distinguer les adresses au pas de porte, à la boîte aux lettres, au point d’accès piéton et au point d’accès pour automobile. Il y a suffisamment peu de matière combinant ces nuances aujourd’hui pour que le propos de la BANO soit centré sur un besoin "primaire" de fournir un point par adresse.

Attention : ne pas confondre BANO (initiative libre d’OpenStreetMap France) avec la BAN (partenariat entre l’IGN, La Poste, l’État notamment pour ses administrations fiscales, et OpenStreetMap France pour coordonner les efforts de constitution, de maintien et de convergence d’un référentiel commun entre les différents acteurs ayant constitué chacun leur base d’adresses, mais avec encore des différences d’usage selon leurs besoins propres). Sur le forum de GéoRézo une explication détaillée de ce qu’est la BAN, par son coordinateur technique. Contrairement à BANO, le référentiel de la BAN n’est pas directement importable dans OpenStreetMap.


Tâches actuelles pour les contributeurs

Voir la page dédiée Contribuer à la BANO.

Mode de constitution (macro)

Sources

BANO v1

Jusqu'en 2019, trois types de sources sont sollicités pour constituer la BANO :

  • les adresses fournies en Open Data (liste complète ici)
  • les adresses présentes dans OSM
  • les adresses présentes dans le cadastre vectoriel

BANO v2

À partir de 2019 (11 novembre), la mise à disposition des données ayant évolué (arrêt du Cadastre et des Open-data, arrivée de BALs et BAN) au fil du temps, les types de sources sollicitées sont :

  • les adresses présentes dans OSM
  • les adresses présentes dans la Base Adresses Nationale (BAN)
  • les adresses présentes dans des Bases Adresses Locales (BAL)

On peut ainsi retrouver dans les fichiers départementaux de BANO (https://bano.openstreetmap.fr/data/) la source des adresses en fonction de la codification suivante :

  • OSM = noms et numéros issus d'OSM
  • O+O (Open Data+ OSM) = nom issu d'OSM, numéro issu d'une BAL
  • OD = nom et numéro issus d'une BAL
  • C+O (Cadastre + OSM) = numéro issu de la BAN et nom issu d'OSM
  • CAD (Cadastre) = numéro et nom issus de la BAN

Licence du résultat

La base de données composite résultante est proposée sous licence ODbL (nécessaire vu la présence de données issues d'OSM donc sous licence ODbL ainsi que certaines données adresse en opendata elles aussi sous licence ODbL).

Toutes les sources utilisées doivent donc être compatibles avec l'ODbL.

Règles de priorités entre sources

  1. Source prioritaire par défaut : les adresses présentes dans OSM, en gérant les différents formalismes : relations ou tags, sur node, sur way, sur relation multipolygon. Une adresse sans inclusion dans une relation et sans tag addr:street n'est pas exploitable. Penser à dédoublonner lorsque plusieurs POIs (shop, amenity, entrance) ont chacun un tag addr:housenumber (par exemple, transformer le tag addr:housenumber=* en contact:housenumber=* [1].)
  2. Source secondaire : les adresses des (BAL)
  3. Source complémentaire (= source "à défaut") : les adresses de la BAN

OSM est mis comme source primaire pour permettre de prendre en compte les corrections collaboratives qui y seront faites. C'est aussi le moyen d'accélérer l'intégration des données adresses au sein d'OSM.

Dans la constitution du jeu de données France, un système de white-list doit permettre d'indiquer, quel-qu’en soit la raison, la priorité d'une source sur les autres dans une commune, une voie voire une adresse donnée.

Modèle de données

Adresse avec numéro

Une adresse comportant un numéro devra a minima contenir les informations suivantes :

  • longitude
  • latitude
  • numéro
  • voie
  • code FANTOIR de la voie
  • commune
  • code INSEE de la commune
  • code postal de l'adresse

Il faut prévoir en information additionnelle les notions de :

  • hameau / lieu-dit
  • résidence / cité
  • quartier
  • bureau distributeur (par exemple cas particulier des codes postaux 94100/94210 même commune St-Maur des Fossés, mais 94210 La Varenne St Hilaire).

comme attributs optionnels (compléments d'adresse).

Dans la mesure où chaque numéro d'une voie donnée n'est présent qu'une seule fois dans toute la base, la combinaison code INSEE+code FANTOIR+numéro est unique et peut donc assurer le rôle d'identifiant pour l'adresse. Cette logique ne s'applique pas uniformément : certaines voies ne trouvent pas de correspondance dans FANTOIR (au moins dans un premier temps).

Adresse au lieu-dit

Le modèle doit reprendre la même structure que pour les adresses au numéro. À voir si un distinguo (de stockage) est même nécessaire entre les deux.

Dans la mesure du possible, les lieux-dits seront traités sous forme surfacique et non ponctuelle.

Cependant il est difficile de savoir sur quelles parcelles les lieux dits portent. Quand ils sont utilisés comme adresse, la propriété construite qui utilise cette adresse chevauche souvent d'anciennes parcelles subdivisées et reprend pour elle seul le nom du lieu-dit tandis qu'un voisin a choisi un nom de lieu-dit différent et l'a fait enregistrer lui aussi. Mais le cadastre ne porte en surfacique que les numéros de parcelles, et ne délimite pas les lieux dits. Les communes peuvent aussi reprendre pour elle des lieux-dits et faire leurs propres groupement de parcelles par exemple pour désigner un ensemble de parcelles à batir et lotir. Ce nom apparait alors modifié, mais ne sera pas repris ensuite par tous les occupants du lotissement, la commune se contentant souvent uniquement de nommer la voirie publique en prenant tout ou partie du nom du lieu-dit, augmenté éventuellement d'un mot générique (rue, chemin, allée...).
La seule chose vérifiable pour l'instant dans le cadastre est une information ponctuelle. Et dans les zones agricoles on trouve des tas d'anciens lieux dits qui ne correspondent plus aux limites des champs et exploitation, des noms d'anciens étangs/mares/bois qui n'existent plus avec un remembrement qui efface les anciennes limites (qui n'existent plus que sur le papier dans le plan cadastral sans les distinguer des limites du nouveau découpage parcellaire). Pour la localisation sur le terrain des adresses de toute façon on est déjà amené à positionner des noeuds d'adresse pour les numéros, rarement les batiments et leurs dépendances: on se fie juste aux frontières visibles sur le terrain pour en déduire que cela s'applique aux zones autour de ce point inscrites dans ces limites visibles (clotures, murs, fossés, voirie publique...).
Et il ne s'agit pas d'intégrer non plus l'ensemble du parcellaire dont des tas de frontières ne correspondent plus à rien de matérialisable sur le terrain et peuvent couper un même logement en deux avec des fragments difformes. La France est terriblement morcellée dans le cadastre, qui n'a pas revu la recomposition des parcelles remembrées pour tenir compte de leur occupation réelle.

Code postal

Le code postal de chaque adresse est relativement simple à renseigner dans toutes les communes à code postal unique. Il sera plus compliqué de le renseigner avec pertinence dans les communes pluri-distribuées : ce chantier doit avancer dans OSM en parallèle, autant que possible.

Métadonnées à prévoir attachées à chaque adresse

  • identifiant de l'objet dans la source : pas toujours disponible, notamment dans le cadastre. Ce sera l'OSM id pour la source OSM, et, en priorité, un identifiant issu des sources Open Data.
  • date d'inclusion dans le jeu de données courant (date d'intégration)

Avancement

  • 2013-10-22 : Première annonce d'un outil d'extraction d'adresses : des scripts à exécuter localement
  • 2014-01-03 : Accès aux scripts via une page web
  • 2014-02-26 : Annonce du service web de pré-intégration des adresses
  • 2014-05-08 : Test des scripts de collecte automatique
  • 2014-05-10 : Rendu 'BANO' disponible
  • 2014-05-13 : Tableau d'avancement
  • 2014-05-14 : Premier fichier expérimental publié
  • 2014-05-19 : 60 départements publiés (encore expérimental)
  • 2014-05-21 : 75 % des départements traités
  • 2014-05-23 : compte à rebours des 10 derniers département à traiter
  • 2014-04-23 : publication au format .csv sur Github
  • 2014-05-24 : première publication du jeu de données complet sur data.gouv.fr
  • 2014-06-21 : seuil des 15 millions d'adresses dédoublonnées et disponibles
  • 2014-06-27 : seuil des 600K voies rapprochées OSM <-> Cadastre
  • 2014-11-21 : le nombre de voies non rapprochées passe sous les 400K
  • 2014-12-17 : le nombre de voies rapprochées dépasse les 700K
  • 2015-05-23 : le nombre de voies rapprochées dépasse les 800K
  • 2016-02-09 : le nombre de voies rapprochées dépasse les 900K, celles des voies non-rapprochées est à 245K
  • 2017-10-01 : le nombre de voies rapprochées dépasse les 1M, celles des voies non-rapprochées est à 160K
  • 2019-07-05 : le nombre de voies rapprochées dépasse les 1M, celles des voies non-rapprochées est à 146K
  • 2019-11-11 : Annonce de Bano V2
  • 2020-11-11 : Annonce de la disponibilité du rendu Bano V2 (voir ci-dessous)
  • 2023-06-11 : Annonce de la V3 de Pifomètre
  • 2023-08-11 : La V3 est en production

Pour suivre l'état des rapprochements: Munin OpenStreetMap (cassé)

Rendu BANO

Rendu BANO en France métropolitaine : exemple des premiers cumuls en Île-de-France au 10 mai 2014 :

BANO-premiers-pas.png

Légende

Pour les points d'adresse :

● nº ou lieu-dit vert : adresse présente dans OSM avec un rapprochement avec FANTOIR ;
● nº ou lieu-dit orangé : adresse disponible en open data ; cette adresse peut exister (ou pas) dans OSM avec son point vert, elle ne fait l'objet d'aucun rapprochement par la BANO, mais devrait correspondre à une adresse dans FANTOIR (en bleu si elle est rapprochée dans OSM sinon en rouge) : la source open data et du FANTOIR est normalement la même collectivité locale, avec juste des écarts temporaires de mises à jour) ;
● nº ou lieu-dit bleu : adresse issue de la BAN rapprochée dans OSM avec un numéro, ou bien nommée avec un place=locality pour les lieux-dits inhabités (nom indiqué en italique), ou avec un place=isolated_dwelling pour les lieux-dits habités (nom indiqué en gras) ; un autre point vert devrait situer l'adresse présente dans OSM au même endroit ou à une position très proche.
● nº ou lieu-dit rouge : adresse issue de la BAN sans rapprochement avec un highway=* dans OSM (soit la route n'est pas tracée, soit elle ne porte pas de nom ou un nom trop éloigné de celui présent dans la BAN), ni avec un place=locality pour les lieux-dits inhabités (nom indiqué en italique), ni avec avec un place=isolated_dwelling ou place=farm pour les lieux-dits habités ou les fermes isolées (nom indiqué en gras) ;
Noter que le traitement BANO actuellement ne rapproche pas encore les nombreux lieux-dits inhabités et qui sont signalés en rouge et italique par le rendu BANO (voir ci-dessous), alors qu'ils sont présents dans OSM sous forme de natural=*, landuse=* ou water=* tels que les noms de sommets/falaises, bois/champs, étangs/mares, etc. et même souvent visibles sur les rendus cartographiques habituels pour le fond de carte sélectionné séparément de la couche superposée BANO décrite ici.
Cependant, quand ces lieux sont présents dans OSM sous forme de nœuds, ces nœuds OSM sont également affichés (uniquement avec leur nom et leur identifiant FANTOIR en noir).

Le rendu "BANO" montre toutes les adresses disponibles, les vertes (OSM) étant dessinées par-dessus les orangées (open data), elles même dessinées par-dessus les rouges/bleues (BAN).

Pour les voies (géolocalisées sur leur tracé par un nœud plus ou moins central mais qui n'est pas un point d'adresse) :

● nom de voie noir : voie nommée dans OSM mais sans correspondance dans FANTOIR
● nom de voie grisé : voie signalée dans http://bano.openstreetmap.fr/fantoir comme comportant ou étant une erreur dans FANTOIR.
● filaire de voie et noms présents dans la BD Topo de l'IGN : à utiliser comme une source de plus pour se repérer et confirmer les noms !

Pour faciliter le repérage des adresses de la BAN non rapprochées des noms de voies présents dans OpenStreetMap, celles-ci sont entourées :

en continu et nommées en rouge : ensemble d'adresses sur des voies provenant de la BAN ;
en continu et nommées en gris : ensemble d'adresses sur des voies provenant de la BAN avec une remontée d'erreur sur http://cadastre.openstreetmap.fr/fantoir (le nom de voie présent dans OSM peut être différent et correct). Parfois le cadastre mentionne lui-même plusieurs graphies différentes entre ses planches et ses tables d'index de noms de voies (par exemple, trait d'union, espace ou fusion, abréviations différentes, noms tronqués, noms modifiés récemment)

Utilisation

Utilisation dans un éditeur :


Visualisation directe dans un navigateur web :

  • sur le serveur web Layers d'OpenStreetMap France (layers.openstreetmap.fr) : cocher la case devant BANO - Couverture dans le panneau en haut à droite de la carte (on peut le fermer et l'ouvrir avec le bouton bleu ou en haut du panneau), ce calque BANO s'affiche alors en transparence au dessus d'un fond de carte générique (lui-même sélectionnable par les boutons radio en haut du panneau) — navigation basée sur le framework JavaScript OpenLayers.

Lieux-dits dans le rendu BANO

Les lieux-dits extraits à partir du cadastre sont visibles sur le rendu BANO depuis mi-septembre 2014. Ceux-ci sont encore très expérimentaux et n'ont été ajouté au rendu que pour avoir un retour sur cette première extraction.

Il est pour l'instant préférable de ne pas utiliser ceux-ci pour compléter les données OSM.

Les noms en gras correspondent aux lieux-dits considérés comme habités dans le fichier FANTOIR.

Formats et lotissement du produit

Fichiers téléchargeables

Les données BANO sont disponibles en 4 formats :

  • fichiers CSV
  • fichiers JSON
  • fichiers shapefile (WGS84)
  • fichiers RDF (turtle)

Les données sont disponibles département par département sur https://bano.openstreetmap.fr/data/

Services associés pour les contributeurs OSM

Ils sont accessibles depuis la page Contribuer à la Bano.

Services dérivés pour toutes utilisations

Services expérimentaux de géocodage utilisant les données BANO

Outil de comparaison de géocodage (différents algorithmes et base de données adresses)

Communication

La BANO n'est pas un produit dérivé uniquement du contenu de la base OpenStreetMap.

Il peut être opportun de communiquer sur cette initiative directement sur son nom, quitte à rappeler le lien avec OpenStreetMap à chaque communication. Les domaines 'projet-bano.org' et 'projet-bano.fr' sont par exemple disponibles.

Canaux de discussion

Articles au sujet de BANO

Notes

Voir aussi