WikiProject France/WikiProject Base Adresses Nationale Ouverte (BANO)

From OpenStreetMap Wiki
Jump to: navigation, search
Plaque-adresse-42.jpg

La Base Adresses Nationale Ouverte (BANO) est une initiative d'OpenStreetMap France. Elle a pour objet la constitution d'une base la plus complète possible de points d'adresse à l'échelle de la France. Vous trouverez sur cette page les accès aux différentes problématiques soulevées par la constitution d'une base "Adresses".

Ne pas confondre BANO (initiative d'OpenStreetMap France) avec la BAN (partenariat entre l'IGN, La Poste, l'État et OpenStreetMap France).

La BANO

La Base Adresses Nationale Ouverte (BANO) est une initiative d'OpenStreetMap France. Elle a pour objet la constitution d'une base la plus complète possible de points d'adresse à l'échelle de la France.

Son propos principal, dans un premier temps, est de rendre accessible, sur la couverture la plus large (a minima toutes les communes vectorielles du cadastre), la réalisation d'opérations de géocodage (quelle position correspond à cette adresse) et de géocodage inversé (quelle(s) adresse(s) correspond(ent) à cette position).

Il n'y a pas à ce stade de prétention de couvrir en sachant les distinguer les adresses au pas de porte, à la boîte aux lettres, au point d'accès piéton et au point d'accès pour automobile. Il y a suffisamment peu de matière combinant ces nuances aujourd'hui pour que le propos de la BANO soit centré sur un besoin "primaire" de fournir un point par adresse.

Pour mieux comprendre BANO, vous pouvez aussi lire:

Tâches actuelles pour les contributeurs

Voir la page dédiée Contribuer à la BANO.

Mode de constitution (macro)

Sources

Trois types de sources sont sollicités pour constituer la BANO :

  • les adresses fournies en Open Data (liste complète ici)
  • les adresses présentes dans OSM
  • les adresses présentes dans le cadastre vectoriel

Licence du résultat

La base de données composite résultante est proposée sous licence ODbL (nécessaire vu la présence de données issues d'OSM donc sous licence ODbL ainsi que certaines données adresse en opendata elles aussi sous licence ODbL).

Toutes les sources utilisées doivent donc être compatibles avec l'ODbL.

Règles de priorités entre sources

  1. Source prioritaire par défaut : les adresses présentes dans OSM, en gérant les différents formalismes : relations ou tags, sur node, sur way, sur relation multipolygon. Une adresse sans inclusion dans une relation et sans tag addr:street n'est pas exploitable. Penser à dédoublonner lorsque plusieurs POIs (shop, amenity, entrance) ont chacun un tag addr:housenumber (par exemple, transformer le tag addr:housenumber=* en contact:housenumber=* [1].)
  2. Source secondaire : les jeux de données OpenData d'adresse existants (en faire l'inventaire ci-dessous avec liens de téléchargement).
  3. Source complémentaire (= source "à défaut") : les adresses du cadastre sur les communes vectorielles.

OSM est mis comme source primaire pour permettre de prendre en compte les corrections collaboratives qui y seront faites. C'est aussi le moyen d'accélérer l'intégration des données adresses au sein d'OSM.

Dans la constitution du jeu de données France, un système de white-list doit permettre d'indiquer, quel-qu’en soit la raison, la priorité d'une source sur les autres dans une commune, une voie voire une adresse donnée.

Modèle de données

Adresse avec numéro

Une adresse comportant un numéro devra a minima contenir les informations suivantes :

  • longitude
  • latitude
  • numéro
  • voie
  • code FANTOIR de la voie
  • commune
  • code INSEE de la commune
  • code postal de l'adresse

Il faut prévoir en information additionnelle les notions de :

  • hameau / lieu-dit
  • résidence / cité
  • quartier
  • bureau distributeur (par exemple cas particulier des codes postaux 94100/94210 même commune St-Maur des Fossés, mais 94210 La Varenne St Hilaire).

comme attributs optionnels (compléments d'adresse).

Dans la mesure où chaque numéro d'une voie donnée n'est présent qu'une seule fois dans toute la base, la combinaison code INSEE+code FANTOIR+numéro est unique et peut donc assurer le rôle d'identifiant pour l'adresse. Cette logique ne s'applique pas uniformément : certaines voies ne trouvent pas de correspondance dans FANTOIR (au moins dans un premier temps).

Adresse au lieu-dit

Le modèle doit reprendre la même structure que pour les adresses au numéro. À voir si un distinguo (de stockage) est même nécessaire entre les deux.

Dans la mesure du possible, les lieux-dits seront traités sous forme surfacique et non ponctuelle.

Cependant il est difficile de savoir sur quelles parcelles les lieux dits portent. Quand ils sont utilisés comme adresse, la propriété construite qui utilise cette adresse chevauche souvent d'anciennes parcelles subdivisées et reprend pour elle seul le nom du lieu-dit tandis qu'un voisin a choisi un nom de lieu-dit différent et l'a fait enregistrer lui aussi. Mais le cadastre ne porte en surfacique que les numéros de parcelles, et ne délimite pas les lieux dits. Les communes peuvent aussi reprendre pour elle des lieux-dits et faire leurs propres groupement de parcelles par exemple pour désigner un ensemble de parcelles à batir et lotir. Ce nom apparait alors modifié, mais ne sera pas repris ensuite par tous les occupants du lotissement, la commune se contentant souvent uniquement de nommer la voirie publique en prenant tout ou partie du nom du lieu-dit, augmenté éventuellement d'un mot générique (rue, chemin, allée...).
La seule chose vérifiable pour l'instant dans le cadastre est une information ponctuelle. Et dans les zones agricoles on trouve des tas d'anciens lieux dits qui ne correspondent plus aux limites des champs et exploitation, des noms d'anciens étangs/mares/bois qui n'existent plus avec un remembrement qui efface les anciennes limites (qui n'existent plus que sur le papier dans le plan cadastral sans les distinguer des limites du nouveau découpage parcellaire). Pour la localisation sur le terrain des adresses de toute façon on est déjà amené à positionner des noeuds d'adresse pour les numéros, rarement les batiments et leurs dépendances: on se fie juste aux frontières visibles sur le terrain pour en déduire que cela s'applique aux zones autour de ce point inscrites dans ces limites visibles (clotures, murs, fossés, voirie publique...).
Et il ne s'agit pas d'intégrer non plus l'ensemble du parcellaire dont des tas de frontières ne correspondent plus à rien de matérialisable sur le terrain et peuvent couper un même logement en deux avec des fragments difformes. La France est terriblement morcellée dans le cadastre, qui n'a pas revu la recomposition des parcelles remembrées pour tenir compte de leur occupation réelle.

Code postal

Le code postal de chaque adresse est relativement simple à renseigner dans toutes les communes à code postal unique. Il sera plus compliqué de le renseigner avec pertinence dans les communes pluri-distribuées : ce chantier doit avancer dans OSM en parallèle, autant que possible.

Métadonnées à prévoir attachées à chaque adresse

  • identifiant de l'objet dans la source : pas toujours disponible, notamment dans le cadastre. Ce sera l'OSM id pour la source OSM, et, en priorité, un identifiant issu des sources Open Data.
  • date d'inclusion dans le jeu de données courant (date d'intégration)

Avancement

  • 2013-10-22 : Première annonce d'un outil d'extraction d'adresses : des scripts à exécuter localement
  • 2014-01-03 : Accès aux scripts via une page web
  • 2014-02-26 : Annonce du service web de pré-intégration des adresses
  • 2014-05-08 : Test des scripts de collecte automatique
  • 2014-05-10 : Rendu 'BANO' disponible
  • 2014-05-13 : Tableau d'avancement
  • 2014-05-14 : Premier fichier expérimental publié
  • 2014-05-19 : 60 départements publiés (encore expérimental)
  • 2014-05-21 : 75 % des départements traités
  • 2014-05-23 : compte à rebours des 10 derniers département à traiter
  • 2014-04-23 : publication au format .csv sur Github
  • 2014-05-24 : première publication du jeu de données complet sur data.gouv.fr
  • 2014-06-21 : seuil des 15 millions d'adresses dédoublonnées et disponibles
  • 2014-06-27 : seuil des 600K voies rapprochées OSM <-> Cadastre
  • 2014-11-21 : le nombre de voies non rapprochées passe sous les 400K
  • 2014-12-17 : le nombre de voies rapprochées dépasse les 700K
  • 2015-05-23 : le nombre de voies rapprochées dépasse les 800K
  • 2016-02-09 : le nombre de voies rapprochées dépasse les 900K, celles des voies non-rapprochées est à 245K

Pour suivre l'état des rapprochements: Munim OpenStreetMap

Rendu BANO

Exemple de rendu des premiers cumuls au 10 mai 2014 :

BANO-premiers-pas.png

Légende

Pour les points d'adresse :

● nº ou lieu-dit vert : adresse présente dans OSM avec un rapprochement avec FANTOIR ;
● nº ou lieu-dit orangé : adresse disponible en open data ; cette adresse peut exister (ou pas) dans OSM avec son point vert, elle ne fait l'objet d'aucun rapprochement par la BANO, mais devrait correspondre à une adresse dans FANTOIR (en bleu si elle est rapprochée dans OSM sinon en rouge) : la source open data et du FANTOIR est normalement la même collectivité locale, avec juste des écarts temporaires de mises à jour) ;
● nº ou lieu-dit mauve : adresse présente dans OSM mais sans rapprochement avec FANTOIR (différence de nom, ou adresse inexistante actuellement dans FANTOIR pour les toutes nouvelles rues) ;
● nº ou lieu-dit bleu : adresse issue du cadastre rapprochée dans OSM avec un numéro, ou bien nommée avec un place=locality pour les lieux-dits inhabités (nom indiqué en italique), ou avec un place=isolated_dwelling pour les lieux-dits habités (nom indiqué en gras) ; un autre point vert devrait situer l'adresse présente dans OSM au même endroit ou à une position très proche.
● nº ou lieu-dit rouge : adresse issue du cadastre sans rapprochement avec un highway=* dans OSM (soit la route n'est pas tracée, soit elle ne porte pas de nom ou un nom trop éloigné de celui du cadastre), ni avec un place=locality pour les lieux-dits inhabités (nom indiqué en italique), ni avec avec un place=isolated_dwelling ou place=farm pour les lieux-dits habités ou les fermes isolées (nom indiqué en gras) ;
Noter que le traitement BANO actuellement ne rapproche pas encore les nombreux lieux-dits inhabités issus du cadastre et qui sont signalés en rouge et italique par le rendu BANO (voir ci-dessous), alors qu'ils sont présents dans OSM sous forme de natural=*, landuse=* ou water=* tels que les noms de sommets/falaises, bois/champs, étangs/mares, etc. et même souvent visibles sur les rendus cartographiques habituels.
● nº ou lieu-dit gris : adresse de la BAN (en italique les "pseudo" adresses : numéros 0 ou supérieurs à 5000) ;

Le rendu "BANO" montre toutes les adresses disponibles, les vertes (OSM) étant dessinées par-dessus les orangées (open data), elles même dessinées par-dessus les bleu/rouge (cadastre) et par-dessus les grises (BAN).

Pour les voies (géolocalisées sur leur tracé par un nœud plus ou moins central mais qui n'est pas un point d'adresse) :

● nom de voie bleu ciel : voie sans adresse rapprochée avec FANTOIR (dans OSM ne figurera que la voie, souvent un chemin ou sentier pédestre, mais aucun nœud d'adresse) ;
● nom de voie grisé : voie signalée dans http://cadastre.openstreetmap.fr/fantoir comme comportant ou étant une erreur dans FANTOIR.

Pour faciliter le repérage des adresses du cadastre non rapprochées des noms de voies présents dans OpenStreetMap, celles-ci sont entourées :

en continu et nommées en rouge : ensemble d'adresses sur des voies provenant du cadastre ;
en continu et nommées en gris : ensemble d'adresses sur des voies provenant du cadastre avec une remontée d'erreur sur http://cadastre.openstreetmap.fr/fantoir (le nom de voie présent dans OSM peut être différent et correct). Parfois le cadastre mentionne lui-même plusieurs graphies différentes entre ses planches et ses tables d'index de noms de voies (par exemple, trait d'union, espace ou fusion, abréviations différentes, noms tronqués, noms modifiés récemment).

Pour les adresses provenant de la BAN non rapprochées aux noms de voies dans OpenStreetMap, celles-ci sont entourées :

en pointillé et nommées en rouge et italique : ensembles d'adresses sur des voies de la BAN ayant pu être rapprochées de FANTOIR, mais pas dans OSM, le numéro de référence FANTOIR est indiqué (entre **astériques**) sous le libellé de la voie non rapprochée (il peut s'agir d'une différence de nom avec celui présent dans OSM) ;
en pointillé et nommées en gris et italique : ensembles d'adresses sur des voies de la BAN n'ayant pas pu être rapprochées de FANTOIR, ni dans OSM (avant de corriger un nom de voie déjà présent dans OSM, vérifier sur http://cadastre.openstreetmap.fr/fantoir/ s'il ne s'agit pas d'une incohérence de nom ou d'une erreur du cadastre ou du FANTOIR, à signaler).

Utilisation

Le rendu BANO peut être visualisé comme une imagerie dans un éditeur avec cette adresse :
http://{switch:a,b,c}.layers.openstreetmap.fr/bano/{zoom}/{x}/{y}.png

Utilisation dans un éditeur :

  • dans JOSM (recommandé) : menu Imagerie > Préférences d'imagerie, puis ajouter un flux tms (le niveau de zoom maximum est 20) ;
  • dans ID : bouton Paramètres du fond de carte (dans le menu de droite), cocher Personnalisé, puis renseigner l'adresse.

Visualisation directe dans un navigateur web :

  • sur le serveur web Layers d'OpenStreetMap France (layers.openstreetmap.fr) : cocher la case devant BANO - Couverture dans le panneau en haut à droite de la carte (on peut le fermer et l'ouvrir avec le bouton bleu - ou +), ce calque BANO s'affiche alors en transparence au dessus d'un fond de carte générique (lui-même sélectionnable par les boutons radio en haut du panneau) — navigation basée sur le framework JavaScript OpenLayers ;
  • sur le serveur web Tile d'OpenStreetMap France (tile.openstreetmap.fr/~cquest/leaflet/bano.html) : même possibilité — navigation basée sur le framework JavaScript Leaflet.

Lieux-dits dans le rendu BANO

Les lieux-dits extraits à partir du cadastre sont visibles sur le rendu BANO depuis mi-septembre 2014. Ceux-ci sont encore très expérimentaux et n'ont été ajouté au rendu que pour avoir un retour sur cette première extraction.

Il est pour l'instant préférable de ne pas utiliser ceux-ci pour compléter les données OSM.

Les noms en gras correspondent aux lieux-dits considérés comme habités dans le fichier FANTOIR.

Formats et lotissement du produit

Fichiers téléchargeables

Les données BANO sont disponibles en 3 formats :

  • fichiers CSV
  • fichiers shapefile (WGS84)
  • fichiers RDF (turtle)

Les données sont disponibles département par département sur http://bano.openstreetmap.fr/data/

Services dérivés

Services expérimentaux de géocodage utilisant les données BANO

Outil de comparaison de géocodage (différents algorithmes et base de données adresses)

Communication

La BANO n'est pas un produit dérivé uniquement du contenu de la base OpenStreetMap.

Il peut être opportun de communiquer sur cette initiative directement sur son nom, quitte à rappeler le lien avec OpenStreetMap à chaque communication. Les domaines 'projet-bano.org' et 'projet-bano.fr' sont par exemple disponibles.

Canaux de discussion

Articles au sujet de BANO

Notes

  1. Voir House numbers/Bremen Schema#Motivation