FR:Wikidata

From OpenStreetMap Wiki
Jump to navigation Jump to search

Wikidata est une base de connaissances libre et collaborative hébergée par la Wikimedia Foundation. Elle permet de centraliser les données utilisées par différents projets Wikimedia (Wikipédia, Wikivoyage...). De façon comparable à Wikipédia, Wikidata est un ensemble de déclarations sourcées, pas une source originale en elle-même.

Un des objectifs de Wikidata est aussi de gérer au mieux le multilinguisme.

Approches : OpenStreetMap versus Wikidata

Deux bases de données libres et collaborative d'objets dotés d'attributs clés / valeur
  • les objets Wikidata (nos noeuds, chemins, relations) sont appelés des éléments
  • les clés caractérisant les attributs (nos clés) sont appelées propriétés
  • les attributs clé=valeur (nos attributs) sont appelés déclarations.
  • les sources justifiant les données (nos source=*, source:name=*, source:addr=*, etc.), sont appelées des références et peuvent [devraient] être explicitées pour chaque déclaration, de façons structurées, elles aussi sous forme de multiples paires propriété=valeur.
De périmètres distincts partiellement recouvrants

Le périmètre de Wikidata est beaucoup plus large que celui d'OSM. Les éléments contenus dans la base de données Wikidata peuvent être, comme pour OpenStreetMap, des objets géolocalisables (un arbre remarquable, une commune française, une oeuvre murale de street-art, un monument architectural, ...).

Mais Wikidata contient de nombreux objets non présents dans OSM :

  • un très large ensemble d'objets non géolocalisables (un artiste connu, une publication de chercheur, une molécule à intérêt thérapeutique, un opérateur de télécommunications, une marque de chaîne alimentaire, un théorème mathématique, ...)
  • voire des concepts / classes (le concept de banc, le concept oeuvre d'art, le concept de personne humaine, de chat, de chien, ...).

Et de même, OSM contient de nombreux objets non présents dans Wikidat. En effet, comme Wikidata fait partie de la sphère Wikimedia Foundation, les objets (éléments) Wikidata sont considérés comme ayant un intérêt encyclopédique et les règles de création (admissibilité) sont plus strictes que celles de OSM (exigences de notoriété et de pertinence pérenne pour la connaissance). Là où OSM permet naturellement de créer le banc dans le parc en face de chez vous, Wikidata n'est pas prévu pour cela et, même si rien ne vous empêche de le faire (base de données collaborative), les autres contributeurs et les administrateurs ne laisseront pas longtemps cet élément (sauf à justifier, références fiables à l'appui, qu'il s'agit d'un banc à valeur par exemple historique).

Exemples d'objets géolocalisables présents dans les deux bases : l'Arbre de Diane, aux Clayes sous bois (OSM node 1762859863 et Wikidata Q630624) ou le sequoia géant américain General Sherman (OSM node 313753662 et Wikidata Q152482).

Toutes deux interrogeables par des API publiques 

Les objets Wikidata, dotés de déclarations structurées et sourcées, sont aisément interrogeables par une API ouverte (à comparer à notre FR:Overpass API) et un langage de requête manipulable par des logiciels ou des êtres humains (SPARQL, à rapprocher de notre Overpass QL). Ils sont mis à jour par les contributeurs mais également automatiquement par des robots inter bases de données (par exemple la population d'une commune peut être mise à jour automatiquement).

Ne pas confondre Wikidata avec Wikipédia

Wikidata contient des données provenant de nombreuses autres sources que Wikipédia. Beaucoup d'éléments Wikidata ont été initialement créés à partir de pages Wikipédia, mais les données ont pu être retravaillées dans Wikidata.

Les éléments Wikidata pointent vers des articles Wikipédia dans de nombreuses langues ; ces articles peuvent être assez différents les uns des autres. La richesse principale de Wikidata, ce sont les données que la base elle-même contient; ce n'est pas juste un raccourci vers le contenu de Wikipédia.


Lier OSM et Wikidata

Pourquoi ?

Dans “les cinq étoiles des données ouvertes”, Tim Berners-Lee a défini le plus haut niveau comme le fait de “relier votre donnée à d'autres données afin de fournir du contexte”. En insérant un ID Wikidata (que le logiciel interprète comme un URI) dans un objet OSM, on lie ce dernier à un objet sur Wikidata et de là, directement et indirectement, à plusieurs autres éléments Wikidata, et à des objets dans plusieurs autres systèmes. Cela fait d'OSM un élément du graphe de Linked Open Data plutôt qu'un système isolé.

Plus concrètement, cela permet à toute personne faisant une requête dans OSM de récupérer, à propos d'un objet OSM, des données supplémentaires, et des liens vers d'autres bases de données. Par exemple, il est envisageable de récupérer la population d'une ville, à l'époque actuelle ou à différents moments de son histoire, ou encore la date et le lieu de naissance, voire le portrait, de l'architecte d'un bâtiment, ou un lien vers un système fournissant le volume de précipitations de la semaine précédente dans une réserve naturelle.

À terme, cela pourrait aussi permettre la construction de requêtes complexes comme "tous les articles scientifiques écrits par des chercheurs nés dans ce village, triés par le nombre d'autres articles qui les citent".

Inclure des attributs Wikidata dans OSM permet aussi aux objets OSM d'être découverts et utilisés par d'autres systèmes, comme les Infobox sur Wikimedia Commons, etc. (voir la section sur les Utilisations).

Comment ?

Pointer de OSM vers Wikidata

Il est aisé d'insérer dans OSM des liens vers Wikidata via les attributs :

Objets OSM avec l'attribut wikidata=* :

ou avec l'attribut operator:wikidata=* :


Pointer de Wikidata vers OSM

Il est de même aisé d'insérer dans Wikidata des liens vers OSM. Fin 2025, Wikidata contenait 1 071 024 identifiants OSM (contre 100.000 début 2020). Les références OSM se font via des déclarations utilisant les propriétés :

Wikidata considérant parfois que les identifiabts OSM ne sont pas stables (voir plus bas), on ne trouve souvent que la propriété P625 (coordonnées géographiques), avec un affichage de carte OpenStreetMap.

Approche minimale

Chaque fois qu'un objet OSM a un équivalent clair dans Wikidata, ajouter l'attribut wikidata=* ne présente que des avantages. Il enrichit les informations sur l'objet avec une référence en général stable sans appauvrir OSM (tant qu'on ne profite pas de cet attribut pour en retirer d'autres, ce qui est un vrai sujet de débats (voir plus loin). Chaque fois qu'une valeur d'attribut OSM a un équivalent clair dans Wikidata, ajouter à l'attribut la sous-clé Wikidata ne présente également que des avantages.

Le cas le plus fréquent est celui des attributs operator=*, brand=*, network=* dont la sous-clé wikidata permet de rationaliser les recherches (API overpass). Par exemple, l'opérateur Q3269667 pourrait avec profit être ajouté (operator:wikidata=Q3269667) à tous les objets OSM contenant par exemple operator=Suez Eau France, operator=Lyonnaise des Eaux, operator=Lyonnaise des Eaux - MaVille, operator=Lyonnaise des Eaux de MaVille.

Il permet de même de simplifier les recherches en s'affranchissant des éventuelles différences de nom dans chaque langue.

Et de nombreuses questions

les références vers des systèmes externes

Les établissements scolaires français ont normalement tous dans OSM une référence UAI ref:UAI=* et un numéro SIRET ref:FR:SIRET=*. Ces attributs sont en général présents également dans leur élément Wikidata s'ils en ont un (propriétés P3202 pour UAI et P3215 pour SIRET). Ne pourrait-on pas se contenter dans OSM de mettre le wikidata=* et de considérer que toutes les autres références sont à tirer de wikidata ? Dans la pratique, bien sûr, c'est peu envisageable aujourd'hui. Osmose contrôle la présence explicite de l'UAI pour corréler OSM avec l'opendata education (mais on pourrait lui demander de faire la recherche en SPARQL à partir de la référence Wikidata). Par ailleurs, fin 2025, il n'y a que 3116 écoles en France dans OSM qui possèdent une référence vers wikidata (alors qu'il y a 64.424 éléments Wikidata situés en France et possédant une déclaration P3202) .

La possibilité d'utiliser Wikidata comme 'ID intermédiaire' pourrait permettre d'éviter dans OSM la multiplication des attributs pointant vers des systèmes/bases de données externes, et le travail de maintenance afférent. Il y aura bien sûr de nombreux débats à l'avenir pour savoir s'il vaut la peine de mettre dans un objet OSM sa référence dans un référentiel externe ou si le simple lien Wikidata est suffisant.

l'argument du "human readable"

La question qui se pose souvent est de dire que operator=Lyonnaise des Eaux est parlant pour un être humain alors que operator:wikidata=Q3269667 n'est en aucun cas parlant pour l'humain normalement constitué et qu'il convient donc de conserver dans la base de données cartographique les données aisément exploitables par les êtres humains. Le problème de cet argument est qu'on passe son temps à dire dans OSM "on ne cartographie pas pour le rendu!. Le rendu est l'affaire des différentes applications qui exploitent la base de données cartographiques OSM". Donc, en toute rigueur, on devrait pouvoir demander aux applications d'exploitation (et en particulier de rendu) d'ajouter la requête Wikidata ad hoc pour remplacer dans leur rendu l'attribut wikidata par le nom localisé dans la langue du rendu, tel que tiré se Wikidata.

Bien sûr, les choses ne sont pas aussi simples car la modification de toutes les applications de rendu serait forcément longue et laborieuse. De même cela créerait une [trop ?] forte dépendance de OSM vis à vis de Wikidata.

La question des langues

Wikidata, comme OSM, gère le plurilinguisme. On peut par exemple dans OSM mettre un attribut name=* avec le nom dans la langue locale, si possible un name:en=* au moins pour les applications n'ayant pas de nom dans la langue de leur utilisateur et bien sûr autant d'attributs localisés que l'on veut name:es=*, name:de=*, name:ru=*, ... à l'infini. Et bien sûr on a la même chose dans Wikidata (d'après Wikidata, les noms peuvent être localisés dans plus de 350 langues).

On a la même question par exemple pour les liens Wikipédia. On essaye dans OSM de mettre au moins le lien dans la langue locale (en France wikipedia=Arbre de Diane (Les Clayes-sous-Bois) et si possible le lien vers la page anglaise pour les utilisaturs ne parlant pas notre langue wikipedia:en=EN:british page (qui n'existe pas pour cet objet) et autant d'autres localisations que l'on souhaite, par exemple wikipedia:es=Árbol de Diana . Mais va-t-on mettre toutes les pages Wikipedia ? McDonald's (brand=McDonald's) possède (fin 2025) 121 pages localisées sur Wikipédia, toutes référencées automatiquement dans l'élément brand:wikidata=Q38076 et donc accessibles par ce simple attribut. Bien sûr, tout le monde peut aller sur la page Wikipédia française ou anglaise et ensuite sauter sur l'une des 120 autres pages.

La stabilité des liens entre les deux bases

Plusieurs raisons peuvent mener à des instabilités d'identifiant dans les deux bases :

  • les évolutions effectives dans la réalité : fusion / scission d'entreprise, d'agglomération, ... pouvant conduire à la création de nouveaux éléments Wikidata ou objets OSM et à l'obsolescence d'autres.
  • les doublons de contribution. Un doublon dans Wikidata est en général résolu en changeant le dernier-né pour en faire une redirection vers le premier (il convient toutefois de préférer le premier comme référence car tous les outils ne gèrent pas la redirection de façon optimale). Un doublon dans OSM est plus gênant car sa résolution n'est pas toujours faite de la même façon (la différence principale entre les deux bases est que la destruction d'un objet dans OSM est totalement libre, même si cela conduit utlérieurement à une restauration, alors que la destruction dans Wikidata, comme dans l'ensemble du monde wikimedia, est une simple requête qui fait ensuite l'objet d'une discussion éventuelle et d'un arbitrage).
  • la transformation de type d'objet (Node vers Way ou inversement) dans OSM qui peut souvent amener à un changement d'identifiant (par exemple passer une école et ses attributs d'un simple Node POI à un aire - building ou périmètre landuse -). Noter qu'un Id stable a été proposé dans OSM pour cadrer ce problème.

La compatibilité des licenses et la réutilisation des données Wikidata dans OpenStreetMap

, kidata est publié dans son ensemble sous la licence Creative Commons CC0 1.0 Universal (domaine public). Cependant, il convient de prendre plusieurs précautions avant d’importer des données provenant directement ou indirectement de Wikidata dans OpenStreetMap (OSM).

Données provenant de sources externes

Certaines informations dans Wikidata sont issues de bases externes (par exemple : BnF, VIAF, GND). Ces données restent soumises à la licence de leur source d’origine, et non à celle de Wikidata. Il est donc nécessaire de vérifier la licence de la source avant toute réutilisation dans OSM.

Données avec attribution implicite

Certaines informations présentes dans Wikidata proviennent de sources sous licence CC BY ou équivalente, qui impose l’attribution. Wikidata satisfait cette obligation en fournissant la référence source associée à l’information. Cependant, si ces données sont copiées dans une base ODbL comme OSM, l’attribution risque d’être perdue, rendant la réutilisation juridiquement incompatible.

Données textuelles vs données factuelles

Wikidata contient :

  • des données structurées (dates, coordonnées, propriétés numériques, identifiants)
  • des données textuelles (étiquettes, descriptions, résumés, citations)

OSM, quant à elle, ne gère que des données géographiques factuelles. Un descriptif textuel dans Wikidata (par exemple le descriptif textuel en tête de l'article [W]Tour Eiffel n’est pas une donnée factuelle brute, mais un texte rédigé, exprimé en langage naturel avec un style et une syntaxe propres. Même s’il est sous CC0 dans Wikidata, il demeure une œuvre de langage, et OSM n’accepte pas d’œuvres textuelles importées, même libres, dans sa base.

Règle pratique pour OSM

OpenStreetMap utilise la licence ODbL, qui s’applique uniquement aux bases de données de faits. Cette licence ne couvre pas la citation, l’attribution textuelle ou la paternité d’un auteur individuel. Pour éviter tout problème juridique et respecter les principes de la communauté OSM, aucune phrase, description ou texte rédigé ne doit être intégré dans OSM à partir d'une source sans analyser la compatibilité. Seules les valeurs factuelles, officielles ou numériques sont autorisées.

La compatibilité des licenses et la réutilisation des données OSM dans Wikidata

Prenez toujours connaissance des règles d'importation à jour promulguées par Wikidata avant d'exporter des données OSM vers Wikidata. A priori :

  • pas de difficults pour les données OSM que vous avez vous-mêmes produites, ni à celles placées dans le domaine public par leur auteur.
  • pour les données OSM non produites par vous, la recommandation par défaut est de ne pas effectuer d'importation (par exemple, la license CC0 de Wikidata ne prévoit pas d'attribution alors que la licence ODBL en prévoit)
  • Wikimedia édicte par ailleurs des restrictions sur les importations automatiques : Pour les bases de données européennes, les bots ou autres moyens automatisés d’extraction doivent aussi être évités en raison de l’interdiction de la Directive concernant « l’extraction répétée et systématique » de quantités même non substantielles de données. (extrait de w:m:Wikilegal/Database Rights#Conclusion).

Que faire au final ?

Comme toujours dans OSM, faites appel à votre jugement pour arrêter votre comportement.

  • Ajoutez des QIDs comme attributs ou sous attributs Wikidata librement. Ce n'est jamais un problème et souvent bénéfique.
  • N'ajoutez des informations autres que des QIDs à partir de Wikidata qu'avec la plus grande précaution (surtout des données textuelles)
  • Retirez des attributs ou renoncez à les mettre sous prétexte qu'ils sont accessibles via Wikidata selon votre jugement et la proximité de l'attribut avec les usages courants de OSM.

Comme toujours, le temps et les échanges entre contributeurs OSM finiront par stabiliser des coutumes et habitudes (entre attributs à garder en double et attributs à ne pas intégrer dans OSM car ils sont dans Wikidata).

Erreurs à éviter

man_made=insect_hotel + wikidata=Q1664398 L'élément Q1664398 pointe vers le concept / la classe d'hôtels à insectes, et pas vers votre objet hôtel à insectes dans le parc de votre mairie.

Vous ne mettriez pas dans l'objet OSM node Sequoia General Sherman l'attribut wikidata=Q149851 qui pointe vers la classe "sequoia géant" et non vers l'instance "séquoia Géant General Sherman". Vous mettrez plutôt Q152482 et species:wikidata=Q149851).

Donc, pour notre hôtel à insectes qui n'a malheureusement pas assez de critères d'admissibilité pour être dans wikidata à titre individuel, la bonne solution serait man_made=insect_hotel + man_made:wikidata=Q1664398. Bien sûr, ce serait le premier usage mondial de man_made:wikidata=* et peut-être serait-il préférable de simplement rajouter la QID dans la page WIKI.

Outils

Exploitation des attributs wikidata

Plusieurs outils de cartographie sont capables de transformer les attributs( wikidata=* (ou en sous-clé) en textes (nom, description exploitables par l'utilisateur à la demande :

Lier Wikidata à OSM

Les QID (identifiants universels d'éléments Wikidata) wikidata=* peuvent bien sût être ajoutés aux objet OSM par les outils de cartographie courants :

  • L'éditeur iD.
  • L'éditeur Josm en utilisant les plugin :
    • JOSM/Plugins/Wikipedia – posède un bouton permettant d'interroger Wikidata et d'ouvrir un élément Wikidata dans votre navigateur.
      Notez que les coordonnées de l'objet OSM peuvent être copiées directement à partir de JOSM vers un élément Wikidata; sélectionnez simplement le noeud OSM concerné, appuyez sur Ctrl+ Maj+C et coller dans le champ “Geographical coordinates” de l'élément Wikidata.
    • JOSM/Plugins/Tag2Link – ouvre un élément Wikidata dans le navigateur..
  • OSMgadget – un gadget Mediawiki pour extraire des données vers OSM en consultant Wikipédia.
  • OSM ↔ Wikidata (osm.wikidata.link) – détecte les correspondances possibles et permet rapidement de les ajouter à OSM.
  • OWL Map (map.osm.wikidata.link) - nouvelle version améliorée.
  • Wikipedia where in OSM (WIWOSM) - projet destiné à constituer une visualisation de la configuration géométrique d'un objet OSM pour insertion dans un article Wikipédia.

Outils de validation

  • Sophox - service d'accès par OSM à l'API SPARQL de Wikidata, permet d'interroger Wikidata, de croiser les valeurs tirées des deux mondes, d'effectuer certains contrôles qualité. Voir les requêtes combinées
  • wdlocator ou OSM-Wikidata Map - constitution de cartes combinant des données OSM et des données Wikidata

Contrôle qualité (QA)

Scripts utilisateur Wikidata

Plusieurs scripts utilisateur sur Wikidata permettent d’interroger et d’afficher une carte dérivée d’OSM pour des éléments spécifiques de Wikidata correspondant à des éléments d’OSM :

  • Script de remplacement GeoHack – remplace les liens externes des coordonnées vers GeoHack par des liens directs vers un fournisseur de cartes unique (par exemple OSM).
  • overpass – intègre une carte affichant les entités étiquetées avec l’élément Wikidata courant dans OpenStreetMap. Propulsé par Overpass turbo
  • ClaimMaps – ajoute des cartes aux déclarations « Identifiant de relation OpenStreetMap » (P402) ou « géoshape » (P3896).
  • osm.js – ajoute un lien vers OSM dans la section Outils d’une page d’élément.


Propriétés Wikidata liées à OpenStreetMap

Balises et clés OSM

Pour une liste des équivalents Wikidata des balises et clés OSM, voir ce qui lie le concept Wikidata (12) sur ce wiki et ce qui lie la balise ou la clé OpenStreetMap (P1282) sur Wikidata.

Voir aussi une requête pour identifier les éléments de données OSM non encore liés à Wikidata : éléments sans concept Wikidata

Utilisation par les sites web, etc.

Fondation Wikimedia

Les projets de la Fondation Wikimedia, y compris chaque Wikipédia linguistique, affichent des cartes utilisant les données OSM. Si une entité OSM est étiquetée avec un identifiant Wikidata, son contour peut être mis en évidence sur la carte. Pour l’instant, il n’y a pas de prise en charge des POI. Seules les formes et lignes peuvent être affichées ainsi. Voir w:mw:Help:Extension:Kartographer#External_data.

Les zones OSM (mais pas les points ni les lignes) comportant des balises wikidata sont mises en évidence dans les infobox de Commons, etc.

L’extension Kartographer relie les objets OSM à leur article Wikipédia lorsque l’objet a une balise wikidata=*, voir par exemple la carte de cet article dans l’infobox.

Si l’identifiant Wikidata d’un objet OSM est une redirection, l’objet ne sera pas mis en évidence sur les cartes Wikimedia.

UMap

Reasonator

Reasonator, une interface conviviale pour Wikidata, affiche désormais deux liens pour les entrées géolocalisées : vers TagInfo et Overpass turbo, interrogeant ces balises.

Par exemple, la page Reasonator :

[2](https://reasonator.toolforge.org/?q=Q915614)

contient les liens :

[3](https://taginfo.openstreetmap.org/tags/wikidata=Q915614)
"wikidata"?"Q915614(http://overpass-turbo.eu/?w=%2522wikidata%2522%3F%2522Q915614%29%22+global&R

Ils apparaissent juste sous les images de carte.

Kartographer

Les éléments OSM étiquetés avec des identifiants uniques Wikidata peuvent être affichés dans les pages Wikipédia sous forme de calques sur des cartes basées sur OSM, à l’aide de l’extension Kartographer. Voir aussi Kartographer/OSM.

Wiki OSM

Modèles permettant de créer des liens vers les pages Wikidata :

  • {{Q}} – affiche un lien vers un élément Wikidata par son identifiant unique (espérons-le stable).
  • {{Property}} – affiche un lien vers une propriété Wikidata par son identifiant unique (espérons-le stable).

Interroger Wikidata et OSM

Les données de Wikidata peuvent être récupérées de plusieurs manières, dont SPARQL. Comme OSM peut également être interrogé via SPARQL, Wikidata « fédère » les deux, permettant des requêtes conjointes.

Les services OSM spécifiques avec lesquels Wikidata se fédère comprennent :

Importation de données

Activités passées

Articles académiques sur OSM

Wikidata contient les détails des articles académiques sur OSM, visibles sur [[7](https://scholia.toolforge.org/topic/Q936) Scholia].

== Notes et références ==

Voir aussi

Wikidata
Wikidata
Wikidata contient une page sur OpenStreetMap.
 ** [11](https://map.osm.wikidata.link/) – nouvelle version, améliorée à plusieurs égards.