FR:Robot de traitement

From OpenStreetMap Wiki
Jump to: navigation, search

Intro

Le nombre de robots agissant sur la donnée OSM afin de réparer, nettoyer et faire gagner du temps aux humains est proche de zéro. J'ai (Sletuffe) plusieurs fois reçu un refus sur le wiki ou sur la liste. Alors je propose qu'au moins entre français, nous en fassions tourner un afin de gagner du temps.

WIKI Vous n'êtes peut-être pas tous des fan de wiki, ni ne savez toujours vous en servir, vos avis nous intéresses quand même. Vous pouvez intervenir :

Qui le fait

Facile : moi, comme on le dit souvent, "if you need it, do it yourself"

Voici la page dédié à l'avancée de ce bot sbot


( je suis pas contre un peu d'aide tout de même, et en tout cas, si ce n'est techniquement, au moins dans la réflexion)

En rapide, je détaillerais plus tard ensuite :

  • sous licence WTFPL
  • code source disponible
  • prévu en php (je connais que ça, désolé )
  • basé sur un fichier d'export osm
  • utilisation de l'API 0.5 Attente préférable de la 0.6 pour l'option "rollback" en cas de pépin
  • vérification avant chaque update de l'état de la base
  • chemin par chemin, point par point

Prudence

  • (fait) Lire le code de conduite sur Automated Edits. La présente page de consultation est tout à fait dans ce sens.
  • Respecter le tag Proposed_features/no_robot
  • Suggestion : après une série de modifications, récupérer le changeset et vérifier que c'est bien ce que l'on souhaitait faire. Mais la difficulté semble être surtout de ne faire que des modifications consensuelles, de ne pas froisser un autre contributeur (et au contraire de se faire remercier pour avoir simplifié la vie de tout le monde).


Étapes

Dans un premier temps j'aimerais :

  • se mettre d'accord sur ce qu'il doit faire, ou pas
  • le lancer en test sans qu'il ne fasse rien sur un fichier et donner un rapport
  • le lancer dans la vrai vie sur une petite zone
  • recueillir des commentaires
  • le lancer pour de vrai pour une première option de nettoyage
  • ne le lancer qu'a la main, à une date précise

Premier sondage sur le principe

Je commence à programmer ?

sondage

Noter que ce vote est peut-être biaisé: beaucoup d'utilisateurs qui envisagent d'écrire un robot tomberont sur cette page et voteront oui...

  • oui Sletuffe 10:54, 5 August 2009 (UTC)
  • oui Frodrigo 21:07, 8 December 2008 (UTC), parcontre ne rien faire de façon hâtive, faire un peu comme pour les proposed features.
  • oui OlivierAuber 21:17, 8 December 2008 (UTC) Toujours admiratif des courageux et des téméraires;-)
  • oui Murphy 22:28, 8 December 2008 (UTC)
  • oui Mat 22:44, 8 December 2008 (UTC)
  • rien contre mais il faut que le code du bot soit ouvert, qu'il y ait un administrateur, une page wiki qui rassemble tous les bots (pas d'edit war entre bots) et que les corrections se limitent à des choses simples. Dommage que ce soit en php qui n'est vraiment pas fait pour ça. Pieren 09:25, 9 December 2008 (UTC)
  • oui Domi 09:53, 9 Decembre 2008 (UTC) , réserves similaires à Pieren
Je suis tout à fait ouvert à ce que quelqu'un le fasse à ma place ;-) mais si c'est moi, pas de chance je ne connais bien que php, et l'example déjà fait en C# ne me tente pas du tout Sletuffe 11:53, 9 December 2008 (UTC)
  • oui en étant très prudent, et en récoltant des témoignages sur les modifications effectuées. Jrouquie 19:32, 4 August 2009 (UTC) Le mode opératoire proposé est de bonne augure.

Premières tâches proposées

Majuscules

Changer les noms de tout object pour :

  • toujours passer la première première lettre en majuscule
  • passer la première lettre de chaque mot en majuscule
  • sauf (liste complète bienvenue)
  • du, de, d', le, la, l', les, à, au, aux, sous, sur, en, lès, près, vers, chez

sondage

  • oui non Je change d'avis, la version éprouvé d'une liste des à faire et plus sûr qu'une liste des "a pas toucher" Sletuffe 11:00, 5 August 2009 (UTC)
  • oui et non Frodrigo 21:07, 8 December 2008 (UTC), pour la première lettre ok, le reste est plus discutable.
  • non, pas sans contrôle manuel. Ou alors seulement pour rue, route, avenue, etc en début de label Wawet76 21:10, 8 December 2008 (UTC)
  • oui et non Mat 22:44, 8 December 2008 (UTC) même raison que frodrigo
  • non pour tous les mots, voir la page 'discussion'. Mais oui pour une liste fermée de mots sur les erreurs les plus classiques (rue, avenue, boulevard, etc). Pieren 09:27, 9 December 2008 (UTC)
  • oui et non Domi 09:54, 9 Decembre 2008 (UTC) oui pour sortir des rapports sur les noms concernés, éventuellement avec possibilité de orecction "en masse". Mais se garder la possibilité d'avoir des exclusions pour certains libellés qui peuvent spécifiquement obéir à une règle différente.
  • oui et non La typo française n'est pas l'anglaise. Tous les mots dans un titre ne sont pas en majuscule : rue du Moulin noir et non rue du Moulin Noir, par contre rue des Grands Prés (l'adjectif est en premier). FrViPofm 21:03, 5 April 2009 (UTC)
    • Encore une fois, les règles typographiques de la toponymie ne sont pas les mêmes que pour les titres de livres ou journaux. Les adjectifs doivent aussi être mis en maj. La version correcte de votre exemple est Rue du Moulin Noir. Seuls les articles et quelques exceptions ne sont pas en maj comme Rue de la Fontaine ou Rue Jean de La Fontaine. -- Pieren 08:10, 6 April 2009 (UTC)
  • non : une liste d'exception ne sera jamais complète. Jrouquie 19:32, 4 August 2009 (UTC)

Uniformisation des yes/no/false/true/1/0

tunnel et ponts

Changer pour :

  • tunnel
  • bridge
  • Toute les valeur true et 1 en yes
  • toute les valeur de false et 0 en no
sondage
  • oui Sletuffe 20:43, 8 December 2008 (UTC)
  • oui Wawet76 21:10, 8 December 2008 (UTC)
  • oui Mat 22:44, 8 December 2008 (UTC)
  • oui domi 09:54, 9 December 2008 (UTC)
  • oui Jrouquie 19:32, 4 August 2009 (UTC)

oneway

Changer pour :

  • oneway


  • Toute les valeur true et 1 en yes
  • toute les valeur de false et 0 en no

sondage

  • oui Sletuffe 20:43, 8 December 2008 (UTC)
  • oui Wawet76 21:10, 8 December 2008 (UTC)
  • bof : on perdrait la cohérence avec le -1 (sens inverse) Murphy 22:34, 8 December 2008 (UTC)
  • oui le -1 devrait être remplacé par yes et l'ordre des nd inversés Mat 22:44, 8 December 2008 (UTC)
ça, je suis pas sûr que ce soit une bonne idée, le -1 est bizarre d'accord, mais parfois il a une raison d'être. Je voudrais pas casser ça Sletuffe 22:52, 8 December 2008 (UTC)
et attention aux éventuels left/right à inverser aussi --PhilippeP 07:00, 9 December 2008 (UTC)
surtout pas inverser l'ordre des noeuds ! Le -1 est exceptionnel et a sa raison d'être. Pieren 09:29, 9 December 2008 (UTC)
  • oui. J'approuve le fait de ne pas toucher au -1.

Erreur de typo

tagwatch permet de trouver beaucoup de typos. Mais chaque ligne du tagwatch (par exemple "bridge=aqueduc" à corriger en "bridge=aqueduct") doit être validée par un humain avant modification en masse. Pour faciliter son travail, on pourrait fournir un lien vers la page du wiki (dans notre cas [1]) et le nombre de corrections qui vont être effectuées.

  • J'ai déjà un peu étudié la détéction de typo, voir soundex et soundex2 sur [OSM-check]. Frodrigo 21:07, 8 December 2008 (UTC)
Whaou ! c'est du haut niveau ce que tu as fait, je ne pensais pas aller jusque là ! Mais pourquoi pas, si ton code est public, je t'en demanderais peut-être bien une copie Sletuffe 23:03, 8 December 2008 (UTC)
  • oui. Bonne idée, soundex. Ici aussi il faut valider à la main (par exemple sont classés dans la même catégorie: "Avenue de Prades", "Avenue de Bordeaux", "Avenue de Biarritz", "Avenue du Paradis" et "Avenue de Porte Joie").

Vos commentaires

Sur la page discussion.