Mechanical Edits/ sevbot

From OpenStreetMap Wiki
Jump to navigation Jump to search

What is it

This is not really a bot, but a semi-automatic program which runs over Ukraine dumps and produces an OSM file. Then the result is carefully inspected and after being loaded in JOSM gets uploaded to OSM. Ran by user _sev. You may contact me by address sev.mail@gmail.com

Operates on Ukraine territory.

What it does

The bot operations are described in details and discussed in the following thread (in Russian with some Ukrainian): http://forum.openstreetmap.org/viewtopic.php?id=10115

  • Fixes to name, name:uk, name:ru in ways which enforce the 2009 convention on the naming. To be more specific, it puts the toponym on back and expands widespread abbreviations such as 'ул.' instead of 'улица'. The bot obviously cannot translate anything for you.
  • Generates name:en based on official government rules of toponym transliterations if it detects Ukrainian in name tag.
  • Fixes common mistakes in addr:housenumber, such as latin 'a' instead of Cyrillc 'а'

The bot is being run occasionally, sometimes once per month, often by request.

Detailed description in Russian

Бот просматривает теги name, name:ru, name:uk, name:en.

  • Все сокращения в топонимах "разворачиваются". "ул." -> "улица"
  • Топонимы переносятся в конец названия. "улица Ленина" -> "Ленина улица"
  • Все топонимы записываются с маленькой буквы. "Ленина Улица" -> "Ленина улица"
  • Исправляются типичные ошибки. тупік -> тупик, вулица -> вулиця, и ещё пяток других
  • Если в name записано русское название, и присутсвует "name:uk", name записывается в name:ru (если опять же, его не было), и перетирается значением из "name:uk"
  • Если name:en отсутствует, и в "name" у нас обнаружен украинский язык, и назвнаие корректно (присутсвует топоним в конце), оно генерится транслитерацией плюс перевод топонимов. Генерация происходит согласно официального стандарта
  • Если пишут "1-й провулок Васюкова", оно превращается в "1-й Васюкова провулок"
  • Случаи, когда топоним не указан вообще и там одно слово на правильном языке, добавляется слово вулиця/улица

Для addr:housenumber делается следующее:

  • Убирается пробел между буквой и номером
  • Латинские буквы 'a', 'b' заменяются на соответстующие кириллические

Opt-out policy

Since all uploads of the bot run result are performed manually, talk to _sev, or better discuss your request in the bot thread