User:AMDmi3/Чистка cladr тэгов

From OpenStreetMap Wiki
Jump to: navigation, search

В базе присутствует большое количество данных, некогда взятых из КЛАДР и массово проставленных на объекты ботом. Эти данные давно не обновляются и потеряли актуальность, и по сути не могут быть практически использованы, а также нарушают TOS КЛАДР, поэтому предлагается очистить от них базу.

Проблемы с данными

  • копирование cladr данных в OSM нарущает права на использование базы:
...
3. Настоящая Лицензия является неисключительной. Пользователь получает право
использования КЛАДР на территории Российской Федерации в оговоренных ниже
пределах.
Право использования КЛАДР ограничивается правом на воспроизведение (запись в
память ЭВМ, архивное копирование и инсталляция)  и правом пользования
(осуществление действий,  связанных с функционированием КЛАДР в соответствии с
ее назначением). 
Начало использования КЛАДР (установка) означает безусловное согласие
Пользователя с условиями настоящей Лицензии.  
Пользователь КЛАДР обязуется не распространять КЛАДР. Под распространением
понимается предоставление доступа третьим лицам к воспроизведенной в любой
форме КЛАДР и ее компонентам  путем продажи, проката, сдачи внаем,
предоставления взаймы или иными способами отчуждения.
4. Пользователь КЛАДР не вправе:
- допускать использование КЛАДР лицами, не имеющими прав на такое использование;
...
  • так как данные в базе OSM не актуализируются
  • они отсутствуют на новых объектах
  • на старых объектах зачастую присутствуют неверные данные (например, в ходе уточнения часть одной улицы была отнесена к другой, но cladr данные остались от первой улицы)
  • данные из свежих версий КЛАДР не попадают в OSM

При этом следует заметить, что использовать данные КЛАДР с OSM можно без добавления их непосредственно в OSM:

  • сопоставляя объекты в OSM и КЛАДР по адресам
  • используя корректные тэги cladr:code, которые предлагается оставить в базе OSM как способ связи её с КЛАДР (предполагается, что наличие в OSM только кодов без иного содержимого КЛАДР не будет являться распространением последней или предоставлением доступа к оной третьим лицам)

Для сопоставления данных OSM с другими базами (ОКТМО/ОКАТО/КЛАДР) также можно использовать http://yav.gis-lab.info/trac/wiki/Экспорт

Данные предложенные к удалению

  • 17-значные cladr:code на зданиях
КЛАДР (в числе всего прочего) различает такие объекты как улицы (база данных STREETS.DBF, 17-значные коды) и дома (база данных DOMA.DBF, 19-значные коды).
если я ничего не путаю, некогда в целях привязки зданий к улицам для программы ПокетГис, пользователем Ezhick на здания были проставлены тэги cladr:code, содержащие код ближайшей улицы.
  • Это некорректное использование тэга, т.к. вместо кода здания в cladr:code зависывался код улицы
  • Это неверная информация, так как использовался не фактический код, а код с ближайшей улицы, при том что здание могло адресоваться совершенно по другой улице
  • Насколько мне известно, этот костыль больше не нужен ПокетГис'у
19-значные cladr:code предлагается оставить для связи OSM с КЛАДР (предполагаем что это вручную проставленные корректные коды зданий)
  • cladr:name, cladr:suffix по озвученным в начале стрницы причинам
  • sorting_name, хотя и не относится к КЛАДР (судя по всему, проставлен только по Москве из ОМКУМ), также не обновляется и подвержен всё тем же проблемам (за исключением нарушения лицензии). В дополнение к этому
  • в OSM от местячкового тэга мало смысла; сортировка, работающая только в Москве или работающая по-разному в и вне Москвы не нужна
  • существуют готовые общие алгоритмы приведения названий к виду, подходящему для сортировки (как минимум streetmangler, при необходимости более продвинутый алгоритм на его базе)