RU:Проверяемость

From OpenStreetMap Wiki
Jump to navigation Jump to search
Vernier calipers.svg

Проверяемость (иначе - верифицируемость) является очень важной концепцией в ОСМ. Данные должны быть, насколько это возможно, проверяемыми. Это золотое правило, которое охватывает всю картографическую деятельность в проекте. В соответствии со здравым смыслом и на базе этого принципа принимаются решения о тегах, которые мы используем и принимаем.

Что такое проверяемость?

По сути, термин "проверяемость" означает, что все, что сделано, можно продемонстрировать другим, чтобы они убедились, правда это или нет. Примечание: аналогичный термин используется и в Википедии, однако в OSM он означает не то же самое, так как для Википедии важна ссылка на авторитетный источник (публикация), а в OSM главным авторитетом, как правило, является реальное состояние объектов местности, которое описывает пользователь.

Воспроизводимость

Важным (но не единственным) критерием проверяемости является воспроизводимость, то есть ситуация, в которой информация, внесенная одним человеком, может быть независимо внесена таким же или очень близким способом и другими, если они взглянут на тот же самый объект.

Если это невозможно сделать, значит на местности произошли какие-либо изменения, которые необходимо внести в базу. Это правило применяется не только к самим картографическим данным, но и к способу, которым они записаны — ключам и их значениями, которые применяются для описания объектов на карте. Комбинация ключ+значение является проверяемой тогда и только тогда, когда независимый пользователь, при наблюдении описанного этим обозначением, будет наблюдать одно и тоже каждый раз. Для того, чтобы пользовательские теги были проверяемыми, желательно иметь объективные критерии для применения тех или иных тегов. Этот принцип касается любой наблюдаемой характеристики, численной (количественной) или описательной, будь это материал бетонной поверхности дороги, цвет и материал стены из красного кирпича, высота здания или что-то иное.

Другим важным критерием проверяемости является объективность свойств объектов и тегов, предназначенных для их обозначения.

Пример

Здания бывают разных размеров. Два пользователя отправились определить высоту дома. Один вернулся со значением height=tall (высокий), другой — height=average (средний). Без дальнейшего уточнения этих тегов третий пользователь не сможет выбрать правильное значение, поэтому значения "tall" и "average" не являются проверяемыми для тега height=* - они субъективны. (Субъективность - свойство какой-то величины или характеристики, которое делает эту характеристику зависимой от личного восприятия, которое, в свою очередь, может быть весьма различным у разных людей.)

Другой пользователь сделал измерение и получил высоту здания приблизительно 17 метров. Это значение можно проверить, несмотря на его приблизительность, поэтому оно является проверяемым. Следовательно, запись высот в виде численных значений более желательна, чем расплывчатые значения "tall" и "average". Численное или качественное значение с четким определением объективно, даже когда приблизительно, так как погрешность можно всегда оценить, если известен способ измерения или оценки величины.

Улучшение проверяемости через документирование значений

Ясное документирование тегов в Вики всегда помогает проверяемости. Имеется в виду указание возможных значений тега и четкое описание того, как картограф должен измерять или выбирать значение тега из нескольких возможных. Отдельно должны быть описаны особенные случаи, в которых могут возникнуть затруднения. Особую сложность обычно представляют пограничные ситуации, когда нужно делать выбор между двумя смежными возможными значениями.

Например, возьмём водные пути. Кто-то может ввести разделение на широкие и узкие. Поэтому он может назвать их "big" и "small" (большие и маленькие). К сожалению, люди не имеют универсального общего представления о том, что считать большим, а что маленьким. Ситуация может усугубиться тем, что кто-то может предложить использовать понятия "река" и "ручей". Люди имеют достаточно расплывчатые представления, что считать рекой, а что — ручьём. Договориться можно, введя какой-либо проверяемый объективный критерий. Например, чтобы условно отличить реку от ручья можно использовать правило "здоровый человек может перепрыгнуть через ручей". Это определение все ещё слегка субъективно, но сильно ограничивает возможные толкования. Еще более объективным критерием будет средняя ширина. Хотя ее измерение и имеет погрешность, но, как уже было сказано, погрешность всегда можно оценить.

Другие качественные свойства объектов, относящихся к водным путям, определются на основе качественных наблюдений: разница между дамбой waterway=dam и плотиной waterway=weir в том, что вода не перетекает через дамбу, но может перетекать через плотину. Это объективный качественный критерий.

Объективность обозначений

Следует понимать, что картография, даже в случае такого свободного от формальностей проекта, как OpenStreetMap, использует не естественные понятия, а условные термины, чтобы обеспечить проверямость. Потому при документировании тегов и обозначении тегами объектов, нужно избегать того, что кажется очевидным из повседневной жизни или понятий естественного языка. Вместо этого, следует использовать четкие определения. Например, в обычной жизни никто не беспокоится о том, после какой высоты возвышенность перестает быть холмом и становится горой. В картографии для этого есть четкое значение высоты и методика измерения. Таким образом, при создании тегов и выборе значений для них, некоторые слова естественного языка, имеющие субъективный или нечёткий смысл, должны становиться условными терминами с объективным четким определением.

Как создавать объективные критерии

Часто, при создании новых обозначений, встает вопрос о том, какие именно объективные критерии использовать. Обычно, в этом может помочь та дисциплина знаний или науки, которая изучает предмет данного обозначения. Научные классификации и критерии могут быть излишне сложными и подробными, однако общие критерии оттуда позаимствовать можно. Например, при создании обозначения для водно-болотных территорий, имеет смысл обратить внимание на то, как такие территории классифицируют геологи (по источнику воды, солености, расположению относительно водоемов) и экологи (по растущим там деревьям, тростниковой растительности, мхам и болотным кустарникам). Использование объективных научных критериев даже в упрощенном виде, делает обозначения надежно проверяемыми.

При создании схемы обозначений или отдельного тега (ключа), важно проверить качество критериев присвоения тегов этой схемы. Критерий может работать хорошо на очевидных примерах, но плохо - на пограничных случаях. Например, создавая обозначения для магазинов "супермаркет" и "мини-маркет", которые по замыслу различаются размером, легко сказать, что первое обозначение должно относиться к большим, а второе - к маленьким магазинам. Но к какому обозначению отнести магазин среднего размера - почти неразрешимая проблема, так как определять размер на глаз будет необъективным критерием, а привязка к площади торгового зала нереализуема на практике (площадь может быть очень сложно измерить).

Проблемные теги

Некоторые теги, хотя и используются в ОСМ, все равно имеют проблемы с проверяемостью. Более того, они могут быть приняты и активно применяться, несмотря на сложности. Взглянем на некоторые примеры.

Имеется тег highway=*, который требует от картографа принять решение о классификации дороги. Разница между highway=trunk и highway=primary может быть не ясной для некоторых картографов. Зато описание этого тега в Вики делает его более проверяемым. То же самое было сделано для тегов highway=unclassified и highway=residential (и для остальных дорог низшего уровня). Но в действительности применение этих тегов вызывает споры у разных картографов и, несмотря на все усилия по документированию и описанию различных примеров, эти теги являются довольно непроверяемыми.

В то же время, другие теги были созданы позднее, и вызвали споры из-за их плохой проверяемости. Например smoothness=*, trail_visibility=* и sac_scale=*. Положительное влияние этих споров в том, что была улучшена документация, но все равно картографирование на базе таких субъективных суждений является очень проблематичным с точки зрения проверяемости, также как и использование этих субъективных данных.

Существующая схема обозначения многих магазинов также субъективна, так как, например, отличия shop=supermarket от shop=convinience прописаны в документации плохо, а потому тег присваеивается мапперами в соответствии с личным субъективным восприятием магазина.