ES:Data Quality Approach LAC

From OpenStreetMap Wiki
Jump to navigation Jump to search

Un enfoque para mejorar la calidad de los datos de OpenStreetMap en LATAM

Por favor, comente sobre este documento

OpenStreetMap (OSM) es un proyecto colaborativo de mapeo en línea que permite a los usuarios crear, actualizar y compartir datos geográficos en todo el mundo. Como resultado, la calidad de los datos en OSM puede variar según el enfoque temático y niveles de conocimiento del mapero. De igual manera los parámetros para determinar la calidad de los datos dependen del enfoque y el propósito para el cual fueron creados, por que en este documento nos enfocaremos específicamente a los elementos que aplican para toda la información de OSM en general.

Existen una gran cantidad de problemas que comúnmente se comenten y que deben ser evitados. Aunque hay muchos datos de alta calidad disponibles en OSM, también es posible encontrar datos incompletos o imprecisos, especialmente en áreas menos desarrolladas o menos pobladas.

Este documento busca ser una guía que aporte a la mejora de la calidad de los datos existentes y facilite la construcción e incorporación de información de calidad.

Objetivos:

  1. Principalmente se busca proporcionar las herramientas principales que permitan verificar e identificar problemas de calidad en los datos de la región y con el propósito de generar capacidades para resolver esto problemas.
  2. Adicionalmente se quieren disponer de pautas que deben ser tenidas en cuenta para mejorar la calidad de los datos generados en proyectos de mapeo grupal desarrollados de manera remota y en campo.
  3. Proporcionar una guía práctica para que los nuevos mapeadores generen datos de calidad evitando errores comunes de mapeo.

Población objetivo

Miembros de la comunidad de distintos niveles de conocimiento (principiantes, intermedios y expertos), organizaciones gubernamentales, entidades del sector privado y organizaciones no gubernamentales y en general cualquier organización que participe de OSM mediante la organización de proyectos de mapeo grupal.

Nuestro Enfoque

Qué es la calidad de los datos?

La calidad de los datos puede variar según la región geográfica y el nivel de actividad de los contribuyentes en esa área. Es posible que algunas áreas tengan más contribuyentes activos y, por lo tanto, una mayor cantidad de datos precisos y actualizados, mientras que otras áreas pueden tener menos contribuyentes y, por lo tanto, menos datos disponibles.

Sin embargo, existen algunos parámetros para poder determinar la calidad los datos ingresados en OpenSteetMap entre los cuales los más importantes son:

  • Precisión: La información ingresada en OSM debe estar ubicada en el lugar correcto con el fin de mejorar su utilidad, este problema puede ocurrir ampliamente debido a la utilización de información base mal georreferenciada y por la escala utilizada al momento de realizar el mapeo.

Presicion posicional.JPG

  • Etiquetado: OSM utiliza un modelo de datos claramente establecido, por lo cual la correcta utilización de las etiquetas es fundamental para garantizar la calidad de la información y la correcta diferenciación de los elementos agregados al mapa.

Tags.JPG

  • Completitud: A partir de la información base utilizada, es posible identificar una gran cantidad de elementos para ser ingresados al mapa (construcciones, cuerpos de agua, ríos, carreteras, etcétera), este parámetro puede resultar relativo ya que existen proyectos que solo está enfocados a algunos de estos elementos, por lo cual este elemento dependerá específicamente del proyecto que se esté trabajando.

Completitud.JPG

  • Consistencia: Los datos ingresados deben cumplir con reglas topológicas establecidas, errores como el cruce o superposición de elementos afectan la utilización de lo información de manera óptima.

Consistencia.JPG

  • Precisión temporal: Es importante tener en cuenta que todas las imágenes no tienen la misma fecha de actualización, por lo cual puede que los elementos mapeados se hayan generado sobre una imagen desactualizada.

Presicion temporal1.JPG Presicion temporal2.JPG

La unión de los elementos previamente descritos puede darnos elementos de juicio para evaluar la calidad de los datos en una región en específico.

Aseguramiento de la calidad de los datos

Herramientas para el aseguramiento de la calidad

Existen algunas herramientas y procesos evaluar de manera automática y no automática los parámetros previamente mencionados.

Herramientas de validación automática

  • JOSM Validator: JOSM cuenta con un validador que de manera muy sencilla identifica lo errores de etiquetado y de consistencia sobre una región seleccionada.
  • Osmose: Es una herramienta que a través de un visor muestra los errores encontrados como nodos duplicados, etiquetas incorrectas, líneas que se cruzan y carreteras que no se conectan correctamente.
  • Keep Right: Es una herramienta que a partir de un visor WEB identifica errores principalmente relacionados con vías.
  • MapRoulette: Es una aplicación WEB que de acuerdo con retos creados por colaboradores identifica errores de mapeo de todo tipo. La mecánica es de tipo “juego” lo cual permite que sea ideal para mapeadores principiantes que buscan una herramienta amigable para contribuir en su región.
  • Turn Restrictions y Restriction Validator: Son visores WEB que están diseñados específicamente para identificar las restricciones de giro mapeadas en OSM, señalando las restricciones que cuentan con alguna inconsistencia de tipo topológico.

Herramientas de validación no automática

Para poder identificar problemáticas de exactitud y completitud, en muchos casos se hace necesaria la utilización de otros procedimientos diferentes a las herramientas descritas previamente.

  • Comparación con fuentes externas: Es recomendable comparar los datos de OpenStreetMap con fuentes externas de información, como imágenes satelitales, fotografías aéreas o datos de mapas oficiales. Esto permitirá identificar posibles inconsistencias o errores en los datos y corregirlos. En Latinoamérica y El Caribe existen múltiples portales de datos abiertos que a partir de geoservicios disponen información oficial que puede ser utilizada para mejorar la calidad de los datos ingresados en OSM, los geoservicios son fuente fundamental de información para obtener datos que no pueden ser extraídos directamente desde una imagen como lo es la toponimia.
  • Revisión Manual: Este tipo de procedimientos requieren un conocimiento avanzado en técnicas como fotointerpretación y conocimiento local, esto dará la posibilidad de reconocer elementos en el mapa que un usuario principiante no puede identificar con facilidad.
  • Utilización de Trazas GPX y mapas de calor de Strava: La información suministrada por estas herramientas, son ideales para comprobar la precisión de los datos de OSM y para ingresar datos de carreteras no mapeadas.

Herramientas de gestor de tareas para comunidad validadora:

  • Mapswipe:  proyectos de verificación para que contribuidores, desde el celular, pueda validar uno a uno los objetos mapeados en OSM. Ver: Aquí

Datos para la evaluación de la calidad

Como ya se ha mencionado previamente, existen múltiples problemáticas en la calidad de los datos incorporados en OSM, la complejidad de esas problemáticas es muy diversa, sin embargo, algunas temáticas que pueden ser revisadas con la ayuda de OSMose.

  • bad tag key : Etiquetas que aún no se encuentran correctamente documentadas en la Wiki de OpenStreetMap.
  • duplicated node : Más de un nodo en la misma posición.
  • geometry : Tipo de geometría errónea en un objeto en particular.
  • highway : Problemas relacionados con las etiquetas de las vías y los valores de estas etiquetas.
  • highway crossing : Problemas relacionados con la etiqueta de cruce de vías.
  • incompatible tags : Combinación erronea de etiquetas
  • objects overlap : Objetos que se conectan con otros de manera ilógica.
  • orphan nodes : Nodos desconectas sin etiquetas
  • overlapping building: Intersecciones entre edificios

¿Cómo asegurar la calidad de los datos en eventos y actividades de mapeo?

Los proyectos de mapeo organizado cada vez son más comunes y se desarrollan liderados por diferentes organizaciones. Estas actividades resultan muy importantes porque son los escenarios en los cuales más información se incorpora a OSM. Por esta razón se deben seguir con algunos pasos para garantizar que los datos generados cuenten con la calidad requerida.

Las actividades de mapeo pueden ser de diferentes tipos, (remota, en terreno o mixta) los pasos que se describirán a continuación no siempre aplican para todos los tipos, por lo cual como coordinador de proyecto se debe decidir cuales pasos aplican para cada tipo de actividad.

Pre evento

  1. Defina un Hashtag para el proyecto, esto será muy útil para hacer seguimiento a las ediciones que se desarrollen durante el desarrollo de la actividad de mapeo.
  2. Intente comunicarse con un líder regional de la comunidad y mantenerlo informado del proyecto y participar en los canales de telegram locales, esto le permitirá conocer reglas de mapeo locales y tener una retroalimentación constante de alguien con conocimiento local.
  3. Limpie los datos existentes en la región en la cual se desarrollará el proyecto, siempre es mejor trabajar sobre un lienzo sin errores, sin embargo, se debe ser respetuoso con el trabajo de los demás, como se ha indicado a lo largo del documento la información almacenada en OSM se genera con múltiples propósitos, por lo cual debe estar seguro al hacer cualquier modificación sobre datos existentes en el mapa. Si tiene alguna sospecha sobre la información que se encuentra en el mapa intente comunicarse con el usuario que generó el dato y dé un compás de espera para la respuesta antes de hacer una modificación definitiva (la comunicación es fundamental para mantener un buen ambiente en la comunidad OSM).
  4. Socialice el modelo de datos que se utilizará en el proyecto, esto permitirá darle una identidad al proyecto y generará un mapeo homogéneo dentro de los participantes en el proyecto, este modelo debe estar alineado con las etiquetas registradas en la WIKI de OSM.
  5. Realice una verificación de la información libre disponible, consultar los portales de datos abiertos de la región permitirá contar con información secundaria que puede ser utilizada para generar información con mayor calidad.
  6. Cree un espacio en la WIKI donde se describan aspectos generales a tener en cuenta por parte de los participantes del proyecto, elementos como el hashtag, etiquetas principales, metodología y demás elementos de importancia deben estar documentados, habrá información que ingresará durante el desarrollo del proyecto.
  7. De ser posible obtenga un listado de los participantes con el nombre de usuario de OSM, esto le servirá para hacer seguimiento a las ediciones desarrolladas en el marco del proyecto.
  8. Si el proyecto cuenta con actividades de mapeo remoto plantee el uso del Tasking Manager, esta herramienta le permite llevar un mejor control de las áreas trabajadas, este mecanismo hace más fácil asignar tareas a diferentes maperos. Este dejará claro cada nueva parte que se requiere mapear permitiendo el mapeo de manera simultánea, desarrollar actividades de validación y obtener estadísticas parciales y finales de las ediciones realizadas en el proyecto. (El Tasking Manager de HOT puede ser utilizado por organizaciones externas realizando una solicitud)
  9. Genere sesiones previas de entrenamiento, en estas sesiones se deben socializar todos los ítems mencionado previamente y permitirá que los participantes del proyecto cuenten con una información base para generar datos de calidad.

Durante el evento

  1. Supervise las discusiones en los conjuntos de cambios y las discusiones en el administrador de tareas. Si hay alguna discusión acerca de su actividad de mapeo, proporcione una respuesta apropiada y oportuna.
  2. Supervise ediciones relacionadas con el trazado de geometrías y etiquetado por parte de los participantes. Existen una serie de herramientas que le ayudarán a llevar este control:
    • OSMCha filter  Una herramienta con una extensa cantidad de opciones de filtrado de conjunto de cambios que incluye la detección de ediciones sospechosas en un periodo de tiempo, ubicación, hashtag, usuario o actividad de mapeo.
    • Google Alert Herramientas libres de Google para servicios de notificación y detección de cambios. El servicio envía correos electrónicos de manera automática al usuario cuando encuentra resultados ajustados con la configuración realizada por el usuario.
    • Changeset discussion Los contribuidores de OSM pueden tener discusiones acerca de una edición, directamente en la plataforma de OpenStreetMap. Esta discusión es pública lo cual permite colaboración de otros maperos.
  3. Esté atento a cualquier edición cuestionable por parte de los participantes.

Después del evento

1.Valide la actividad de mapeo. Independientemente la actividad se realiza en campo o de manera remota se requiere verificación siempre que utilice datos de OSM.

2. Asegúrese que todas las  discusiones de conjunto de cambios y administrador de tareas están documentadas y respondidas.

3. Actualice la documentación publica relacionada con la actividad.

Transparencia

Ser parte de la comunidad de OpenStreetMap comunicando la calidad y usabilidad de datos existentes en regiones prioritarias y áreas de impacto. Para información pública, publique la documentación en GitHub, Wiki OpenStreetMap y demás sitios disponibles. Puede organizar un evento y formalizar convenciones de mapeo creando una Wiki OpenStreetMap  page en el sitio WEB de su país.

Puede además participar activamente en las discusiones del conjunto de cambios en las naciones que prefiera suscribiéndose a latest changeset discussion. Hay numerosas y valiosas discusiones técnicas en este sitio.

Como parte de la comunidad de OpenStreetMap, además sea proactivo con las herramientas de aseguramiento de la calidad existentes, podría ayudar al desarrollo de herramientas impulsadas por la comunidad. Puede contribuir enviando ideas o informando errores al equipo de desarrollo. Finalmente, estarán disponibles más herramientas para mejorar la calidad de los datos que se adapten a las necesidades de la comunidad.

¿Qué opina de este documento?

Estamos siempre buscando formas de mejorar este documento. Por favor comparta sus comentarios con nosotros.