ES:Tenerife Bus Transport Import

From OpenStreetMap Wiki
Jump to navigation Jump to search

Objetivo

Los servicios regulares de autobuses urbanos e interurbanos en la isla de Tenerife son ofrecidos mayoritariamente por Transportes Interurbanos de Tenerife (TITSA), una sociedad anónima propiedad del Cabildo Insular de Tenerife (administración insular). Nuestro objetivo es incorporar la información de paradas y líneas de la red del operador TITSA a OSM.

Planificación

El proyecto consta de dos fases

  1. Importar paradas. Sujeto a la aprobación de la lista imports, se espera que esta fase comience en marzo y durará unas dos semanas (o menos dependiendo del número de colaboradores que se apunten).
  2. Importar rutas. Esta fase comienza al terminar la anterior y necesitará otro anuncio en la lista. La duración estimada es un mes.

Datos a importar

Antecedentes

Sitio web del origen de los datos: http://www.titsa.com
Licencia de los datos: http://www.titsa.com/index.php?accion=avisolegal
Enlace a autorización: http://lists.openstreetmap.org/pipermail/talk-es/2013-February/011341.html
Atribución en OSM: Se proporcionará en etiquetas de los conjuntos de cambios y cuenta de usuario específica de la importación: titsa-import.
Se ha verificado la conformidad con la ODbL:

Autorización

En el apartado "Nuestros servicios" de la página web se puede obtener información sobre las paradas de autobús o rutas específicas bajo el siguiente aviso de copyright. No se ofrece la posibilidad de descargar el conjunto completo de datos.

"Se autoriza su reproducción siempre que se cite la fuente, salvo que si indique lo contrario. En aquellos casos en que sea necesaria una autorización previa para la reproducción o el uso de datos textuales o multimedia (sonidos, imágenes, programas, etc.), dicha autorización cancelará la autorización general antes citada y mencionará las posibles restricciones de uso."

Cuando se remitió a través de su formulario web una solicitud basada en este modelo, TITSA contestó afirmativamente remitiéndonos al Departamento de Informática para proporcionarnos los datos. Dicho departamento nos ha mostrado toda su colaboración, remitiendo los datos.

Descripción de los datos

Datos en formato GTFS conteniendo:

  • 3653 paradas con los siguientes atributos: id, código (código==id), nombre, latitud, longitud.
  • 166 rutas con id, nombre corto y nombre largo.
  • Datos sobre viajes y tiempos de parada permiten derivar las rutas que componen una ruta maestra con todas sus variantes así como información completa de horarios.

Los datos se espera que estén actualizados, como muy tarde, a fecha de mayo de 2012. Una revisión de las posiciones de algunas paradas contra ortofoto de alta resolución permite estimar una precisión de unos 50 m, siendo en general mejor la de OSM.

Tipo de importación

Se trata de una importación única, aunque serán necesarias revisiones periódicas para mantener la información actualizada. Las herramientas de software que se prevé utilizar son GO-Sync para las paradas de autobuses y código propio Python para las rutas. Josm se utilizará para la verificación, validación, cargar y revertir conjuntos de cambios si es necesario.

Preparación de los datos

Simplificación y reducción de los datos

Los datos de las paradas a importar son suficientemente simples y no necesitan ningún plan de reducción. Incorporaremos todas las direcciones y variantes de un servicio. Se incluirá información sobre horarios en una etiqueta operating_hours para diferenciar las variantes.

Plan de etiquetado

Se va a utilizar el esquema Public transport schema 2 para etiquetado. Esta es la correlación entre atributos originales y etiquetas OSM.

Paradas

Archivo Atributo GTFS Etiqueta OSM
stops.txt stop_id ref=*
stops.txt stop_name name=*
highway=bus_stop
public_transport=platform
bus=yes
route_ref=*
operator=TITSA

Rutas

Archivo Atributo GTFS Etiqueta OSM
routes.txt route_short_name  ref=*
routes.txt route_long_name name=*
* * operating_hours=*
type=route
route=bus
colour=#79b51d
operator=TITSA

La etiqueta operating_hours sería similar a opening_hours=*, por ejemplo:

operating_hours= Mo-Su 07:35

O incluso:

operating_hours=Mo-Su 14:05,18:00,19:05,20:00; Sa 13:05,20:50; Mo-Fr 20:55; Sa-Su 12:00; Su 09:00,09:45,15:00,16:00

Servicios

Archivo Atributo GTFS Etiqueta OSM
routes.txt route_id gtfs_id=*
routes.txt route_short_name  ref=*
routes.txt route_long_name name=*
description=*
network=*
type=route_master
route_master=bus
colour=#79b51d
operator=TITSA

Los valores de la etiqueta network serían uno o varios de estos: urban; metropolitan; touristic; express.

Etiquetas para conjunto de cambios

Se usarán las siguientes etiquetas para conjunto de cambios.

Transformación de los datos

Para las paradas se va a utilizar una versión modificada de GO-Sync para transformar los datos GTFS a OSM XML. Código Python propio generará las rutas y servicios. Enlace al código.

Resultados de la transformación de datos

Este es un ejemplo de paradas con un pequeño fragmento del conjunto de datos.

Y dos rutas.

Estos ficheros sólo contienen relaciones.

Flujo de trabajo para combinación de datos

Enfoque de equipo

El equipo está formado actualmente por Javiersanp, tiger, jsaga, migoga y g0ldfish. Se necesita ayuda de la comunidad para realizar el trabajo. Por favor, mándame un mensaje si deseas colaborar.

Este proyecto se ha anunciado en la lista Talk-es. También se ha contactado con los usuarios más activos o con ediciones recientes de transporte público en la zona.

Referencias

Este proyecto se ha anunciado en la lista Talk-es y en imports.

Flujo de trabajo

Paradas

  • Cada colaborador recibirá un fragmento del conjunto de datos GTFS.
  • Usando GO_Sync lo fusiona con los datos OSM y envía los resultados a un compañero.
  • El compañero abre el archivo con Josm para comprobar las decisiones tomadas al revisar cada nodo. Adicionalmente se debe usar imágenes de alta resolución (Ortofotos_de_Grafcan#OrtoExpress_Urbana / PNOA) para mejorar las posiciones y detectar marquesinas.
  • Finalmente, valida y sube los datos.
Grupo Zona 1ª revisión GO_Sync 2ª revisión Josm Conjunto de cambios
1 Sureste Javier Sanchez migoga 15293602 (a, l)
2 Suroeste migoga Javier Sanchez 15346872 (a, l)
3 Noroeste migoga tiger 15415172 (a, l)
4 Noreste jsaga g0ldfish 15567282 (a, l)

Rutas

  • Cada colaborador recibirá algunos archivos XML de OSM con todas las rutas y comprueba los errores globales.
  • Las rutas se fusionan con las ya existentes conservando el historial de la relación.
  • Todas las rutas serán subidos por el usuario titsa-import con el fin de dar el crédito apropiado.
  • Cada colaborador selecciona algunas rutas y las reserva añadiendo su identificador de usuario a la columna de notas de la página Bus Routes in Tenerife.
  • El colaborador descarga las relaciones de las rutas seleccionadas y les añade las vías que siguen las rutas (la relación originalmente sólo incluye las plataformas). Estos datos se cargan con su propia cuenta de usuario.
  • Al acabar con cada ruta, el colaborador borra su nombre de la fila de la ruta en la página Bus Routes in Tenerife.

Debido a que la cantidad de datos a importar no es muy grande, el tamaño del conjunto de cambios a subir no supone una preocupación. Si algo sale man, se usará el complemento JOSM/Plugins/Reverter para revertir el conjunto de cambios.

Fusionado

Paradas

OSM tiene 1480 nodos con la etiqueta highway=bus_stop en el área de la importación. El conjunto de datos de TITSA tiene 3653 paradas. GO_Sync ayuda al usuario a detectar duplicados y fusionarlos. El programa descarga nodos bus_stop en el área de la importación, compara cada parada GTFS con las de OSM en un rádio de 100 metros y empareja por código de parada. Cada parada GTFS queda asignada en una de estas cuatro categorías para revisión humana usando una tabla de etiquetas y una vista de mapa.

  • 1246 paradas GTFS nuevas con con posibles coincidentes en OSM. Existen una o más paradas en OSM candidatas a ser un posible duplicado. El usuario debe detectarlas si realmente es un duplicado y combinar las etiquetas.
  • 2018 paradas GTFS nuevas sin coincidencias en OSM. No hay que hacer nada en particular.
  • 389 paradas existentes en OSM con actualización de datos. El usuario combina las etiquetas.
  • 0 paradas ya existentes.
Fusión de etiquetas
Etiqueta Valor seleccionado por defecto Nota
lat, lon OSM Normalmente mejor posicionado
route_ref TITSA Mejor por que han habido cambios recientes en la red
name TITSA Deben ser similares, necesita comprobarse

Respecto a la etiqueta ref, si los nodos están cerca y los códigos de parada son diferentes, lo más probable es que no sean la misma parada. Excepto si son tan similares que puede sospecharse un error por parte del editor del mapa.

Rutas

Teniendo en cuenta una ruta por cada dirección, el conjunto de datos de TITSA producirá 166 relaciones route_master=bus y unas 332 relaciones route=bus. Actualmente existen relaciones 19 route=bus y 1 relación route_master=bus en el área de la importación. Esta cantidad puede ser fusionada a mano.

Aseguramiento de la calidad

Cada archivo OSM se revisará con Josm por un compañero antes de subirlo. Las imágenes de alta resolución disponibles (Ortofotos_de_Grafcan#OrtoExpress_Urbana / PNOA) deben usarse para mejorar las posiciones de las paradas.