ES:Catastro español/Importación de edificios/Conversión de datos

From OpenStreetMap Wiki
Jump to navigation Jump to search
Guía de importación Gestión de proyectos Resultados Documentación
Spanish Cadastre Buildings Import.svg

En Conversión de datos se describe el procedimiento de conversión de los conjuntos de datos realizado por la herramienta CatAtom2Osm. Si quieres participar activamente pasa a la guía de importación.

Procedimiento de descarga

Los servicios ATOM son ficheros publicados en la red con una estructura específica XML que los navegadores identifican como ATOM y muestran sus contenidos con un estilo propio que añade funcionalidad al servicio.

No todos los navegadores permiten esta funcionalidad. Internet Explorer y Firefox sí permiten el acceso mediante un entorno de página que incorpora enlaces para la descarga, además de opciones de filtrado por texto y ordenación por fecha y título.

Los enlaces de los servicios ATOM son:

También puedes usar la herramienta de conversión para descargar los datos.

Contenido de los conjuntos de datos

La descripción completa del servicio de descarga se describe aquí (PDF 1,1 MB).

Las descargas son ficheros en formato ZIP que contienen los datos de cada objeto en ficheros GML, según las especificaciones definidas para los conjuntos de datos INSPIRE de la D.G. del Catastro, más un fichero XML con los metadatos de los datos descargados.

El nombre de los ficheros ZIP siguen el siguiente formato:

A.ES.SDGC.XX.GGMMM.zip

siendo:

  • A: cartografía actual
  • ES: España
  • SDGC: D. G. de Catastro
  • XX: (CP: Parcela Catastral, AD: Direcciones, BU: Edificios).
  • GGMMM: Código de catastro de Gerencia (GG) y Municipio (MMM)

Contenido del fichero ZIP de Parcela Catastral (CP)

  • A.ES.SDGC.CP.MD.GGMMM.xml: Fichero de metadatos.
  • A.ES.SDGC.CP.GGMMM.cadastralparcel.gml: Fichero GML de Parcela Catastral.
  • A.ES.SDGC.CP.GGMMM.cadastralzoning.gml: Fichero GML de Zona.

Contenido del fichero ZIP de Direcciones (AD)

  • A.ES.SDGC.AD.MD.GGMMM.xml: Fichero de metadatos.
  • A.ES.SDGC.AD.GGMMM.gml: Fichero GML de Direcciones.

Contenido del fichero ZIP de Edificios (BU)

  • A.ES.SDGC.BU.MD.GGMMM.xml: Fichero de metadatos.
  • A.ES.SDGC.BU.GGMMM.building.gml: Fichero GML de edificios.
  • A.ES.SDGC.BU.GGMMM.buildingpart.gml: Fichero GML de partes de edificio.
  • A.ES.SDGC.BU.GGMMM.otherconstruction.gml: Fichero GML de otras construcciones (piscinas).

Descripción de los datos

La descripción detallada del conjunto de datos y su estructura puede encontrarse aquí (PDF 372,6 kB).

Elementos del Conjunto de Datos de Parcela Catastral (CP)

  • CadastralParcel: Contiene la geometría, con topología de recinto, que delimita una parcela catastral.
  • CadastralZoning: Contiene la geometría de las manzanas urbanas y los polígonos de rústica.

Elementos del Conjunto de Datos de Direcciones (AD)

  • AD:Address: Es el objeto principal y existen tantas como direcciones físicas. Contiene la geometría del punto donde georreferencia esa dirección que corresponde, en unos casos al centroide de la parcela y en otros a la entrada del portal.

El objeto AD:Address se asocia hasta completar una dirección estructurada con otros objetos que no tienen definida una geometría, que son:

  • AD:ThoroughfareName: Nombre de la vía. En cada conjunto de datos existirán tantos como nombres de vía distintos.
  • AD:PostalDescriptor: Código postal. En cada conjunto de datos existirán tantos como códigos postales haya.
  • AD:AdminUnitName: Unidad administrativa.

Elementos del Conjunto de Datos de Edificios (BU)

  • Building: Es el objeto principal que define el edificio y representa la geometría de la huella de los edificios una serie de atributos definidos en esquema 2D extendido.
  • BuildingPart: Es cada una de las construcciones de una parcela catastral que tiene volumen homogéneo, y pueden ser sobre y bajo rasante. Tiene los atributos relacionados con la altura.
  • OtherConstructions: En este conjunto de datos catastrales solo consideramos las piscinas que contienen el atributo OtherConstructionNatureValue calificado como openAirPool.

Generación de etiquetas desde el conjunto de datos

Conversión de datos de Direcciones (AD)

Este capítulo describe el criterio de conversión de los elementos contenidos del fichero GML de Direcciones (A.ES.SDGC.AD.GGMMM.gml).

Elementos <AdminUnitName> (Municipios)

Conversión de elementos <AdminUnitName>
Etiqueta origen Descripción Etiqueta OSM Comentario
<AD:inspireId> +
<base:localId>
Código del municipio en formato GG.MMM (GG=Gerencia, MM=Municipio) N/A Este valor de identificación de la AdminUnitName será utilizado para trazar el nombre del municipio de los Address
<AD:name> Nombre del municipio en el campo <GN:text> N/A Este valor del nombre será utilizado en los Address que hagan referencia al identificador

Elementos <PostalDescriptor> (Códigos Postales)

Conversión de elementos <PostalDescriptor>
Etiqueta origen Descripción Etiqueta OSM Comentario
<AD:PostalDescriptor> Identificación del código postal N/A Este valor de identificación del código postal será utilizado para trazar el código postal de los Address
<AD:PostCode> Valor del código postal N/A Este valor del código postal será utilizado en los Address que hagan referencia al identificador

Elementos <ThoroughfareName> (Calles)

Conversión de elementos <ThoroughfareName> (Calles)
Etiqueta origen Descripción Etiqueta OSM Comentario
<AD:AlternativeIdentifier> Identificador del código de la calle N/A Este valor de identificación de la calle será utilizado para trazar el nombre de la calle de los Address
<AD:ThoroughfareNameValue> Valor del nombre de la calle en el campo GN:text N/A Este valor del nombre de la calle será utilizado en los Address que hagan referencia al identificador

Elementos <Address> (Direcciones)

Cada elemento <Address> incluido en el conjunto de datos se asignará a un elemento OSM como se describe aquí. Las etiquetas se generarán según la siguiente tabla:

Conversión de elementos <Address>
Etiqueta origen Descripción Etiqueta OSM Comentario
<AD:Position> +
<gml:Point>
Coordenadas geográficas <node lat=* lon=*> El sistema de coordenadas origen está especificado en la etiqueta srsName del elemento gml:Point y debe ser tenido en cuenta para la conversión de las coordenadas a EPSG:4326 (WGS84)
<AD:Position> +
<AD:specification>
Puede tener el valor de "Parcel" o "Entrance" entrance=yes La etiqueta se añadirá si el valor de origen es "Entrance"
<AD:locator> +
<AD:designator>
Su valor es el número del portal más el duplicado (letra) si lo hubiese. addr:housenumber=* No se importará cuando el valor sea S-N (sin número).
<AD:component
xlink:href="#ES.SDGC.TN.*">
Identificador del ThoroughfareName (Calle) correspondiente addr:street=*

/ addr:place=*

Nombre de la calle o lugar referenciado, según la abreviatura de tipo empleada por Catastro. Ver combinación de nombres de viales
<AD:component
xlink:href="#ES.SDGC.PD.*">
Identificador del PostalDescriptor (Código Postal) correspondiente addr:postcode=* Valor del código postal referenciado
<AD:component
xlink:href="#ES.SDGC.AU.*">
Identificador de la AdminUnit (Municipio) correspondiente N/A No se incluirá este dato

Conversión del Conjunto de Datos de Edificios (BU)

Este capítulo describe el criterio de conversión de los elementos contenidos del fichero GML de Edificios (A.ES.SDGC.BU.GGMMM.gml).

Elementos <Building> (Edificios)

Por cada elemento <Building> incluido en el conjunto de datos se creará una vía cerrada con nodos según las coordenadas geográficas especificadas en el anillo lineal exterior.

Si el elemento <Building> incluye uno o más anillos lineales interiores, se crearía una relación tipo multipolígono con la vía cerrada exterior como elemento outer y las vías cerradas interiores como elementos inner.

Algunos elementos <Building> pueden contener varios anillos exteriores. Esto ocurre cuando distintos edificios tienen la misma referencia catastral (campo <base:localId>).

Las etiquetas de la vía (o relación multipolígono en el caso de contar con anillos interiores) se generarían según la siguiente tabla:

Conversión de elementos <Building>
Etiqueta origen Descripción Etiqueta OSM Comentario
<bu-ext2d:geometry> +
<gml:Surface> +
<gml:exterior>
Lista de coordenadas geográficas que componen el anillo exterior del edificio <node lat=* lon=*>
<bu-ext2d:geometry> +
<gml:Surface> +
<gml:interior>
Lista de coordenadas geográficas de los diferentes anillos interiores (si existen) del edificio <node lat=* lon=*> Si el edificio contiene anillos interiores, se creará una relación de OSM tipo multipolígono para este edificio
<bu-core2d:inspireId> +
<base:localId>
Los 14 primeros caracteres de la referencia catastral N/A La referencia catastral se utiliza para trazar el edificio con la dirección correspondiente. Si se encuentra una dirección con la misma referencia catastral, las etiquetas de dicha dirección pueden incorporarse al edificio o a un nodo tipo entrada según el valor del campo <AD:specification> de la dirección.
<bu-core2d:conditionOfConstruction> Puede tener los valores:
  • ruin (ruinoso)
  • declined (deficiente)
  • functional (funcional)
  • Si bu-core2d:conditionOfConstruction es functional (funcional), el valor de bu-ext2d:currentUse se usará para confeccionar la etiqueta building.
  • Si bu-core2d:conditionOfConstruction es ruin (ruinoso), el valor de bu-ext2d:currentUse se usará para confeccionar la etiqueta abandoned:building.
  • Si bu-core2d:conditionOfConstruction es declined (deficiente), el valor de bu-ext2d:currentUse se usará para confeccionar la etiqueta disused:building.

Ver Estado de la construcción

bu-ext2d:currentUse Puede tener los valores:
  • 1_residential
  • 2_agriculture
  • 3_industrial
  • 4_1_office
  • 4_2_retail
  • 4_3_publicServices
<bu-ext2d:document> URL de acceso a la fotografía de fachada del edificio N/A No se importa, pero está disponible para comprobar números de portales. Ver File:Autorizacion fotos fachadas catastro.pdf.
Número de plantas sobre rasante building:levels=* Toma el valor máximo del campo <bu-ext2d:numberOfFloorsAboveGround> de las partes del edificio.
Número de plantas bajo rasante building:levels:underground=* Toma el valor máximo del campo <bu-ext2d:numberOfFloorsBelowGround> de las partes del edificio.

Elementos <BuildingPart> (Partes de Edificios)

Por cada elemento <BuildingPart> incluido en el conjunto de datos se creará una vía cerrada con nodos según las coordenadas geográficas especificadas en el anillo lineal exterior.

Si el elemento <BuildingPart> incluye uno o más anillos lineales interiores, se crearía una relación tipo multipolígono con la vía cerrada exterior como elemento outer y las vías cerradas interiores como elementos inner.

Las etiquetas de la vía (o relación multipolígono en el caso de contar con anillos interiores) se generarían según la siguiente tabla:

Conversión de elementos <BuildingPart>
Etiqueta origen Descripción Etiqueta OSM Comentario
<bu-ext2d:geometry> +
<gml:Surface> +
<gml:exterior>
Lista de coordenadas geográficas que componen el anillo exterior de la parte del edificio <node lat=* lon=*>
<bu-ext2d:geometry> +
<gml:Surface> +
<gml:interior>
Lista de coordenadas geográficas de los diferentes anillos interiores (si existen) de la parte del edificio <node lat=* lon=*> Si la parte del edificio contiene anillos interiores, se creará una relación de OSM tipo multipolígono para esta parte del edificio
<bu-core2d:inspireId> +
<base:localId>
Los 14 primeros caracteres de la referencia catastral, más un sufijo secuencial para cada parte "_partX" N/A La referencia catastral se utiliza para trazar la parte del edificio con el edificio correspondiente.
N/A N/A Se utiliza el valor 'roof' cuando el número de plantas sobre y bajo rasante es 0.
<bu-ext2d:numberOfFloorsAboveGround> Número de plantas sobre rasante building:levels=*
<bu-ext2d:numberOfFloorsBelowGround> Número de plantas bajo rasante building:levels:underground=*

Elementos <OtherConstructions> (Piscinas)

En el conjunto de datos del Catastro, los elementos <OtherConstructions> se refieren únicamente a las piscinas.

Por cada elemento <OtherConstructions> incluido en el conjunto de datos se creará una vía cerrada con nodos según las coordenadas geográficas especificadas en el anillo lineal exterior.

Si el elemento <OtherConstructions> incluye uno o más anillos lineales interiores, se crearía una relación tipo multipolígono con la vía cerrada exterior como elemento outer y las vías cerradas interiores como elementos inner.

Las etiquetas de la vía se generarían según la siguiente tabla:

Conversión de elementos <OtherConstructions> (Piscinas)
Etiqueta origen Descripción Etiqueta OSM Comentario
<bu-ext2d:geometry> +
<gml:Surface> +
<gml:exterior>
Lista de coordenadas geográficas que componen el anillo exterior de la piscina <node lat=* lon=*>
<bu-ext2d:geometry> +
<gml:Surface> +
<gml:interior>
Lista de coordenadas geográficas de los diferentes anillos interiores (si existen) de la piscina <node lat=* lon=*> Si la piscina contiene anillos interiores, se creará una relación de OSM tipo multipolígono para esta piscina
<bu-core2d:inspireId> +
<base:localId>
Los 14 primeros caracteres de la referencia catastral, más un sufijo secuencial para cada piscina "_PI.X" N/A N/A
N/A N/A leisure=swimming_pool
N/A N/A layer=1
location=roof
Cuando la piscina está dentro de un edificio

Conversión del Conjunto de Datos de Parcela Catastral (CP)

Este capítulo describe el criterio de conversión de los elementos contenidos del fichero GML de Parcelas Catastrales (A.ES.SDGC.CP.GGMMM.gml).

Elementos <CadastralParcel> (Parcela Catastral)

Se decide no importar las parcelas catastrales.

Elementos <CadastralZoning> (Zonas Catastrales)

Con los elementos <CadastralZoning> se generan tres ficheros en formato GeoJSON para crear proyectos en el gestor de tareas y para dividir los datos en tareas. Estos ficheros permiten crear un proyecto para todo el municipio o poner la parte de urbana y rústica en proyectos separados.

No se genera ninguna etiqueta o propiedad a partir de los datos, pero estos son los campos a tener en cuenta:

Conversión de elementos <CadastralZoning>
Etiqueta origen Descripción Etiqueta OSM Comentario
<cp:geometry> +
<gml:Surface> +
<gml:exterior>
Lista de coordenadas geográficas que componen el anillo exterior de la zona catastral <node lat=* lon=*>
<cp:geometry> +
<gml:Surface> +
<gml:interior>
Lista de coordenadas geográficas de los diferentes anillos interiores (si existen) de la zona catastral <node lat=* lon=*> Si la parcela contiene anillos interiores, se creará una relación de OSM tipo multipolígono para esta zona
<cp:inspireId> +
<base:localId>
Identificador de 9 caracteres para los polígonos y de 11 caracteres para las manzanas. N/A
<cp:levelName> +
<gmd:LocalisedCharacterString>
Dos valores posibles 'POLÍGONO ' y 'MANZANA ', que sirven para dividir los elementos en dos tipos: Rústicos y Urbanos. N/A Hasta la actualización de diciembre de 2017, el destino final del campo era levelName.

Etiquetado del conjunto de cambios

Se utilizarán las siguientes etiquetas para los conjuntos de cambios de la importación:

Etiquetas de los conjuntos de cambios
Etiqueta Valor Origen del dato
comment "#Spanish_Cadastre_Buildings_Import"
source "Dirección General del Catastro"
source:date Fecha en formato "AAAA-MM-DD" (Año-Mes-Día) Fecha indicada en las etiquetas <gmd:dateStamp>+<gco:Date> del fichero de metadatos de Edificios (BU) A.ES.SDGC.BU.MD.GGMMM.xml
source:date:addr Fecha en formato "AAAA-MM-DD" (Año-Mes-Día) Fecha indicada en las etiquetas <gmd:dateStamp>+<gco:Date> del fichero de metadatos de Direcciones (AD) A.ES.SDGC.AD.MD.GGMMM.xml
type "import"
url "https://wiki.openstreetmap.org/wiki/Spanish_Cadastre/Buildings_Import"

Problemas encontrados en los datos

Los problemas encontrados en el conjunto de datos que deben ser corregidos antes de convertirlos a formato OSM se relacionan en esta página: Problemas.

Proceso de conversión de los datos

Teniendo en cuenta la propuesta de generación de etiquetas y conversión de los diferentes elementos de los conjuntos de datos explicados en los apartados anteriores, el proceso completo de conversión de datos se resume en los siguientes pasos:

Proceso de conversión de los datos
Paso Descripción Comentario
1 Extracción de todos los CadrastalZoning (Zonas) del conjunto de datos de Parcela Catastral (CP). Se utilizarán las zonas catastrales para dividir las tareas en el gestor.
2.1 Extracción de todos los Address (Direcciones) del conjunto de datos de Direcciones (AD).
2.2 Extracción de todos los PostalDesriptor (Códigos Postales) del conjunto de datos de Direcciones (AD). Se combinan los códigos postales con las direcciones según sus referencias.
2.3 Extracción de todos los ThoroughfareName (Calles) del conjunto de datos de Direcciones (AD). Se combinan los nombres de calle con las direcciones según sus referencias.
3 Descarga de viales con nombre existentes en OSM. Necesarios para el siguiente paso.
4 Se corrigen los nombres de calles Si no existe fichero de conversión se genera uno y se detiene el proceso para revisión manual.
5 Elimina direcciones sin número de portal. 'S-N'.
6 Descarga de direcciones existentes en OSM Se combina excluyendo aquellas direcciones de Catastro que ya estén en OSM.
7.1 Extracción de todos los Building (Edificios) del conjunto de datos de Edificios (BU).
7.2 Extracción de todos los BuildingPart (Partes de Edificios) del conjunto de datos de Edificios (BU). Se trasladan los elementos a Building
7.3 Extracción de todos los OtherConstructions (Piscinas) del conjunto de datos de Edificios (BU). Se trasladan los elementos a Building
8 Procesado de Building. Se aplican todas las correcciones referentes a edificios, partes y piscinas mencionadas en problemas.
9 Desplaza las direcciones de tipo 'entrance' al contorno del edificio asociado. No se desplaza si la distancia es demasiado grande o la dirección se traslada a una esquina del edificio.
10 Asignación de tarea a la que pertenece cada elemento Building. Ver división de los datos en tareas.
11 Descarga de edificios y piscinas existentes en OSM. Se filtran los que entran en conflicto con Catastro para revisión manual.
12 Procesado de tareas. Se seleccionan los elementos de Building contenidos en cada manzana urbana, luego los contenidos en cada polígono rústico no procesados. A cada conjunto se le aplican los siguientes pasos.
12.1 Transformación al modelo de datos de OSM. Los polígonos se convierten en vías y en relaciones multipolígono si tienen huecos.
12.2 Fusión de las direcciones con los edificios con la misma referencia catastral. Todos las etiquetas de la dirección pasarán a formar parte de la vía/relación del edificio o nodo entrance en el contorno del mismo. Ver problemas relacionados con las direcciones aquí.
12.3 Generación de ficheros OSM XML para cada tarea Se crea una única instancia de los nodos o vías que tengan coordenadas y etiquetas idénticas.

La combinación de los datos se lleva a cabo en los pasos 3, 6 y 11.

Herramienta de conversión de datos

Para la realización del proceso de conversión de datos se ha desarrollado una herramienta en Python que toma de entrada los ficheros ZIP de los conjuntos de datos de cada municipio y genera los ficheros OSM, bien del municipio completo o bien dividido en manzanas para el Gestor de tareas. El programa se describe en esta página: CatAtom2Osm.

Validación del proceso de conversión de datos

Para la validación del proceso de conversión de datos se propone descargar los conjuntos de datos de varios Municipios, realizar la conversión de los datos y posteriormente realizar un análisis de los datos obtenidos.

Se deberán obtener las siguientes estadísticas de cada Municipio:

  • Datos de superficie y población del Municipio (obtenidos de la Wikipedia)
  • Número de Direcciones, Edificios y Partes de Edificios obtenidas.
  • Número de Direcciones sin asignar a edificios.
  • Número de Nodos, Vías y Relaciones OSM creadas.
  • Listado de errores detectados en la conversión.

Estos datos y otros son proporcionados por la herramienta de conversión en el fichero 'report.txt'.

También se realizará un análisis cualitativo:

  • Calidad de las geometrías (Precisión respecto a imágenes aéreas).
  • Detección de nodos duplicados o de edificios o partes superpuestas.

Los criterios a tener en cuenta para seleccionar los Municipios son:

  • Deben ser municipios de tamaños diferentes (del más grande al más pequeño). Los más grandes tendrán edificaciones más numerosas y complejas, mientras que los pequeños tendrán menos y más simples. Esto ayudará a estimar el volumen de datos que se incluirá en OSM.
  • Deben ser municipios de diferentes zonas geográficas de España (del Norte, Sur, Este, Oeste, Centro, Islas Canarias y Baleares), para verificar la correcta conversión de coordenadas geográficas.
  • Deben ser de Comunidades Autónomas diferentes, en donde puedan existir diferentes calidades o criterios de generación de los conjuntos datos.
  • En la medida de lo posible, deben ser Municipios cuyos datos convertidos puedan ser validados in situ por contribuidores de OSM-es o bien Municipios con datos existentes de edificaciones y direcciones que puedan ser contrastados sin una verificación local.

Resultados de la validación

El proceso de validación se detalla en esta página.