ES talk:Importación NGBE

From OpenStreetMap Wiki
Jump to navigation Jump to search

Subclasificación de topónimos=

Algunas de las categorías TGS se corresponden con distintos tipos de elemento en OSM. En principio ocurre en las siguientes: 80301-80307, 80319, y 80500, al menos. Una forma de distinguir estas subcategorías es a través de la primera palabra del campo texto, buscando claves como: pico, cueva, lago, río, barranco, ... Hay 3875 palabras distintas en estas categorías. Habría que revisar una por una todas ellas separando las palabras que sean susceptibles de identificar un tipo de elemento etiquetado en OSM, prestando especial atención a modismos locales y lenguas vernáculas. Por ejemplo, cap=pico. Si quieres participar en este trabajo, descarga uno de estos archivos y apúntate:

Resultados

Ejemplos sql:

   select tgs, count(*) from ngbe where texto like 'Acequia %' group by tgs order by tgs;
   select texto, tgs from ngbe where (texto like 'Acequia %') and (tgs='80307' or tgs='80319') order by texto;
   select tgs, count(*) from ngbe where texto ~ '^Aljibes?' or texto ~ '^\(Las? \)?Balsas?' group by tgs order by tgs;
CLAVES ETIQUETAS OSM TGS NÚMERO
'Abrevadero %', 'Aguadero %', 'Bebedero %' amenity=drinking_water 80307

80319

18

13

'Acequia %' 80305

80306
80307

3

4
83

'^Aljibes?', '^\(La \)?Balsas?' landuse=reservoir 80305

80307
80319

23

1212
5

'^Arroyos?' waterway=stream 80303

80304
80305
80306
80307
80313
80316
80317
80318

3

32
336
3288
20019
3
15
116
83

'^Barran[cq]' waterway=stream 80303

80304
80305
80306
80307
80316
80317
80318

9

159
2821
15485
9
64
54

Otros

  • Picos = Alto
  • Ríos = Afluente
  • Golfos = Bahía, Cal
  • ??? = Abrigo, Agua, Agujero, Aigua, Aigüeta, Albufera, Baño, Baños
  • ¿Picos? = Aguja, Atalaya, Cabeza, Cabezas, Cabezo, Cabezón, Cabezos
  • ¿Embalses? = Balseta, Balsete, Balsetes, Balsica, Gavia, Galacho
  • Tunel o pozo horizontal = Galeria
  • Barranco = garganta
  • Torre = garita
  • Glaciar = Glaciar, Glacier
  • cueva = Gruta, Grutas
  • ¿Fuente? = Funte, fuete
  • ¿Muro? = Hilada
  • Cuenca = Hoya, Hoyas

Correcciones Aº, Aroyo, Árroyo -> Arroyo; Arroyodel; ArroyoTeixeiru; 'rrr'->'rr'; Barrancco, 'Barran co', Barrannco? -> Barranco; BarrancTancat

Clases a importar

¿Qué clases dentro del NGBE crees que no merece la pena importar a OSM? Después de importar los parajes, ¿cuál crees que debe ser la siguiente?

Mi opinión es que no tiene sentido la importación de topónimos referentes a grandes áreas, como son términos municipales, espacios naturales, comarcas, etc. Sería poco eficiente un nodo que indique, que se yo, Sierra Morena, en un espacio de cientos de kilómetros cuadrados. Lo mismo para grandes ríos y embalses. Mi relación a no importar seguro serían (80104, 80105, 80111, 80112, 80114, 80115, 80116, 80117, 80201, 80202, 80203, 80301, 80303, 80308, 80309, 80320, 80321, 80322, 80332, 80333, 80334 80503, 80504, 80505, 80506, 80509, 80601, 80603, 80606, 80608 y 80611).
Si miras el mapa a una escala grande (zoom=6, por ejemplo), se ven las etiquetas de algunas Comunidades Autónomas (ej. Andalucía, Cantabria) y otras no. Las que se ven es por que tienen un nodo con place=state, por ejemplo [6]. Hay etiquetas puntuales en OSM para superficies muy grandes, por ejemplo place=sea y propuestas Massif, Valley. En el caso de embalses, por ejemplo, habría que mirar si ya está mapeado y si no tiene el nombre ponérselo. Si no lo está, pienso que es mejor tener, al menos, el nombre en el mapa y disponible para búsquedas. En cualquier caso es bastante trabajoso. Mejor dejarlo para el final. Javiersanp 20:29, 14 April 2011 (BST)
Creo que a algunas entidades se les puede sacar utilidad. Por ejemplo, pequeños municipios, entidades locales y aldeas no están aún en OSM (no hace mucho señalé un pueblo de Badajoz de 2000 habitantes). El tema playas y entidades costeras se me escapa, pero quizás se le pueda sacar beneficio, si no a las más conocidas y grandes a las entidades más pequeñas.
Deberíamos seguir por aquellos que tienen una correspondencia con etiqueta OSM más directa, es decmontañas, picos y collados. Mientras vamos perfilando el tema hidrografía y cascos urbanos. mtaborda 10:45, 14 April 2011 (BST)
+1 Javiersanp 20:29, 14 April 2011 (BST)

Etiquetado

Puedes colaborar con la importación indicando en esta tabla las etiquetas más apropiadas para cada clase TGS.


primera queja

080214 Parajes 547194 place=locality
introducir mas de medio milion de localities no parece buen idea. Lo que he visto son nodos en medio de nada (solo campo) con un nombre y a unos 100 metros otro igual en medio del campo. De mi vista extranjera no veo una necesidad de importar un monton de datos, que nadie estara capaz de verificar. Deberia quitar el place=locality hasta que cada nodo esta verificado. No digo "borrar" el nodo, que quizas alguien ayuda. Con este monton de nombres nadie va a notar las aldeas, pueblos y ciudades que todavia faltan. ?Cuales son los ~20 capitales de mas de 100000 hab. (place=city) que no estan en [7] ?

La palabra paraje segun mi diccionario tiene como traduction area o region, que ademas no coresponde a un nodo. --Ottokar55 21:39, 17 April 2011 (BST)

"nadie va a notar las aldeas, pueblos y ciudades que todavía faltan." Me parece mapear para el mapa ES:Good practice#No se debe mapear pensando en el renderizado.

Esos "nodos en medio del campo" están ahí porque ese trozo de campo se conoce localmente con ese nombre concreto, no están puesto al azar. Durante la importación se ha procurado evitar duplicados, por lo que si detectas dos nodos con el mismo nombre a menos de 100 m se trata de un error y debe corregirse (indica los ID de los nodos y se revisará). El origen de los nodos importados es un trabajo de campo y oficina bastante exhaustivo (aunque con errores a pesar de ello) del Instituto Geográfico Nacional, con su propio mecanismo de depuración de información, por lo que se asume que tiene la suficiente calidad para importarse. A priori me parece más probable que esa información sea de más calidad que la introducida por mapeadores novatos u ocasionales con poca experiencia. --Carluti 09:36, 18 April 2011 (BST)

No he encontrado ya algun nombre doble. Tambien puede que tenga razon, que los nombres tengan muy buena calidad y estan todos conocido localmente. Pero solo localmente. Como estan nodos, no se conoce el area/la extension. Verificandolo con ortofotos parece imposible, porque aparecen en medio de nada sin limite logico (derivado de la foto). De esta manera no me fio en estos datos, puede que todo esta correcto y las fotos estan desplacado pero no creo que estamos capaces de verificar estos miles de nombres que probablemente usaban en la historia o quizas nunca. Ademas ?como marcamos los los nodos que estan verificado de un paisano? Mejor esconderlos hasta que alguien pone place=locality o aquel nombre a un bosque, un tereno ....

Es la misma idea que la importacion de zonas forestales, que tambien es un fracaso por su cualidad regular. Por lo menos este se puede verificar, que donde hay un pueblo/una ciudad/un lago/campo de trigo ... se nota y donde no hay arboles no hay bosque. --Ottokar55 12:33, 18 April 2011 (BST)

Esos "miles de nombres que probablemente usaban en la historia" forman parte de la toponimia que, en mi opinión, es un elemento cultural de gran valor patrimonial. Es importante evitar que se olviden. En cuanto a verificarlos, ya lo ha hecho el organismo que produce la cartografía oficial de este país. Javiersanp 16:28, 18 April 2011 (BST)


Otro ejemplo: "importacion de gasolineras" un gran porcentaje bien, pero algunos muchos estan doble, no existente o en otro lugar. Dudo que estos nombres y posiciones de lugares esten libres de errores. Han selecciónado seres humanos durante muchos años y como Javier dice estan a punto de la desaparición. Si tiene alguna importancia este lugar le van a dar otro nombre luego y si no queda solo el valor historico. Nombres y significativos cambian, eso es cierto.
Igual que lo de las zonas forrestales, introducimos algunas informaciones y esperemos que son fiable. !En los otros casos no son! Me da pena que mezclamos todo los "locality" que habia con mucho nuevo, sin pensar como verificar y mejorar esto. Por eso prefiero que solo se ve lo que esta verificado. Por la gran cifra que tiene no se nota los fallos al instante y tampoco creo que muchismos Osmeros van a escribir al email cuando tengan dudas o mejoras. Asi no se deberia esperar mucho tiempo para arreglarlo.
>Me parece mapear para el mapa
Si y no. Como muchos otros soy osmero para tener un buen mapa de hoy. Si todo esta "locality" como se puede distinguir de antiguos pueblos, monasterios,castillos, ruinas y otras cosas que se ve en la naturaleza o como indicador y estos nombres "arteficiales" para algun trozo del campo, bosque etc. "11 pinos" es ?que? un paraje, un pequeno bosque, campo porque quemaron todo el lugar -> no se sabe. --Ottokar55 17:51, 18 April 2011 (BST)

Espero que mi explication en ingles se entiende mejor.[8] --Ottokar55 20:15, 19 April 2011 (BST)

"Evitar que se olviden" no quiere decir que "están a punto de la desaparición". Conozco sitios que me ensañaron mis abuelos y mis padres y después de más de 30 años se siguen llamando igual y coinciden con los nombres que hemos importado. Trabajo a diario en el campo y cuando llego a zonas nuevas y voy conociendo los nombres de los lugares y fincas, resulta que los nombres que tienen son los mismos que aparecen en los mapas de hace 15, 20 o más años. No sé si te has movido mucho por España usando cartografía "clásica" (IGN o SGE), pero los que sí lo hemos hecho sabemos que los topónimos que aparecen en esos mapas se ajustan bastante a la realidad. ¿Qué tienen errores? Pues sí, pero en su gran mayoría son válidos y ya que lo comentas, mucho más fiables que la importación de zonas forestales que has mencionado, que ya suscitó bastante polémica en su día por la baja calidad de la información. --Carluti 15:26, 21 April 2011 (BST)

No tengo mapas de papel de España que merecen el nombre mapa (son las de la oficinas turisticas) y los otras estan hecho en otros países. Para mis caminatas han sido suficiente, pero no marcan muchos nombres.
Todavia no me parece apto introducir un montón de nombres que carecen valor adicional (altitud, extension) en esta forma (place=locality) y sin medida apropiada de mejoras, pero en fin es asunto de los Españoles. A mi me parecía mucho mas útil que pueblos, carreteras, ríos, bosques etc. estarían en su lugar y ofrecen algo mas detalle que solo un nombre. Por curiosidad me baje una parte de los picos que no pude manejar con JOSM en mi viejo ordenador (512MB RAM). Lo que se nota en el XML es otra vez la falta de informacion "practica" (altitud). Así no entiendo por que por otro lado no quereís introducir nombres de ríos, lagos u otros grandes áreas. Tendrán más valor que los parajes, según mi propia valoración. Y como no estan muchos ya en el mapa otros podrían utilisar este nombre cuando dibujan el río/lago... con BING, PNOA etc.

Si alguien puede extraer las capitales grandes de NGBE (080503), me dedico del milagro que por un lado llegan a ~70 capitales (calculando algunas que no tienen 100000 hab.) y NGBE a 94. Las islas igual se puede verificar 080332-080334 a mano(creo que ya estan en OSM, aunque solo conozco 12 islas de memoria) --Ottokar55 17:17, 27 April 2011 (BST)

Hola. No es que no queramos, sino que no se puede hacer todo de una vez. Hay que ir poco a poco y todo depende de la disponibilidad de los participantes. Me parece bien que el próximo paso sean las clases que indicas, pero por ahora me gustaría terminar con los picos y collados. Javiersanp 18:11, 28 April 2011 (BST)