Brazil/Validação/Conceitos

From OpenStreetMap Wiki
Jump to navigation Jump to search

Página de "glossário" e apoio para detalhamento dos conceitos utilizados na validação.

Introdução

Existe um leque amplo de ferramentas e metodologias de verificação e validação. No OSM são reunidas sob o tópico quality assurance. Não há uma metodologia única e sequencial, não há obrigatoriedade de se validar. Além disso cada país pode ter suas leis e peculiaridades, exigindo metodologias, regras e parâmetros de precisão e de validação diferentes.

Exemplo de regra de validação brasileira: cidades brasileiras necessariamente precisam estar (espacialmente) contidas nas UFs brasileiras.

A demanda por "dados válidos", precisos e conferidos com outras fontes, também varia a cada país, e, no caso do Brasil a sua comunidade não é das mais exigentes. Isso de qualquer forma pode mudar ao longo do tempo: a demanda por precisão e confiabibilidade deveria ser revisada pela comunidade OSM-BR ano a ano.

Fundamentos e conceitos

Contextualizando e definindo os elementos principais da validação.

Curadoria das fontes

As fontes principais são controladas pela tag Key:source. Os valores válidos de source para o OSM-BR são definidos em Brazilian data sources, Pt:Brazilian data sources e listados pelo taginfo keys/source#values. Outras fontes como GPS traces são criadas pelos próprios usuários.

Por exemplo geoftp.ibge.gov.br é uma fonte amplamente aceita, batizada com a tag IBGE, equanto Bing, GoogleMap, etc. são consideradas secundárias ou não aceitas (em geral por questões de licença). Quem sugere as fontes e "vota" na sua validade, é a comunidade OSM: denominamos curadoria da fonte ao processo coletivo de seleção, indicação de fonte potencial, e julgamento final das fontes.

Algumas fontes de dados podem ser utilizadas apenas para fins de confirmação, de que um dado já inserido com base em outra fonte coincide com o esperado. Denominaremos a essas fontes alternativas de "fontes de endosso".

Confiabilidade dos dados

O grau de confiança nos dados tem origem na confiança das fontes dos dados, nos softwares de processamento dos dados, na confiança entre usuários e na confiança das metodologias empregadas. Controle de qualidade, completeza e acurácia são os termos eleitos na OSM para designar as diferentes facetas da confiabilidade dos dados.

O tempo de exposição de um dado ao público, sem reclamações, também é um parâmetro de confiabilidade, mas só se torna objetivo através do endosso, ou da ocorrência de edições, que são indiretamente uma forma de endosso (ao não alterar ou se sustentar sobre o que está bom).

As metodologias, processos e ferramentas de validação são um recurso para elevar o grau de confiabilidade dos dados do OSM. Elas buscam agregar valor aos dados através do endosso de algoritmos de validação e dos operadores e assistentes da aplicação desses algoritmos em determinado conjunto de dados.

Relatórios de falhas

Assim como qualquer outra forma de controle de qualidade, durando o processo de validação podem ser detectadas falhas: elas precisam ser relatadas para que operações de correção sejam realizadas. Dois bons exemplos de relatório de "falhas e suspeitas":

Manifestações de endosso

Quando um usuário confirma ou aprova o que outro usuário fez, está endossando a modificação realizada. O "like" do Facebook e o "up vote" do Stackoverflow são exemplos populares de endosso. Há também o "endosso negativo", que é a manifestação de suspeita de falha. Este último é o único usado no OSM, e dispõe de boas ferramentas de geração de relatório, como o resultmaps.neis-one.org/osm-discussions.

O endosso, todavia, pode ser implícito: como na Wikipedia, quando alguém dá continuidade ao que o outro começou, ampliando mas não alterando, está indiretamente endossando. Da mesma forma se um usuário que roda um algoritmo de validação não reclama de uma nova edição, fica implícito que endossou. Atualmente (2017) não existem no OSM mecanismos explícitos de endosso (nem como um simples "like"), somente implícitos.

Classificação dos processos e ferramentas