martes, 25 de abril de 2017

Documentando los datos catastrales: los metadatos

Conceptos básicos

Documentar los datos es una tarea indispensable en el mundo digital en el cual nos desenvolvemos. Los metadatos son, para esa finalidad, el vehículo para que los usuarios dispongan de una fuente de conocimiento sobre el contenido y las características de los propios datos.

Afinando un poco más el concepto, los metadatos proveen una descripción de los datos que incluye, por ejemplo:
  •  el título de los datos,
  • la escala,
  • el sistema de representación espacial,
  • el sistema de referencia,
  • el área geográfica que cubren,
  • su formato,
  • su mantenimiento,
  • la procedencia o proceso de producción de los datos,
  • el organismo responsable, y
  • sus formas de acceso y utilización.

Si nos preguntamos: ¿por qué debo crear metadatos?, la primera respuesta sería que ante la diversidad de usos que pueden darse a los datos catastrales, se hace necesario que los mismos dispongan de una documentación adecuada para facilitar su reutilización en distintos tipos de aplicaciones.

Este enfoque parte de considerar fundamentalmente a los usuarios externos a las organizaciones catastrales, facilitándole la comprensión de los datos de modo que sean capaces de entender que representan los datos y como lo representan, y que puedan determinar asimismo que usos son factibles y que uso no son factibles, de manera de utilizar los productos de datos apropiadamente y, con ello, obtener el máximo beneficio de los mismos.

Por otro lado, los usuarios pertenecientes a los catastros se ven beneficiados con los metadatos porque:
  • sirven para crear “memoria” en las organizaciones ante la rotación y el cambio de personal;
  • preservan el contexto y la finalidad para la cual han sido creados los datos;
  • permiten limitar las responsabilidades del organismo productor por el uso inapropiado de los datos; y
  • son un elemento esencial tanto en la difusión como en la integración de los datos catastrales en las Infraestructuras de Datos Espaciales (IDEs).

Por los motivos expuestos, la generación de metadatos es considerada actualmente como una parte del proceso de producción y mantenimiento de los datos espaciales en general.

Los metadatos deben estar basados en normas aceptadas por consenso. La adherencia a las mismas trae consigo la posibilidad de disponer de programas informáticos para facilitar la creación automatizada de metadatos, y asegurar a los usuarios que puedan establecer comparaciones entre los mismos, lo que es imposible sin una estandarización.


Norma internacional

La norma ISO 19115-1:2014 titulada “Información Geográfica – Metadatos – Parte 1: Fundamentos”, tiene como objetivo proporcionar un modelo para describir en forma normalizada o estandarizada datos y servicios, aunque igualmente puede aplicarse para describir información que no tienen una extensión geográfica. 


En principio podemos decir que se trata una norma de propósito general, dado que otras normas abordan detalladamente otros aspectos de la descripción de los datos, como la referida a la calidad ISO 19157:2013, a la cual nos referiremos en una próxima entrada.

Concretamente esta norma define:
  • secciones de metadatos, entidades de metadatos y elementos de metadatos, obligatorios y condicionales;
  • un conjunto mínimo de metadatos requeridos para servir a la mayoría de aplicaciones de metadatos (búsqueda de datos, determinación de su adecuación al uso, acceso a los datos, transferencia de datos, y uso de los datos y servicios);
  • elementos de metadatos opcionales que permitan una descripción estandarizada más amplia de los recursos, si fuera necesario; y
  • un método para extender metadatos que se adapten a necesidades especiales.

La norma es aplicable en la catalogación de todo tipo de recursos en repositorios de IDEs, servicios de datos, conjuntos de datos espaciales, series de conjuntos de datos y elementos geográficos individuales.

Por otro lado, es importante señalar que la ISO 19115-1:2014 es una revisión de las normas ISO 19115:2003 e ISO 19115:2003/Cor 1:2006, de manera que los metadatos que se han descrito de acuerdo a las referidas normas o los perfiles nacionales o regionales derivados de las mismas, permanecen tal como se encuentran definidos sin cambios, en tanto que para la producción de nuevos datos se debe recurrir a la última edición de norma revisada y aprobada en 2014.

Como cambios más importantes incluidos en la ISO 19115-1:2014 tenemos que:
  • se ha eliminado el concepto de núcleo de metadatos;
  • todo lo referente a la calidad de los datos -como ya hemos indicado-, ha pasado a la norma ISO 19157:2013;
  • se han incorporado metadatos de servicio de las normas ISO 19119:2005 e ISO 19119:2005/Amd 1:2008; y
  • se ha agregado un Anexo para describir metadatos para la búsqueda de datos y servicios, entre otros.


Norma Nacional

El Perfil de Metadatos para Datos Vectoriales del proyecto IDERA (PMIDERA) es un estándar que emplea como base la norma ISO 19115:2003. Los denominados perfiles no son otra cosa que particularizaciones de la norma original para un determinado contexto de uso.


Sito web de IDERA, sección del Grupo de Trabajo Metadatos

Las clases de metadatos considerados en este Perfil refieren a:
  • información de identificación;
  • sistema de referencia espacial;
  • información de distribución;
  • información de calidad de datos; e
  • información de metadatos.

De manera resumida señalamos de que constan cada una de las clases o, también llamadas, entidades de metadatos utilizadas por el PMIDERA:

Identificación: Contiene información para identificar de modo único  los datos, e  incluye entre otros descriptores a el título, resumen, palabras clave, tema, escala, extensión geográfica, etc.

Sistema de Referencia: Esta clase está relacionada con la descripción del sistema referencia espacial usado en el conjunto de datos. Incluye como entidades el sistema de referencia espacial, la proyección, el elipsoide y el datum o marco de referencia geodésico.

Distribución: Esta clase contiene información sobre el organismo productor de un recurso y todas las opciones y particularidades de distribución y difusión de dicho recurso.

Calidad de datos: Esta entidad contiene una valoración cualitativa de la calidad del conjunto de datos determinada por el linaje, que se refiere a las fuentes de información utilizadas a partir de las cuales se ha generado y se mantiene el recurso bajo documentación. Recordamos que los parámetros para determinar valores cuantitativos de la calidad han sido derivados a la norma ISO 19157:2013.

Metadatos: Se refiere a los metadatos sobre los propios metadatos e incluye a la norma, perfil y versiones utilizadas para documentar los datos, la fecha de creación de los metadatos, identificador, idioma, etc.

Así podemos ver que el paquete de elementos de metadatos que contiene PMIDERA es un subconjunto mínimo de elementos considerados necesarios e indispensables para catalogar los datos existentes.

El documento técnico (ver IDERA, 2014) dispone en su Anexo I de una tabla con la descripción de cada elemento de metadato acompañado de su implementación en lenguaje XML; si se trata de un elemento obligatorio, opcional o condicional; su definición; ejemplo práctico; ocurrencia; tipo de dato y dominio permitido (ej: texto libre, código, constantes, fecha, etc.).

Parte del Anexo I de PMIDERA - Tabla que describe los elementos de metadatos
  
Como una forma de reducir las ambigüedades y/o errores de interpretación y así evitar errores en la carga de datos, en el Anexo II se incluyen recomendaciones mínimas para la redacción de campos de carga libre, descripciones detalladas de cada elemento con ejemplos ilustrativos, y dominio de valores posibles (*) cuando son aplicables al elemento.

La producción de metadatos y su validación puede realizarse a través de diversas herramientas como el editor de metadatos CatMDEdit, o aplicaciones específicas que forman parte de programas SIG como en el caso del ArcCatalog de ESRI y GeoMedia Catalog de Intergraph, o complementos como Metatools de QGIS, entre otras aplicaciones. Cabe agregar que algunos elementos de metadatos pueden generarse en forma automatizada, como la extensión geográfica de cobertura de los datos, norma de metadatos y versión, idioma, tipo de representación espacial, etc.

Fuentes consultadas:

Infraestructura de Datos Espaciales de la República Argentina (IDERA) (2014), Perfil de Metadatos para Datos Vectoriales - Versión 2.0, http://www.idera.gob.ar/images/stories/downloads/estandares/PMIDERA_Perfil_Metadatos_p_Datos_Vectoriales_IDERA_V2_0.pdf

Instituto Geográfico Nacional de España (2016). Resumen Norma ISO 19115-1:2014 – Metadatos-Parte 1: Fundamentos, http://metadatos.ign.es/MD-theme/documentos/ResumenISO19115_1.pdf

International Organization for Standardization (2014).  ISO 19115-1:2014 - Metadata -- Part 1: Fundamentals,  https://www.iso.org/standard/53798.html

(*) Se refiere a un concepto de base de datos. Es el conjunto de valores posibles que pueden tener los atributos, es decir que son los valores que pueden adoptar los mismos con relación a un conjunto previamente especificado, por ejemplo: una fecha, una cadena de texto de longitud fija o variable, un número entero, etc.