Conceptos básicos
Documentar
los datos es una tarea indispensable en el mundo digital en el cual nos
desenvolvemos. Los metadatos son, para esa finalidad, el vehículo para que los
usuarios dispongan de una fuente de conocimiento sobre el contenido y las
características de los propios datos.
Afinando
un poco más el concepto, los metadatos proveen una descripción de los datos que
incluye, por ejemplo:
- el título de los datos,
- la escala,
- el sistema de representación espacial,
- el sistema de referencia,
- el área geográfica que cubren,
- su formato,
- su mantenimiento,
- la procedencia o proceso de producción de los datos,
- el organismo responsable, y
- sus formas de acceso y utilización.
Si nos
preguntamos: ¿por qué debo crear metadatos?, la primera respuesta sería que
ante la diversidad de usos que pueden darse a los datos catastrales, se hace
necesario que los mismos dispongan de una documentación adecuada para facilitar
su reutilización en distintos tipos de aplicaciones.
Este
enfoque parte de considerar fundamentalmente a los usuarios externos a las
organizaciones catastrales, facilitándole la comprensión de los datos de modo
que sean capaces de entender que representan los datos y como lo representan, y
que puedan determinar asimismo que usos son factibles y que uso no son
factibles, de manera de utilizar los productos de datos apropiadamente y, con
ello, obtener el máximo beneficio de los mismos.
Por
otro lado, los usuarios pertenecientes a los catastros se ven beneficiados con
los metadatos porque:
- sirven para crear “memoria” en las organizaciones ante la rotación y el cambio de personal;
- preservan el contexto y la finalidad para la cual han sido creados los datos;
- permiten limitar las responsabilidades del organismo productor por el uso inapropiado de los datos; y
- son un elemento esencial tanto en la difusión como en la integración de los datos catastrales en las Infraestructuras de Datos Espaciales (IDEs).
Por los motivos expuestos, la generación de metadatos es considerada actualmente como una parte del proceso de producción y mantenimiento de los datos espaciales en general.
Los
metadatos deben estar basados en normas aceptadas por consenso. La adherencia a
las mismas trae consigo la posibilidad de disponer de programas informáticos
para facilitar la creación automatizada de metadatos, y asegurar a los usuarios
que puedan establecer comparaciones entre los mismos, lo que es imposible
sin una estandarización.
La norma es aplicable en la catalogación de todo tipo de recursos en repositorios de IDEs, servicios de datos, conjuntos de datos espaciales, series de conjuntos de datos y elementos geográficos individuales.
Norma internacional
La norma ISO 19115-1:2014 titulada
“Información Geográfica – Metadatos – Parte 1: Fundamentos”, tiene como
objetivo proporcionar un modelo para describir
en forma normalizada o estandarizada datos y servicios, aunque igualmente
puede aplicarse para describir información que no tienen una extensión
geográfica.
En principio podemos decir que se trata
una norma de propósito general, dado que otras normas abordan detalladamente
otros aspectos de la descripción de los datos, como la referida a la calidad
ISO 19157:2013, a la cual nos referiremos en una próxima entrada.
Concretamente esta norma define:
Concretamente esta norma define:
- secciones de metadatos, entidades de metadatos y elementos de metadatos, obligatorios y condicionales;
- un conjunto mínimo de metadatos requeridos para servir a la mayoría de aplicaciones de metadatos (búsqueda de datos, determinación de su adecuación al uso, acceso a los datos, transferencia de datos, y uso de los datos y servicios);
- elementos de metadatos opcionales que permitan una descripción estandarizada más amplia de los recursos, si fuera necesario; y
- un método para extender metadatos que se adapten a necesidades especiales.
La norma es aplicable en la catalogación de todo tipo de recursos en repositorios de IDEs, servicios de datos, conjuntos de datos espaciales, series de conjuntos de datos y elementos geográficos individuales.
Por otro lado, es importante señalar que
la ISO 19115-1:2014 es una revisión de las normas ISO 19115:2003 e ISO
19115:2003/Cor 1:2006, de manera que los metadatos que se han descrito de
acuerdo a las referidas normas o los perfiles nacionales o regionales derivados
de las mismas, permanecen tal como se encuentran definidos sin cambios, en
tanto que para la producción de nuevos datos se debe recurrir a la última
edición de norma revisada y aprobada en 2014.
Como cambios más importantes incluidos
en la ISO 19115-1:2014 tenemos que:
- se ha eliminado el concepto de núcleo de metadatos;
- todo lo referente a la calidad de los datos -como ya hemos indicado-, ha pasado a la norma ISO 19157:2013;
- se han incorporado metadatos de servicio de las normas ISO 19119:2005 e ISO 19119:2005/Amd 1:2008; y
- se ha agregado un Anexo para describir metadatos para la búsqueda de datos y servicios, entre otros.
Norma
Nacional
El Perfil de Metadatos para Datos
Vectoriales del proyecto IDERA (PMIDERA) es un estándar que emplea como base
la norma ISO 19115:2003. Los denominados perfiles no son otra cosa que
particularizaciones de la norma original para un determinado contexto
de uso.
Sito web de IDERA, sección del Grupo de Trabajo Metadatos
Las clases de metadatos considerados en
este Perfil refieren a:
- información de identificación;
- sistema de referencia espacial;
- información de distribución;
- información de calidad de datos; e
- información de metadatos.
De manera resumida
señalamos de que constan cada una de las clases o, también llamadas, entidades
de metadatos utilizadas por el PMIDERA:
Identificación: Contiene
información para identificar de modo único
los datos, e incluye entre otros
descriptores a el título, resumen, palabras clave, tema, escala, extensión
geográfica, etc.
Sistema de Referencia:
Esta clase está relacionada con la descripción del sistema referencia espacial
usado en el conjunto de datos. Incluye como entidades el sistema de referencia
espacial, la proyección, el elipsoide y el datum o marco de referencia
geodésico.
Distribución: Esta clase
contiene información sobre el organismo productor de un recurso y todas las
opciones y particularidades de distribución y difusión de dicho recurso.
Calidad de datos:
Esta entidad contiene una valoración cualitativa de la calidad del conjunto de
datos determinada por el linaje, que se refiere a las fuentes de información
utilizadas a partir de las cuales se ha generado y se mantiene el recurso bajo
documentación. Recordamos que los parámetros para determinar valores
cuantitativos de la calidad han sido derivados a la norma ISO 19157:2013.
Metadatos: Se
refiere a los metadatos sobre los propios metadatos e incluye a la norma,
perfil y versiones utilizadas para documentar los datos, la fecha de creación
de los metadatos, identificador, idioma, etc.
Así podemos ver que el paquete de
elementos de metadatos que contiene PMIDERA es un subconjunto mínimo de elementos considerados necesarios e
indispensables para catalogar los datos existentes.
El documento técnico (ver IDERA, 2014)
dispone en su Anexo I de una tabla con la descripción de cada elemento de
metadato acompañado de su implementación en lenguaje XML;
si se trata de un elemento obligatorio, opcional o condicional; su definición;
ejemplo práctico; ocurrencia; tipo de dato y dominio permitido (ej: texto
libre, código, constantes, fecha, etc.).
Parte del Anexo I de PMIDERA - Tabla que describe los elementos de metadatos
Como una forma de reducir las ambigüedades
y/o errores de interpretación y así evitar errores en la carga de datos, en el
Anexo II se incluyen recomendaciones mínimas para la redacción de campos de
carga libre, descripciones detalladas de cada elemento con ejemplos
ilustrativos, y dominio de valores posibles (*) cuando son aplicables al elemento.
La producción de metadatos y su
validación puede realizarse a través de diversas herramientas como el editor de
metadatos CatMDEdit, o aplicaciones específicas que forman parte de programas
SIG como en el caso del ArcCatalog de
ESRI y GeoMedia Catalog de Intergraph, o complementos como Metatools de QGIS, entre otras aplicaciones.
Cabe agregar que algunos elementos de metadatos pueden generarse en forma
automatizada, como la extensión geográfica de cobertura de los datos, norma de
metadatos y versión, idioma, tipo de representación espacial, etc.
Fuentes consultadas:
Infraestructura
de Datos Espaciales de la República Argentina (IDERA) (2014), Perfil de Metadatos para Datos Vectoriales -
Versión 2.0, http://www.idera.gob.ar/images/stories/downloads/estandares/PMIDERA_Perfil_Metadatos_p_Datos_Vectoriales_IDERA_V2_0.pdf
Instituto Geográfico Nacional de España (2016). Resumen Norma ISO 19115-1:2014 –
Metadatos-Parte 1: Fundamentos, http://metadatos.ign.es/MD-theme/documentos/ResumenISO19115_1.pdf
International Organization for
Standardization (2014). ISO 19115-1:2014 - Metadata -- Part 1: Fundamentals, https://www.iso.org/standard/53798.html
(*) Se refiere a un concepto de base de datos. Es el conjunto de valores posibles que pueden tener los atributos, es decir que son los valores que pueden adoptar los mismos con relación a un conjunto previamente especificado, por ejemplo: una fecha, una cadena de texto de longitud fija o variable, un número entero, etc.
No hay comentarios:
Publicar un comentario