Menu

¿Qué son los metadatos y para qué sirven?

Seguro que alguna vez habrás oído la palabra metadatos, un concepto que está muy extendido en la actualidad. Sin embargo, pocos saben realmente qué son, cuál es su función, si hay diferentes tipos, cómo se clasifican o las ventajas que tienen, entre otros. 


Para resolver todas estas cuestiones y alguna que otra más, en este artículo abordaremos estas preguntas y explicaremos la importancia que tienen y dónde encontrarlos en diferentes soportes. 


¿Qué te parece si empezamos con esta guía sobre metadata? 

 

¿Cuál es el significado del término metadatos? Definición 

La etimología de este vocablo da pistas sobre su significado grecolatino: 

 

  • meta (μετα): “después de” o “más allá de”. 
  • datos (datum): “lo que se da”. 

Así, podría decirse que esta palabra quiere decir “más allá de los datos”, es decir, datos que describen otros datos. 

 

Aplicado al ámbito de la informática, los “datos sobre datos” cobran una gran importancia ante la ingente cantidad de información que crece exponencialmente a diario generada por todos los usuarios. porque ¿Cómo podemos recopilar, clasificar, diferenciar o describir todos esos eventos ? Por ello, necesitamos utilizar metadatos.

 

De hecho, son de gran ayuda para ganar en eficiencia operativa y tomar mejores decisiones para conseguir ventajas competitivas. 

 

Cómo ver los metadatos de un archivo 

El proceso para visualizar la información sobre datos de un archivo es bastante fácil, puesto que casi todos los sistemas operativos los muestran rápidamente. 

 

Por ejemplo, en Windows tan solo hay que hacer clic derecho en el archivo, ir a Propiedades y luego a la pestaña Detalles para ver la información sobre el archivo. 

 

No obstante, a veces los metadata que muestra el sistema operativo son algo limitados si se comparan con el total que tienen. Así, habrá que usar otros recursos como Metapicz o Get Metadata. 

 

Qué información muestran los metadatos 

El tipo de información obtenida con los meta datos varía de acuerdo con el tipo de archivo analizado. Algunos de los más comunes son los siguientes: 


  • Imágenes: al tomar una foto, muchas cámaras digitales añaden datos útiles para su procesamiento como velocidad de obturación, apertura del diafragma, distancia focal, sensibilidad, con flash o sin flash, modo escogido (automático o manual), velocidad ISO, coordenadas del lugar donde se tomó la foto (si la cámara está equipada con GPS), resolución, peso, tamaño, modelo, marca y número de serie de la cámara utilizada, etc. 
  • Vídeos: al sacar un vídeo se incluyen datos útiles en una grabación, como el formato, duración, bitrate (tasa de bits o cantidad de información por cada unidad de tiempo, lo que da una idea tanto de su calidad como del tamaño del archivo), fecha de grabación y de edición, software utilizado, códec necesario para reproducirlo, etc. 
  • Materiales escritos: algunos de estos datos son la extensión (número de páginas, de palabras o de caracteres), el contenido (resumen, índice de capítulos, palabras clave, temas tratados), el autor, la fecha de creación, el tipo de contenido (libro, manual, texto legal, etc.), el formato, el número de revisiones, etc. 

Muchos de estos datos de datos se almacenan en formatos estandarizados (como el Exif), de modo que se asegura la compatibilidad entre diferentes equipos: los que alguien genere serán visibles para cualquier otra persona que necesite usarlos, y viceversa. 

 

Aunque algunos de estos datos son muy inofensivos, hay otros que sí pueden decir bastante, como los relacionados con el geoposicionamiento o el dispositivo empleado.  

 

Asimismo, en el caso de los documentos puede que no se quiera que otros sepan qué aplicación se ha usado exactamente. 


Clasificación de metadatos

Los datos sobre datos se clasifican utilizando tres criterios principales diferenciados:

Por su función

Los datos pueden pertenecer a uno de los tres tipos de funciones siguientes:

●        Subsimbólicos: no contienen información sobre su significado.

●        Simbólicos: detallan los datos subsimbólicos, por lo que dan sentido.

●     Lógicos: explican de qué modo los datos simbólicos pueden utilizarse para hacer deducciones de resultados lógicos, así que se caracterizan por la compresión.


Por su variabilidad

Estos datos pueden clasificarse en función de la variabilidad de los mismos en dos grupos:

●        Inmutables: no cambian independientemente de la parte del recurso que sea visible.

●        Mutables: son distintos de los demás e incluso difieren de parte a parte.


Por su contenido

La información sobre información se fracciona por su contenido, distinguiendo entre los que detallan el recurso en sí y los que describen el contenido de dicho recurso.

Sin embargo, se puede incluso subdividir estos dos grupos en más subgrupos dependiendo de la precisión con la que queramos llevar la clasificación de los datos.

Ciclo de la vida de los metadatos

Los datos de datos tienen una estructura según las funciones que realizan. En otras palabras, tienen un ciclo de vida que va detallando cada etapa por la que pasa, haciendo ciertas labores en cada una. Se puede distinguir el ciclo de vida en tres fases:

1. Creación

Se pueden desarrollar de distintas formas:

●    Forma manual: puede llegar a ser un procedimiento un tanto complicado, aunque depende del formato usado y del volumen que buscado.

●     Forma automática: el software recibe la información necesaria por sí mismo, sin ayuda externa. No obstante, es poco viable que el ordenador logre por sí solo extraer todos los datos automáticamente.

●       Forma semiautomática: se establecen una serie de algoritmos autónomos que sostiene el usuario y que no permiten que el software saque por sí mismo los datos deseados, sino que requiere ayuda externa.


2. Manipulación

Si los datos cambian, los metadatos también deben hacerlo, lo que se consigue fácilmente y de modo automático, si bien a veces se requiere ayuda humana.

3. Destrucción

En ocasiones se eliminan los datos sobre datos al mismo tiempo que sus recursos de manera conjunta. No obstante, hay veces en las que se conservan por distintos motivos, como por ejemplo para controlar las modificaciones en un documento.

Ventajas de la gestión de metadatos

Algunos de los principales beneficios de una buena administración de la “información sobre información” a la hora de mejorar los procesos de gestión y gobierno de datos son los siguientes:

Facilita búsquedas y análisis

Una buena gestión de datos ayuda a buscar y localizar datos, así como facilitar el análisis del curso de los datos desde la fuente, simplificando la auto-documentación, además de funciones de transformación, análisis y reporting.

Facilita la estandarización

Al suprimir errores e inconsistencias, la estandarización de datos aumenta la calidad de los mismos durante su ciclo de vida. Con la gestión de los datos en un repositorio centralizado se logra una visión más completa del ciclo de vida del dato, desde que es creado hasta que es consumido, además de ventajas en el control de procesos.

Ayuda a la integración

Los datos sobre datos son vitales en la integración híbrida. En efecto, con un repositorio centralizado de datos para el uso compartido entre los usuarios de TI y de negocio se facilita la administración, además de una aplicación de las mejores prácticas por parte de los mismos. Y es que son muy útiles en estructuras híbridas para mejorar la gestión de datos de modo integrado.

Gestión del cambio

La gestión de metadatos, especialmente en entornos complejos, da la visibilidad y el control requeridos para hacerlo en un entorno de integración de datos empresariales. Mediante una automatización de los análisis de impacto se detectan los cambios en las aplicaciones y se puede intervenir para solucionar conflictos.

Más seguridad

Si hay cambios, una correcta gestión de datos sobre datos protegerá los datos críticos del negocio y facilitará el cumplimiento de la normativa.

Mejora los informes

Gracias a la facilidad de intervención, los datos serán de calidad, los procesos no tendrán incidencias y el reporting ganará en confiabilidad. Así, una correcta gestión de la información permitirá entregar datos seguros y confiables.

Desarrollos más ágiles

Un acceso inteligente a los datos sobre datos multiplica la productividad de los desarrolladores y reduce el plazo de suministro de la conectividad, lo que se traduce en una rebaja del coste del cambio entre las distintas plataformas.

Mejor gobernanza de datos

Los datos de datos administrados en un entorno estandarizado con un repositorio centralizado son fundamentales para implementar un exitoso programa de gobierno de datos. Entre otros beneficios, la gestión de estos datos incrementa la visibilidad de las diferentes ejecuciones de patrones y gestión de distintas fuentes de datos, favoreciendo una gobernanza centralizada, además de las mejores prácticas.

 

Tan importante como entender qué son los metadatos es implementar una adecuada gestión de los mismos. ¿Tienes ya tu estrategia de gestión de los datos sobre datos? En Intelequia te ofrecemos el mejor asesoramiento en este sentido, así que no dudes en contactarnos.