¿Cuál es la Web del futuro? Linked Data y Linked Open Data

Hace 25 años el inglés Tim Berners-Lee con la ayuda del belga Robert Cailliau desarrollaron las ideas fundamentales que estructuran la web. Crearon lo que se denomina Lenguaje HTML (HyperText Markup Language), el protocolo HTTP (HyperText Transfer Protocol) y el sistema de localización de objetos en la web URL (Uniform Resource Locator).

Los documentos e información disponibles hasta ese momento estaban en diferentes formatos y sistemas informáticos incompatibles entre sí, lo que producía que se desaprovechara un gran potencial de acceso a la información. WWW reformuló la forma en que usábamos la información: enlaces en documentos que podían apuntar a cualquier otro documento.

Pero todavía hay un gran potencial por delante. Hoy día hay multitud de documentos subidos a la red, pero no tenemos datos como tales en la web. ¿Qué diferencia hay entre datos y documentos? Leemos documentos en la red y seguimos enlaces entre ellos. Pero solemos pensar que los datos, como tales, son oscuros, difíciles de interpretar y aburridos. Pero los datos gobiernan gran parte de nuestras vida debido a que alguien los agrupa, analiza y hace algo con ellos. Por ello es importante disponer del mayor número de datos posible.

Imaginemos un mundo donde todo el mundo -y los dispositivos- pongan datos en la web y dónde casi cualquier tipo de dato que imaginemos esté disponible en todo momento. Esto es lo que se conoce como Linked Data.

Linked Data describe un método de publicación de datos estructurados para que puedan ser interconectados y más útiles. Se basa en tecnologías Web estándar (HTTP, RDF y URI) pero en vez de utilizarlos para servir páginas web para los lectores humanos, las extiende para compartir información de una manera que puede ser leída automáticamente por ordenadores. Esto permite que sean conectados y consultados datos de diferentes fuentes.

No se trata únicamente de la publicación de datos en la Web, sino que éstos se pueden vincular a otros, de forma que las personas y las máquinas puedan explorar la web de los datos, pudiendo llegar a información relacionada que se hace referencia desde otros datos iniciales.

Tim Berners-Lee propone usar el mismo protocolo de transferencia de hipertexto (HTTP) que usamos en actualmente para acceder a documentos para acceder a datos. Si se puede recuperar estos datos utilizando el protocolo HTTP de la Web, entonces podré obtener datos información útil en un formato estándar.
Estos datos no son sólo información (por ejemplo el peso, la altura y la fecha de nacimiento de alguien), sino que son datos relacionados. Los datos son relaciones.

El potencial de este recurso es directamente proporcional a la cantidad de datos que tengamos: a más datos más útil y poderosa será la información que se podrá extraer. Esto es algo no fácil de conseguir, ya que la cultura actual de personas y empresas es la de no compartir estos datos (la información es poder). Posiblemente gran parte del conocimiento humano en la actualidad esté en bases de datos no públicas.

Esto lleva al concepto de Linked Open Data. Mientras que el término Linked Data -o conjunto de buenas prácticas para la publicación de datos-  no implica que los datos deban ser de utilización libre o abiertos, el Linked Open Data postula lo contrario. Linked Open Data indica que son datos abiertos en RDF (que es el estándar para la Web Semántica). Esto significa que el usuario puede enlazar datos provenientes de diversas fuentes, instituciones u organizaciones, explorar y combinar estos datos de manera libre y sin restricciones de copyright para nuevos desarrollos web.

Esto es un nuevo escalafón hacia la concreción de la llamada Web Semántica, que no sólo traerá documentos, sino también información relacionada que describe el contenido, su significado y la relación de los datos.

Algunas de las ventajas del Linked Open Data son facilitar la investigación, facilitar las contribuciones y colaboraciones, aumentar la eficiencia y calidad de los sistema y conseguir un alta transparencia de las instituciones.

Por último, cabe destacar la necesidad de usar formatos no propietarios en Linked Open Data, es decir, formatos abiertos que están caracterizados por ofrecer toda la información sobre su formato e implementación y permitir el uso libre y sin pagar derechos de uso, como por ejemplos los son CSV, JSON, XML y RDF. Su estructura interna es pública y cualquier aplicación puede integrarlo para importar y exportar datos en ese formato.

Para saber más:
Tim Berners-Lee acerca de la futura Web.
Linked Open Data: ¿Qué es?
What are Linked Data and Linked Open Data?

Deja una respuesta