Printer Friendly

El portal de datos abiertos de la Union Europea: analisis y evaluacion.

European Union Open Data Portal: analysis and evaluation

1 INTRODUCCION

Las iniciativas de datos abiertos se constituyen en un elemento clave que favorece las politicas de transparencia de las Administraciones Publicas, aseguran el libre acceso a los datos a todos los ciudadanos y promueven oportunidades de negocio a partir de la reutilizacion de los datos publicos como materia prima.

Estas iniciativas, ampliamente extendidas durante los ultimos anos, se han apoyado para su impulso en dos pilares clave: el desarrollo de las nuevas tecnologias, que facilitan que la informacion pueda ser publicada, relacionada y compartida de forma eficaz, y las politicas de gobierno abierto u open government, que fomentan estrategias orientadas al avance de una sociedad digital asentada sobre los principios de transparencia, colaboracion y participacion.

Estos principios son formulados por primera vez por el Presidente de los Estados Unidos, Barack Obama, en enero de 2009 en el Memorandum de Transparencia y Gobierno Abierto (Obama, 2009: 4685-4686). Con tal comunicado la administracion de este pais adquiria un compromiso con el gobierno abierto y con la aplicacion de acciones especificas para el desarrollo de los principios enunciados. El gobierno federal de los Estados Unidos responde rapidamente al llamamiento con la inauguracion de su portal de datos abiertos en abril de ese mismo ano (1), constituyendose como uno de los portales pioneros en la distribucion de datos abiertos de una administracion publica. Al poco tiempo, otros paises como Reino Unido, Nueva Zelanda o Canada seguiran esta tendencia de apertura de datos a traves de sus portales.

La existencia de liderazgo y voluntad politica es, sin duda alguna, otro de los puntos fuertes para el progreso de esta filosofia alrededor del gobierno abierto. En el caso de Europa, esta voluntad y liderazgo queda expresada en las numerosas intervenciones de Neelie Kroes, Vicepresidenta de la Comision Europea y actual Comisaria de la Agenda Digital Europea, autodeclarada "fan" del movimiento de datos abiertos y partidaria de una informacion publica para todos (Kroes, 2011).

Las politicas europeas en torno a la reutilizacion de la informacion publica suponen tambien un importante empuje para el desarrollo de los portales de datos abiertos. Estas politicas quedan reflejadas en diferentes documentos publicados por la Union Europea a lo largo de varios anos, como son: el Libro Verde sobre la informacion del Sector Publico en la Sociedad de la Informacion (Comision Europea, 1998), la Directiva 2003/98/CE relativa a la reutilizacion de la informacion del sector publico (Union Europea, 2003), la comunicacion COM (2011) 882 de la Comision sobre Datos abiertos: un motor para la innovacion, crecimiento y gobernanza transparente (Comision Europea, 2011), la Decision 2011/833/UE de la Comision sobre la reutilizacion de los documentos de la Comision (Union Europea, 2011) o la reciente Directiva 2013/37/UE por la que se modifica la Directiva 2003/98/CE relativa a la reutilizacion de la informacion en el sector publico (Union Europea, 2013).

La Directiva 2013/37/UE establece politicas de apertura a la informacion, propiciando la disponibilidad y la reutilizacion de la informacion en el sector publico con fines privados o comerciales, con restricciones minimas o nulas de caracter juridico, tecnico y economico, buscando favorecer la circulacion de la informacion no solo para los agentes economicos, sino tambien entre el publico en general.

La nueva Directiva se relaciona tambien con la Agenda Digital Europea, iniciativa emprendida por la Comision Europea (2010) (2) que, a su vez, promueve la comunicacion de la Comision Europea sobre datos abiertos como motor para la innovacion, el crecimiento y la gobernanza transparente. Este documento es tambien un importante referente para la armonizacion de las normas y practicas nacionales en materia de reutilizacion, proporcionando considerables mejoras para la reutilizacion transfronteriza de los datos (3).

Los portales de datos abiertos suponen el elemento mas visible de las politicas en materia de Open Government y una de las principales herramientas de acceso a los recursos informativos del sector publico (Martin, 2011: 113-134). Pueden considerarse, ademas, como el principal producto tangible en el que se van a ver materializadas las estrategias politicas de las diferentes administraciones publicas en torno al gobierno abierto.

Estos portales se han convertido tambien en una "ventanilla unica" que la administracion pone al servicio del ciudadano, evitando la dispersion de contenidos entre las diferentes paginas Web de los organismos publicos. Facilitan, por tanto, el acceso y la reutilizacion de la informacion y deberian responder, mas alla de ser meras herramientas, repositorios o catalogos de datos, a una vocacion de servicio publico. En este sentido, hay que indicar que no se trata de generar datos a la carta, sino de poner a disposicion de conjuntos de datos que sean mantenidos, que se encuentren actualizados y en formatos estructurados para su consulta y reutilizacion.

Los reutilizadores de la informacion defienden el uso de la publicacion de datos en crudo o raw data. Este tipo de formato esta compuesto exclusivamente por datos sin tratar ni catalogar (Pintos; Marin, 2013: 72-77). Para este sector infomediario (4) resulta de especial interes el conseguir estos ficheros de datos en bruto, pero en formatos que puedan posteriormente gestionar y manipular con la intencion de generar productos o servicios de valor anadido.

Como afirma L. Fernando Ramos y otros autores del Grupo Publidoc de la Universidad Complutense de Madrid "un gran numero de estados miembros han iniciado, con mayor o menor entusiasmo, la creacion de portales open data con el objetivo principal de hacer accesible a los ciudadanos la informacion publica disponible y, al mismo tiempo, facilitar a los infomediarios el uso de la informacion orientada a fines economicos y sociales " (Ramos y otros, 2012).

2 OBJETIVOS Y METODOLOGIA

El objetivo general del estudio es ofrecer una valoracion sobre la situacion actual del portal, identificar buenas practicas y establecer posibles recomendaciones de mejora. Como objetivos especificos en relacion con dicho objetivo general, se formulan los siguientes:

* Presentar una descripcion global del portal como proyecto estrategico en el marco de la Agenda Digital para Europa.

* Analizar los conjuntos de datos disponibles a partir de una serie de indicadores relacionados con: editores, formatos disponibles y otros elementos complementarios de analisis.

* Evaluar los formatos de recursos, atendiendo a su condicion como materia prima para la reutilizacion.

* Analizar los diferentes estandares en uso del portal.

Se ha seguido una metodologia de investigacion de tipo mixto que ha consistido en:

* Un analisis cuantitativo de los conjuntos de datos a partir de los indicadores previamente identificados y seleccionados: conjuntos de datos, editores, editores por tipo de entidad, editores por pais, conjuntos de datos por editor, formatos, formatos reutilizables y no reutilizables. Para poder llevarlo a cabo se ha utilizado el lenguaje de consulta SPARQL a traves del editor terminal de consultas que ofrece el propio portal (5).

* Un analisis cualitativo del portal basado en la observacion por medio de la navegacion del portal, en muchos casos "registro a registro", la identificacion de los elementos principales, los modos de busqueda y presentacion de los resultados, estandares en uso y metadatos disponibles. La evaluacion de los formatos de recursos toma como base el esquema de las "5 estrellas de los datos abiertos " (Bernes-Lee, 2006) (6), que se apoya en un sistema piramidal de asignacion de estrellas para determinar el grado de disponibilidad y accesibilidad de los formatos, correspondiendo la asignacion de una estrella al grado de menor valor y la asignacion de cinco estrellas al de maximo valor (ver tabla 1).

Este estudio se ha desarrollado en el periodo comprendido entre enero de 2014 y mayo del 2014.

3. RESULTADOS

3.1 EL PORTAL DE DATOS ABIERTOS DE LA UNION EUROPEA: UNA VISION GLOBAL

El portal de datos abiertos de la Union Europea (7) puede considerarse como un proyecto estrategico dentro de los objetivos marcados por la Agenda Digital para Europa. Este portal se presenta como un punto de acceso unico para una gran diversidad de datos que han sido producidos por las diversas instituciones y organismos de la Union Europea (ver figura 1).

[FIGURA 1 OMITIR]

Mediante la Decision 2011/833/UE de la Comision, de 12 de diciembre de 2011, relativa a la reutilizacion de los documentos de la Comision se insta a lo siguiente:

"debe crearse un portal de datos como punto de acceso unico a los documentos disponibles para ser reutilizados. Debe adoptarse una disposicion que tenga en cuenta la tendencia hacia formatos legibles por maquina. Una importante mejora con respecto a la Decision 2006/291/CE que consiste en ofrecer en general documentos de la Comision para su reutilizacion a traves de licencias abiertas de reutilizacion o sencillas clausulas de exencion de responsabilidad, sin necesidad de efectuar solicitudes individuales" (Union Europea, 2011).

Con dicha iniciativa se pretendia desarrollar un portal Web que actuara como un unico punto de acceso a los conjuntos de datos producidos y mantenidos por los servicios de la Comision Europea y, por extension, a los conjuntos de datos producidos y mantenidos por otras instituciones y organismos europeos. El portal de datos de la Union Europea se abre al publico en una version beta a finales de diciembre del ano 2012 y se inaugura oficialmente en enero del ano 2013.

La gestion operativa del portal recae en la Oficina de Publicaciones de la Union Europea y su coordinacion en la Direccion General de Redes de Comunicacion, Contenido y Tecnologias de la Comision Europea que es la responsable directa de la politica de datos abiertos. Hay que resaltar que dicha politica se basa en el principio de que la informacion publica debe estar a disposicion del ciudadano y poder utilizarse y reutilizarse libremente. En este sentido, se promueve el uso de los datos como un medio para fomentar el desarrollo de nuevos proyectos innovadores, aprovechando toda la informacion semantica que contienen. Tal y como indican en el propio portal Web los "datos se pueden utilizar, reutilizar, enlazar y redistribuir gratuitamente con fines comerciales o no comerciales" (Portal Europeo de Datos Abiertos, 2014).

La arquitectura del portal se basa en soluciones de software libre como el sistema de gestion de contenidos Drupal o el sistema para la gestion de datos CKAN (8) y utiliza tecnologias de la Web Semantica para relacionar los datos y presentarlos, como RDF Virtuoso (9) y el editor SPARQL10 para su consulta.

En cuanto a sus contenidos, este recurso es un importante activo de informacion para el conjunto de estados miembros de la Union Europea y, por consiguiente, es un importante vehiculo de propagacion de la informacion que la Union Europea genera y pone a disposicion de la sociedad en general y de los investigadores en particular. Con este recurso de acceso facil y gratuito a los datos, la Comision Europea tambien pretende fomentar el uso publico de los datos y su reutilizacion en beneficio de nuevos proyectos innovadores y transfronterizos.

El portal se presenta por medio de un catalogo de metadatos que facilita el acceso a los conjuntos de datos o datasets disponibles. Los metadatos son vinculados y normalizados basandose en estandares que facilitan su recuperacion y reutilizacion posterior. Estos conjuntos de datos se encuentran disponibles en formatos que permiten su interpretacion humana, siendo tambien legibles por un ordenador para facilitar su inmediata reutilizacion. Existen tambien conjuntos de datos sin procesar que utilizan aplicaciones de visualizacion que han sido elaboradas con el fin de que puedan ser consultados y reutilizados. Estas aplicaciones han sido creadas por diversos proveedores de datos y conforman una serie de herramientas excepcionales para explorar, interpretar y reutilizar de forma eficiente la informacion suministrada.

Las aplicaciones se muestran en una galeria que incluye 10 herramientas (11). Cabe destacar, entre estas aplicaciones, el Marcador de la Agenda Digital (DG Connect), para la creacion de graficos de forma interactiva a partir de la consulta de datos; el Visor de Mapas del Centro Europeo de Informacion Forestal (EFDAC), una aplicacion Web cartografica personalizada que permite al usuario visualizar, navegar y consultar mapas y otros conjuntos de datos geograficos; el Sistema Europeo de Informacion sobre Incendios Forestales (EFFIS) que sirve de apoyo a los servicios de proteccion contra incendios de la Union Europea y ofrece informacion actualizada y fiable sobre los fuegos que se producen en Europa; el EuroStat LanderProfile que incluye perfiles de los paises a partir de un amplio grupo de indicadores de interes sobre cada pais: poblacion, educacion, seguridad, condiciones de vida, economia, medio ambiente, etc., ofreciendo ademas tablas, graficos y mapas interactivos (ver figura 2); el Atlas Europeo del Mar que facilita el aprendizaje sobre los mares y las costas del viejo continente o la aplicacion CubeViz, la primera en estar disponible desde la version beta del portal, y se trata de un navegador facetado para datos estadisticos que emplea el vocabulario RDF Data Cube (12), el mas avanzado para representar datos estadisticos en RDF.

[FIGURA 2 OMITIR]

Los datos que se facilitan a traves del portal pueden utilizarse y reutilizarse con fines comerciales o no comerciales, buscando impulsar su potencial economico. Su reutilizacion, de forma gratuita, conlleva unicamente la citacion de la fuente. Toda la informacion que se ofrece esta sujeta a una clausula de exencion de responsabilidad, a un aviso de derechos de autor y a las normas aplicables de proteccion de datos personales (13).

Con relacion a la interfaz del portal, podemos observar que se encuentra disponible en 22 idiomas. Incluye una sencilla navegacion por medio de menus y un formulario de busqueda simple que permite filtrar los resultados a partir de la inclusion de todas las palabras de la busqueda, de alguna de las palabras o de la frase exacta.

El portal tambien se constituye como una fuente de importante valor para la comparacion de datos entre los diversos organismos productores y fomenta el establecimiento de relaciones entre los mismos y la comunidad de usuarios. Ademas, como herramienta, dispone de un area exclusiva para proveedores de datos.

3.2 ESTADO DE LOS CONJUNTOS DE DATOS

El total de conjuntos de datos disponibles declarado en la pagina principal del portal es de 6.597 (14). No obstante, al realizar una revision de este dato, observamos que en realidad se refiere a registros o entradas del repositorio y no a conjuntos de datos como recursos reales disponibles. Dichas entradas o registros deberian tener asociado al menos un conjunto de datos como recurso en el campo correspondiente, pero en algunos casos no es asi (ver figura 3).

[FIGURA 3 OMITIR]

El dato obtenido sobre los conjuntos de datos vinculados a un recurso real disponible, independientemente del formato o formatos, es de 6.562 (ver grafico 1).

En este sentido, cabe destacar el caso de la Agencia Europea de Valores y Mercados cuyo registro es de 27 conjuntos de datos y ofrece solamente 4 recursos enlazados o el caso de la Direccion General de Educacion y Cultura que tiene un registro de 3 conjuntos de datos y no figura ningun recurso enlazado (ver figura 3).

3.3 EDITORES

En cuanto a editores nos encontramos con un numero total de 41 editores. La mayor representacion, teniendo en cuenta el tipo de entidad, es el de las Direcciones Generales, seguido de las Agencias (15) y Oficinas (ver grafico 2).

Si nos centramos en la funcion de estos organismos podemos observar que los de mayor representacion son aquellos relacionados con economia y finanzas (7), seguidos de los que se ocupan de asuntos sociales (5), empresas (5), asuntos institucionales (5), ciencia y tecnologia (4), asuntos maritimos y pesca (3).

En cuanto al pais donde se encuentran ubicados estos organismos podemos ver que los mas representados, al ser la mayoria Direcciones Generales, se encuentran en Belgica y, mas concretamente, en Bruselas, ya que muchas de estas direcciones son dependientes de la Comision Europea. En cuanto al pais de origen de las Agencias: Luxemburgo (4), Espana (4), Francia (2) e Italia (2), son los paises mas representados, aunque existe representacion de hasta 15 paises (ver figura 4).

[FIGURA 4 OMITIR]

Hay que mencionar que de las mas de 40 Agencias vinculadas a la Union Europea solamente 14 de ellas aportan conjuntos de datos a este portal. Uno de los datos mas significativos es el numero de conjuntos de datos que aporta cada editor. En este caso destaca la Oficina de Estadistica de la Union Europea (Eurostat) (16) como principal editora de conjuntos de datos, con un 96% de los mismos; destaca tambien la aportacion de la Agencia Europea de Medio Ambiente (ver grafico 3).

3.4 FORMATOS

En cuanto a los formatos de distribucion de estos recursos se encuentran en su gran mayoria en mas de un formato, siendo el formato comprimido .zip el mas habitual, seguido del formato .pdf, .xml, .xls y otros formatos (ver grafico 4).

Teniendo en cuenta que los conjuntos de datos pueden ser distribuidos en mas de un formato, buscando precisamente la posible reutilizacion de los datos, nos encontramos con un total de 6.571 ficheros en diferentes formatos, donde se descartan los 5.688 registros en formatos .html, debido a que estos recursos son realmente enlaces a las paginas Web de inicio de los editores y, en muy pocos casos, llevan a zonas de descarga.

Sobre la base de esta panoramica inicial, hemos de senalar que los datos que ofrece el propio portal en el apartado de formatos de recursos (17), no reflejan con precision la presencia en dicho portal de formatos que favorecen la reutilizacion. En este sentido, un analisis inicial de estos datos, muestra un alto porcentaje (47%) de documentos en formatos .html y .pdf, (formatos de distribucion que no son los mas adecuados para la reutilizacion) que contrasta, a priori, con el bajo porcentaje mostrado de recursos en formatos estructurados o delimitados: xml, rdf, xls, csv (1,2% de los recursos).

Un desglose de los formatos integrados en los archivos comprimidos .zip (que representan el 52% de los datos de distribucion), desvela una presencia superior de formatos estructurados y delimitados que los proporcionados a priori en el apartado mencionado. Para poder conocer el formato del contenido de estos .zip es preciso explorar cada recurso y comprobar su formato especifico, en algunos casos incluso se requiere la descarga del recurso, lo que resulta poco agil y eficiente. No obstante, hemos comprobado que el 99% de estos ficheros comprimidos proviene de Eurostat y contienen ficheros con formato sdmx-ml (18). Estos formatos sdmx-ml son formatos basados en xml, por lo tanto, formatos estructurados y reutilizables. En consecuencia, se observa una presencia mucho mas alta de formatos estructurados que la que se muestra en la informacion previa.

3.5 EVALUACION DE LOS FORMATOS MEDIANTE LA ADAPTACION DEL ESQUEMA DE LAS "5 ESTRELLAS"

En el Portal de datos objeto de estudio, todos los recursos presentan una URI, ademas los datos se encuentran vinculados entre ellos por palabras clave, con independencia de quien sea el editor; desde esta perspectiva, el portal en su conjunto se situaria en el nivel de las 5 estrellas.

Sin embargo, cuando se analizan individualmente los recursos, se constata que no todos cumplen con esta condicion. Como ya se ha comentado, existen conjuntos de datos o recursos que se presentan en varios formatos. Por ejemplo, un recurso se puede presentar como un documento pdf y, ademas, como un fichero .xls. En estas circunstancias, ese conjunto de datos cumple, segun el esquema citado, con los requisitos propios del nivel de 2 estrellas. Solamente a aquellos conjuntos de datos que contienen como unico formato el formato .pdf, se les ha otorgado 1 estrella. La mayoria de los formatos pueden considerarse formatos estructurados no propietarios (3 estrellas). Tambien existen formatos rdf, owl y sparql (4 estrellas). Los formatos estructurados no propietarios que se acompanan, ademas de otros formatos tipo rdf, han sido clasificados con 4 estrellas (tabla 2).

En esta evaluacion vuelve a ser determinante el peso de los contenidos de Eurostat, clasificados con 3 estrellas. Aunque debemos indicar, como aspecto negativo, que existe una muy alta relacion de editores con formatos evaluados con 1 estrella o, dicho de otra manera, del total de editores, el 41% los que publican unicamente en formato .pdf (1 estrella).

3.6 ESTANDARES

El portal se presenta como un entorno de datos vinculados donde se toman como base los principios de Linked data (19) y otras tecnicas de la Web Semantica. Los datos vinculados son un metodo normalizado para representar gran variedad de temas, facilitando su relacion y su uso. Resultan tambien utiles para el desarrollo de nuevas aplicaciones que permiten combinar datos de origen heterogeneo.

Ademas, el portal se apoya en diferentes estandares que permiten su adecuada descripcion y una eficaz recuperacion, como por ejemplo el lenguaje de consulta SPARQL para RDF. SPARQL es una recomendacion de la W3C que define la forma de expresar consultas a traves de diversas fuentes de datos, siempre que los datos se almacenen de forma nativa en formato RDF. Por otro lado, tambien se apoya en el Data Catalog Vocabulary (DCAT), otra recomendacion de la W3C, que conforma un vocabulario en formato RDF disenado para facilitar la interoperabilidad entre los diferentes catalogos de datos publicados en la Web.

Tomando como base DCAT se ha creado un vocabulario de metadatos que puede consultarse por medio de una hoja de datos o por medio de una ontologia en formato OWL (20). Este vocabulario se ha generado con el objetivo de que sea compatible con Asset Description Metadata Schema (ADMS). ADMS es un esquema de DCAT usado para describir activos semanticos. Estos activos semanticos o, simplemente "activos", facilitan aquellos componentes altamente reutilizables para este tipo de proyectos u otros basados en metadatos (como por ejemplo, esquemas XML, modelos de datos genericos, etc.) y tambien para recuperar los datos de referencia (como por ejemplo, listas de codigos, taxonomias, diccionarios, vocabularios, etc.) utilizados para el desarrollo y la descripcion de los valores en los sistemas de eGoverment o Gobierno abierto.

3.7. OTROS ELEMENTOS COMPLEMENTARIOS DE ANALISIS

Con relacion al formulario de busqueda podemos observar que no podemos utilizar un tesauro para la consulta y el filtrado de resultados, como podria ser Eurovoc (21), que posibilite la localizacion de los recursos con independencia del idioma en el que se encuentran. En este sentido, hemos de senalar que en las busquedas realizadas en el contexto del analisis, se obtuvieron resultados diferentes segun se planteara la consulta con terminos en espanol o con terminos en ingles. Sirva como ejemplo para ilustrar dicha consideracion que, en uno de los supuestos planteados, cuando se introdujo el termino en espanol, "agua" no se obtuvieron resultados y, sin embargo, al introducir el termino en ingles "water", se obtuvieron 109 resultados. En relacion con lo expuesto, al disponer de la interfaz en espanol, incluido el formulario de busqueda, la consulta por parte de los usuarios no expertos o no habituales del portal suele ser tambien en el mismo idioma, lo puede generar como resultados continuos silencios documentales y, en consecuencia, frustracion en el usuario que desconoce esta situacion.

Para finalizar el analisis de elementos complementarios, hemos de senalar que este portal tambien presenta un top ten de los conjuntos de datos mas vistos. Nos ha parecido relevante completar dicha relacion con informacion relativa a los editores y formatos (ver tabla III). Destacamos que en el primer puesto se encuentra la "Memoria de Traduccion" de la Direccion General de Traduccion, un conjunto de datos que incluye traducciones en 23 idiomas del acervo comunitario (legislacion europea, tratados, reglamentos, directivas, etc.).

4 CONCLUSIONES Y RECOMENDACIONES

El Portal de datos abiertos analizado constituye en su concepcion, sin lugar a dudas, un recurso muy valioso como punto de acceso unico a datos elaborados por instituciones y organismos de la Union Europea. Como tal, se configura como una iniciativa que propicia la disponibilidad de informacion del sector publico y su reutilizacion, con fines comerciales o no comerciales, en el contexto del movimiento de datos publicos abiertos. En consecuencia, dado que la finalidad primordial a la que responde es el fomento del uso publico de los datos y su reutilizacion, se perfila como una plataforma para el surgimiento de nuevos proyectos de caracter innovador y transfronterizo.

En linea con el analisis realizado de dicho activo de informacion, consideramos que seria recomendable mejorar o definir de forma mas precisa algunas de sus caracteristicas para contribuir a reforzar mejor su finalidad como incentivo para la reutilizacion. En este sentido, seria muy positivo que los proveedores de datos indicaran con mayor precision el formato de los conjuntos de datos que suministran, aunque estos vayan comprimidos. Conocer este dato es fundamental para definir y formular proyectos para la reutilizacion de la informacion.

Aunque existen diversas opiniones sobre cual es el mejor formato para la reutilizacion, por lo general y, siempre que sea posible, lo mas eficiente suele ser la publicacion en diversos formatos y que, al menos uno de ellos, sea estructurado abierto (csv, xml, etc.). El coste de este proceso para el productor suele ser muy pequeno pero, desde el punto de vista del usuario final, puede representar una gran diferencia.

Tambien consideramos que resultaria muy positiva la incorporacion de un tesauro multilingue que facilitaria la busqueda. En relacion con esa mejora de las caracteristicas, seria muy util disponer en la navegacion del portal de una organizacion de los contenidos por grandes areas tematicas.

Finalmente, como activo de informacion vivo, aun en fase de desarrollo y en constante transformacion, confiamos en que, progresivamente, se ira produciendo un aumento de la participacion de nuevos proveedores de datos que, sin lugar a dudas, redundara en un incremento cuantitativo del numero de conjuntos de datos y aplicaciones y tambien en una mejora cualitativa basada, desde nuestro punto de vista, en una mayor diversificacion de editores y contenidos.

5 BIBLIOGRAFIA Y FUENTES

BERNES-LEE, Tim. Linked data. Is your Linked Open Data 5 Star? <http://www.w3.org/DesignIssues/LinkedData.html/> [Consulta: 5/5/2014]

COMISION EUROPEA (1998). "La informacion del sector publico: un recurso clave para Europa. Libro Verde sobre la informacion del Sector Publico en la Sociedad de la Informacion". COM(1998)585 [en linea] <ftp://ftp.cordis.europa.eu/pub/econtent/docs/gp_es.pdf> [Consulta: 5/05/2014]

COMISION EUROPEA (2011). Comunicacion desde la Comision al Parlamento Europeo, el Consejo, el Comite Economico y Social y el Comite de las Regiones. Datos abiertos. Un motor para la innovacion, crecimiento y gobernanza transparente. Bruselas, 12 de diciembre de 2011. COM(2011)882 final.

KROES, Neelie (2009). "Public data for all - opening up Europe's public sector". [en linea]. <http://ec.europa.eu/commission_2010-2014/kroes/en/blog/publicdata-for-all-%E2%80%93-opening-up-europes-public-sector> [Consulta: 5/05/2014]

MARTIN, Yolanda (2011). "Politica europea de reutilizacion de la informacion del sector publico. De la norma juridica al portal de datos abiertos", en Revista Universitaria Europea, no. 19, diciembre 2013, pp. 113-134.

OBAMA, B. (2009). "Transparency and open government. Memorandum for the heads of executive departments and agencies", en Federal Register, no. 15, vol. 74,pp.4685-4686.

PINTOS, Carlos; MARIN, Jose Luis (2013). Open data. Reutilizacion de la informacion publica. Madrid: INAP; Netbiblio, pp. 72-77. Portal Europeo de datos abiertos. <https://open-data.europa.eu/es/data/> [Consulta: 7/5/2014]

RAMOS SIMON, L. Fernando, ARQUERO AVILES, Rosario, BOTEZAN, Iuliana, COBO SERRANO, Silvia, SALA JIMENEZ, Andrea, SANCHEZ JIMENEZ, Rodrigo, VALLE GASTAMINZA, Felix del (2012). "De la reutilizacion de la informacion del sector publico a los portales de datos abiertos en Europa", en Bid: textos universitarios de biblioteconomia i documentacio, diciembre.

UNION EUROPEA. Directiva 2003/98/CE del Parlamento Europeo y del Consejo de 17 de noviembre de 2003 relativa a la reutilizacion de la informacion del sector publico. Diario Oficial de la Union Europea L 345, 31 de diciembre de 2003, pp. 90-96.

UNION EUROPEA. Directiva 2013/37/UE del Parlamento Europeo y del Consejo, de 26 de junio de 2013, por la que se modifica la Directiva 2003/98/CE relativa a la reutilizacion de la informacion del sector publico. Diario Oficial de la Union Europea L 175, 27 de junio de 2013, pp. 1-8.

UNION EUROPEA. Decision 2011/833/UE de la Comision, de 12 de diciembre de 2011, relativa a la reutilizacion de los documentos de la Comision. Diario Oficial de la Union Europea L 330, 14 de diciembre de 2011, pp. 39-42.

http://dx.doi.org/10.5209/rev_RGID.2014.v24.n1.45384

Rosario Arquero Aviles

Universidad Complutense de Madrid. Biblioteconomia y Documentacion

carquero@ucm.es

Gonzalo Marco Cuenca

Universidad Complutense de Madrid. Biblioteconomia y Documentacion

gmarco@ucm.es

Recibido: Mayo 2014

Aceptado: Junio 2014

(1) El portal de datos abiertos de Estados Unidos puede consultarse en la direccion: http://www. data. gov/

(2) La Agenda Digital Europea forma parte de la estrategia "Europa 2020" puesta en marcha por la Comision Europea y promueve entre sus acciones clave la apertura de datos publicos para su reutilizacion, la simplificacion del sistema de licencias para el intercambio de contenidos y la implantacion de normas de interoperabilidad. Para mas informacion sobre la Agenda Digital Europea se puede consultar: http://ec.europa.eu/digital-agenda/

(3) Muchos estados miembros de la Union Europea han generado sus propias normas, derivadas de la Directiva 2003/98/CE, superando el nivel minimo fijado en dicha Directiva, pero que han supuesto un obstaculo a la hora de la reutilizacion de los datos de forma transfronteriza, ya que para poder conocer el alcance del uso de los datos habia que acudir a las diversas legislaciones nacionales.

(4) Se considera sector infomediario a aquellas organizaciones que basan su modelo de negocio en la reutilizacion de la informacion, provenga del sector publico o no. Su operativa se basa en el acceso a informacion que no ha sido producida por ellos y a la que tratan de aportarle valor por medio de la creacion de productos o servicios que ofrecen a terceros para obtener beneficios.

(5) Este editor de consultas se encuentra disponible en la zona dedicada a "Datos Vinculados" y concretamente en la direccion: https://open-data.europa.eu/es/linked-data

(6) Este sistema fue introducido por Tim Bernes-Lee, Director del World Wide Web Consortium (W3C) para la evaluacion de datos abiertos.

(7) El portal se encuentra disponible en la siguiente direccion Web: https://opendata.europa.eu

(8) CKAN es un sistema de datos de gran alcance desarrollado por la Open Knowledge Foundation (OKF). CKAN es una solucion abierta dirigida a proveedores de datos (gobiernos nacionales, regionales, locales, empresas y organizaciones) que quieran proporcionar datos abiertos y reutilizables.

(9) RDF Virtuoso es una base de datos de motor hibrido que combina diferentes funcionalidades (servidor de aplicaciones Web, base de datos virtual, servidor de archivos, etc.).

(10) SPARQL (SPARQL Protocol and RDF Query Language) es un lenguaje estandarizado para la consulta de datos RDF de la World Wide Web Consortium (W3C).

(11) A fecha de consulta de 6 de mayo de 2014 (Fuente: Portal de datos abiertos de la Union Europea).

(12) RDF Data Cube es una recomendacion de la W3C que permite relacionar datos multidimensionales, como las estadisticas en la Web, de tal manera que permite vincular conjuntos de datos relacionados y conceptos. Para mas informacion se puede consultar: www.w3.org/TR/2014/REC-vocab-data-cube-20140116/

(13) Para mas informacion sobre este aviso legal puede consultarse la siguiente direccion: http://ec.europa.eu/geninfo/legal_notices_es.htm

(14) A fecha de consulta de 12 de mayo de 2014 (Fuente: Portal de datos abiertos de la Union Europea).

(15) Las Agencias de la Union Europea son entidades juridicas independientes de las instituciones de la Union Europea creadas para llevar a cabo tareas especificas bajo la normativa de la UE.

(16) Eurostat produce datos estadisticos sobre la Union Europea. Su mision es proporcionar a la Union Europea las estadisticas que permitan comparaciones entre los paises y regiones. Para mas informacion sobre Eurostat: http://epp.eurostat.ec.europa.eu/

(17) https://open-data.europa.eu/es/data/dataset

(18) SDMX se corresponde con una iniciativa internacional para intercambio de datos y metadatos estadisticos.

(19) Linked Data forma parte de la familia de estandares de la Web Semantica desarrollados por el World Wide Web Consortium (W3C). Este termino hace referencia a un conjunto de buenas practicas para la publicacion e interconexion de datos estructurados en la Web, introducidas por Tim Bernes-Lee y que han llegado a ser conocidas como los principios de linked data. Para mas informacion sobre estos principios puede consultarse la siguiente direccion: http://www.w3.org/DesignIssues/LinkedData.html

(20) OWL es el acronimo de Web Ontology Language, un lenguaje de marcado que se utiliza para publicar y compartir datos utilizando ontologias en la Web.

(21) EuroVoc es un tesauro multilingue y multidisciplinar que abarca la terminologia de los ambitos de actividad de la Union Europea, con especial hincapie en las labores parlamentarias. EuroVoc esta disponible en 23 lenguas oficiales de la Union Europea. Para mas informacion: http://eurovoc.europa.eu/
Tabla 1. Esquema de las 5 Estrellas de los datos abiertos.
Fuente: www. w3. org/De signIssue s/LinkedData. html

   *       Los datos se encuentran disponibles en la Web. Se pueden
           consultar y leer, pero no pueden ser utilizados por un
           software especifico para su reutilizacion. Constituyen
           por tanto un formato "cerrado" que no es util para la
           reutilizacion. Por ejemplo, los ficheros en formatos PDF.
   **      Los datos se encuentran disponibles en la Web en un
           formato estructurado aunque propietario. Por tanto, es un
           formato que facilita la reutilizacion, ya que se pueden
           procesar, exportar y publicar los datos con facilidad,
           aun dependiendo del software propietario necesario para
           su recuperacion. Por ejemplo, un fichero en formato XLS
           (de Excel).
  ***      Los datos se encuentran en un formato estructurado no
           propietario. Se trata por tanto de formatos "abiertos"
           que resultan de gran utilidad para la reutilizacion. Por
           ejemplo, un fichero en formato CSV.
  ****     Utiliza estandares del consorcio W3C para la Web
           semantica (URI, RDF, SPARQL, etc.) para identificar los
           objetos de forma inequivoca y puedan ser usados o
           enlazados desde el exterior.
 **** *    Los datos se presentan vinculados a otros datos (de
           terceros) de manera que se encuentran contextualizados
           semanticamente.

Tabla 2. Evaluacin de formatos segn adaptacin del esquema de 5
estrellas.
Fuente: elaboracin propia.

          *              1,1%
          **             0,4%
         ***             98%
         ****            0,5%

Tabla 3. Top 10 de los recursos mas vistos desde el lanzamiento del
Portal.

     Top ten: lo mas visto
            Titulo                              Editor

     Memoria de traduccion                 DG de Traduccion
  Mapa de altitudes de Europa     Agencia Europea de Medio Ambiente
   Longitud total de lineas                    Eurostat
         ferroviarias
        Tesauro Eurovoc                Oficina de Publicaciones
  Generacion de residuos por                   Eurostat
           sectores
Comercio cruzado de mercancias                 Eurostat
         por carretera
    Porcentaje de personas                     Eurostat
 empleadas con habilidades de
      usuario de las TIC
Servicios de telecomunicaciones:               Eurostat
        acceso a redes
     Camas para cuidados                       Eurostat
 psiquiatricos por hospitales
     CORDIS--proyectos de              Oficina de Publicaciones
 investigacion de la UE en el
   programa FP7 (2007-2013)

     Top ten: lo mas visto
            Titulo                Consultas   Formatos

     Memoria de traduccion          4.648      tmx-xml
  Mapa de altitudes de Europa       2.090     binary data
   Longitud total de lineas         1.708      sdmx-ml
         ferroviarias
        Tesauro Eurovoc             1.513      rdf+xml
  Generacion de residuos por        1.263      sdmx-ml
           sectores
Comercio cruzado de mercancias      1.245      sdmx-ml
         por carretera
    Porcentaje de personas          1.223      sdmx-ml
 empleadas con habilidades de
      usuario de las TIC
Servicios de telecomunicaciones:     911       sdmx-ml
        acceso a redes
     Camas para cuidados             829       sdmx-ml
 psiquiatricos por hospitales
     CORDIS--proyectos de            765      xls | csv
 investigacion de la UE en el
   programa FP7 (2007-2013)

Fuente: Portal Europeo de datos abiertos, 12 de mayo de 2014
(elaboracion propia)

Grafico 1. Comparativa entre numero de registros
disponibles y conjuntos de datos disponibles.

Registros       6.597
Datasets        6.562

Fuente: elaboracion propia

Nota: Tabla derivada de grafico de barra.

Grafico 2. Editores por tipo de entidad.

Direccion General     19
Agencia               14
Oficina                6
Otros                  3

Fuente: elaboracion propia

Nota: Tabla derivada de grafico de barra.

Grafico 3. Conjuntos de datos por editor. Fuente:
elaboracion propia

Eurostat                              96%
Resto                                  4%
Agencia Europa de Medioambiente       1,50%
Centro Comun de Investigacion         0,55%
DG Competencia                        0,40%
Oficina de Publicaciones              0,20%
Em Energia de Fusion                  0,15%
Otros                                 1,2%

Nota: Tabla derivada de grafico segmentado.

Grafico 4. Relacion de formatos de distribucion.
Fuente: elaboracion propia

ZIP        52%
HTML       46%
PDF        0,8%
XML        0,2%
Otros      1%

Nota: Tabla derivada de grafico segmentado.
COPYRIGHT 2014 Universidad Complutense de Madrid
No portion of this article can be reproduced without the express written permission from the copyright holder.
Copyright 2014 Gale, Cengage Learning. All rights reserved.

 
Article Details
Printer friendly Cite/link Email Feedback
Author:Arquero Aviles, Rosario; Marco Cuenca, Gonzalo
Publication:Revista General de Informacion y Documentacion
Date:Jan 1, 2014
Words:6594
Previous Article:Analisis de contenido de fotografias cientificas de la naturaleza: propuesta de una plantilla.
Next Article:Revista La Hormiga de Oro. Analisis documental.
Topics:

Terms of use | Privacy policy | Copyright © 2018 Farlex, Inc. | Feedback | For webmasters