Implementando la publicacion de datos - Eduardo Poggi

Page 1

Implementando la Publicación de Datos Eduardo Poggi Comencemos el análisis de la Implementación de la Publicación de Datos con dos ejercicios simples de procesos institucionales de gestión de información.

1 Análisis de casos Hay mucha bibliografía sobre como debe ser la publicación de datos y muchas exigencias que sobre esto se discuten, tratemos ahora de hacer un ejercicio que nos permita pensar más en la implementación y percibir los detalles y la complejidad que esto genera. Hay datos sobre los cuales es relativamente fáciles de resolver si son publicables o no, por ejemplo: el resultado de censos o encuestas, estadísticas, presupuestos y estados contables de los organismos, resultados de investigaciones ya publicados, etc.; son todos datos que salvo por algún tema muy específico son fácilmente publicables y difícilmente haya oposiciones. Otros pueden ser un poco más difíciles de resolver por que requieren de un análisis específico sobre la posibilidad de publicación. Ejercicio 1 – gestión de documentos Por ejemplo en cualquier organismo público existen una serie de documentos que luego de algún tratamiento pasan por una etapa de formalización claramente establecida, tanto para normas generales como para normativas internas. Estos procesos de formalización convierten a los documentos en resoluciones, decretos, dictámenes, ordenanzas, etc., que reciben una variedad de nombres dependiendo del nivel que tiene y de cada sistema administrativo. Salvo casos específicos donde el contenido del documento este protegido por algún tipo de secreto, todos los demás documentos formalizados deberían ser publicados y abiertos a la sociedad. Desde el punto de vista operativo, cualquier organismo razonablemente informatizado debería tener digitalizado el proceso de elaboración de estos documentos y su versión formalizada debería estar publicado en una Intranet. Es probable también, que aquellos que el organismo considere con algún nivel de secreto, ya esté protegida su publicación en la red Interna. Por lo tanto, es estos casos los documentos publicados internamente deberían ser publicados también en forma externa. La situación parece simple pero se deberían aplicar algunas consideraciones: •

Los documentos deben estar digitales y ser parte de un sistema de workflow o tracking que permita su fácil identificación y tratamiento. De no ser así, el tratamiento para lograr su publicación sería artesanal y poco sustentable.

Es necesario poder distinguir automáticamente entre los documentos públicos y los que no lo son. Por lo tanto, el sistema de gestión debería gestionar algún tipo de reglas o permisos que permitan tal clasificación.

Salvo que el organismo cuente con algún proceso de formalización digital, basado en firma electrónica por ejemplo, la publicación tradicional exigiría que la versión final del documento se imprimiera en papel, se firmara y sellara manualmente y luego se digitalizara para poder publicarlo. Para cumplir con los principios, esta versión digitalizada debería estar acompañada por su correspondiente versión digital editable, por lo menos para el contenido. Lo cual implica administrar el flujo de los documentos para poder asegurar que ambos contenidos coinciden. En un entorno más sofisticado se podría implementar el documento firmado digitalmente. Habría que resolver en este caso, quién en nombre del organismo, es el responsable de firmarlo.

Cuando los documentos se gestionan en una Intranet se tienen en cuenta una serie de condiciones propias del entorno (acceso por empleados autenticados, con compromisos contractuales, con normas de seguridad, etc.) que no se cumplen en un sitio público. Habría que verificar como afecta el cambio de estas condiciones a la gestión de Intranet.


Ejercicio 2 – la gestión de recursos humanos Concentrémonos ahora, para acotar el análisis, en los datos producidos por los sistemas de información para la gestión de los organismos públicos normalmente persistidos en una base de datos. La primera consideración en conocer con certeza cuales datos son públicos y cuales no. En principio, los datos pueden ser clasificados de tres formas según su nivel de publicación: 1. Públicos: los que pueden ser accedidos por cualquiera sin ningún tipo de restricción. 2. Irrestrictos: lo que podría requerir justificar pertinencia de acceso, se podrían entregar a cualquier que los requiriera siempre que se identificara y pudiera –en el caso de que se le requiérese- justificar el por qué de la solicitud. 3. Restringidos: son aquellos para los cuales existe una regla o trámite administrativo (basados en alguna normativa) que limita su acceso y permite discernir a quienes se les puede entregar y quienes no. Para ejemplificar, consideremos para el análisis el Sistema de Gestión de Recursos Humanos (HRIS) de un organismo cualquiera. En principio, este sistema representa parte del funcionamiento del estado y es mantenido por recursos públicos, por lo tanto estaría bajo el mandato de ser publicados para asegurar la transparencia. En términos generales, estos sistemas administran 3 grandes entidades de datos: •

La estructura organizativa con posiciones (puestos de trabajo), perfiles, competencias necesarias, carrera, etc.

Los empleados con datos básicos de las personas y detallados de experiencia laboral y competencias.

La relación laboral entre las personas y la estructura organizativa.

Los salarios.

Estas entidades suelen contener los datos históricos, presentes y probablemente proyecciones de futuros cambios. La ubicación de los datos salariales depende del sistema de remuneraciones pero en general están en el tercer grupo. Entonces: ¿cómo se publican estos datos? Veamos algunos pasos simples para empezar asumiendo que todos los datos que administra el sistema son públicos. Entonces, un primer proceso de pre-publicación debería realizar lo siguiente: 1. Cumpliendo con los principios de compleción, fuente primaria y “procesabilidad”, una forma básica de publicación sería exportar todas las tablas1 a un formato estándar (un XML por ejemplo) y publicar el conjunto de las mismas. 2. Para cumplir con el principio de documentación se deberá agregar toda la metainformación pertinente: diagramas de entidad relación, diccionario de datos, etc. 3. Generar un ZIP con todos los documentos y asignarle una URL con la fecha. 4. Firmar digitalmente todo el paquete. 5. Para cumplir con el principio de permanencia, la publicación se podría hacer periódicamente, en forma mensual por ejemplo. Además de mantener un mínimo de documentación de la base de datos, habría que agregar un proceso automático de ejecución periódica para que realice el proceso anterior. Hasta aquí no hay mayores problemas. El proceso es relativamente simple y sólo requiere algún tiempo de procesamiento y lugar de almacenamiento que dependerán fuertemente de la cantidad de datos, que serán dependientes de la cantidad de empleados y de los años de historia. Se podría complicar un poco procesamiento para no usar tanto almacenamiento generando una copia base –la primera de cada año calendario por ejemplo- y las restantes sólo como una actualización de la anterior, filtrando solo los datos (filas de las tablas en realidad) que han sido modificadas o 1

Se debe tener en cuenta que un sistema complejo de gestión de recursos humanos puede utilizar más de 1000 tablas normalizadas para su funcionamiento.


agregadas. Los cual también complica el proceso de reconstrucción. El proceso también debe considerar otros aspectos, por ejemplo: filtrar datos resultantes de transacciones no completadas o no confirmadas. Hasta aquí sólo tenemos costos de procesamiento y almacenamiento para cumplir con las demandas de publicación, siempre que partamos del supuesto que todos los datos son públicos. Sin embargo, varios datos de un HRIS pueden estar protegidos por diferentes leyes en cada país. Por ejemplo, los sueldos de cada empleado no político, su grupo familiar, su domicilio, su historia de ausencias por salud, su historia de ausencias por causas religiosas, todo lo relacionado a los postulantes a una posición, las evaluaciones de desempeño, etc. Algunos de éstos podrían ser irrestrictos o restringidos dependiendo de la normativa vigente. Para publicar estos datos sin violar la ley se requiere administrar reglas que permitan identificar, filtrar y restringir la publicación o el acceso a los datos protegidos. Esto implica administrar un conjunto de reglas variables para gran cantidad de entidades de datos, atributos y tablas y requiere de la existencia de un sistema de gestión de reglas de protección de datos que puedan ser interpretadas y aplicadas por el proceso de publicación. Tarea no menor por cierto. El proceso de pre-publicación ya no sería una simple exportación en formato XML, sino que debería interpretar las reglas y aplicarlas para filtrar columnas y filas de las tablas manteniendo la integridad referencial. Por lo que el proceso de complicaría más, además del esfuerzo de gestionar las reglas. Hay que considerar además que la existencia de datos irrestrictos y restringidos requiere de la administración y operación de un sistema de gestión de identidades que permita identificar, registra, autenticar y autorizar usuarios; lo que requerirá un esfuerzo importante de gestión de usuarios externos. Además para asegurar el no repudio de la consulta se deberá disponer de mecanismos de persistencia de los accesos, que habrá que decidir por cuanto tiempo deben mantenerse. Adicionalmente, para cumplir con el principio de interoperabilidad, es probable que sea necesario traducir códigos internos del sistema en códigos estandarizados para su publicación. Por ejemplo, si el sistema de gestión de recursos humanos utiliza un número interno de legajo para identificar a las personas, deberá traducirlo a la identificación de personas de uso nacional (un Documento Nacional de Identidad, por ejemplo); si utiliza tablas propias para identificar direcciones postales o localidades, deberá traducirlas a los estándares; y así siguiendo con todos los datos que estén bajo los esquemas de interoperabilidad. Por lo tanto, el proceso de pre-publicación deberá complicarse mucho más para hacer esta traducción, además de mantener las tablas de traducción correspondientes. Finalmente, el proceso de pre-publicación debería estar bajo la responsabilidad del área de sistemas, pero la gestión de las reglas sobre el área –de negocio- administradora de los datos, en este caso, el departamento de personal, por ejemplo. Alguien debería verificar la calidad del proceso y el cumplimiento de las reglas de seguridad y privacidad, para asegurar que no se filtraron datos no publicables. Por lo tanto si, cumpliéramos con las buenas prácticas de gestión de procesos, el archivo a publicar debería ser firmado digitalmente por el CIO y por el CHRO 2 por lo menos; quienes deberían confiar en la buena calidad de los datos gestionados por todas las partes involucradas en el uso del sistema. Por lo tanto, el proceso de publicación no es tan simple cuando hay datos irrestrictos o restringidos. Dista mucho de ser un problema informático, requiere de cambios en los procesos de negocio. Tampoco es gratuito, ya que requiere desarrollar procesos, ejecutarlos y persistir una gran cantidad de datos redundantes. También requiere de muy buenas prácticas de gestión informática que permitan publicar datos de gestión con riesgo muy bajo. Por lo tanto, agregar la etapa de publicación de datos en un proceso básico de gestión organizacional, requiere de cierta capacidad institucional para realizarlo.

2 Variables analíticas para la Publicación de Datos Muchas de las demandas conceptuales o legales sobre la transparencia del accionar del sector público se pueden transformar en variables que los organismos deben atender –como un conjunto- para asegurar su cumplimiento. Como veremos más adelante, estas variables no son 2

Responsable de Sistemas y de Recursos Humanos respectivamente.


“todo o nada” sino que se puede determinar para cada una de ellas un gradiente de costo-valor que puede remontarse paulatinamente. Nivel de apertura El espíritu es maximizar la disponibilidad de información del sector público para su uso y reutilización, basado en la presunción de la transparencia como la regla por defecto al facilitar el acceso y la reutilización. El desarrollo de un régimen de los principios de acceso, asumiendo la apertura de la información del sector público es una regla predeterminada, sin importar el modelo de financiación del desarrollo y del mantenimiento de la información. Se debe minimizar el uso de motivos de denegación total o parcial, por protección de los intereses de seguridad nacional, privacidad personal, preservación de intereses privados y la utilización de derechos de autor, patentes o la aplicación de legislaciones restrictivas de acceso. Y, en el caso de utilizarlos, los mismos deben ser explícitamente transparentados. Nivel de sistematización del proceso El objetivo de la publicación es que sea sistemática y continua y no artesanal y discrecional, por lo tanto la etapa de publicación debe ser considerada en todos los procesos organizacionales e implementada en aquellos que la amerite. Esto requiere gestionar eficientemente los procesos organizacionales más la capacidad de ampliar incluyendo la publicación y todos sus requerimientos específicos. Utilización de estándares Los datos no deberían publicase de cualquier forma, se debe hacer de forma que tenga las menores restricciones posibles para su explotación. Por lo tanto, se deberían evitar formatos privativos o que requieran de recursos privativos o pagos para su tratamiento. La utilización de estándares abiertos también suele facilitar el trabajo de publicación ya que suelen publicarse además gran variedad de herramientas para su tratamiento que mejoradas continuamente gracias al aporte de los usuarios. Oportunidad de la publicación Para cada entidad de datos habrá que establecer el ritmo o la periodicidad de publicación razonable en función de lógica de actualización propia del negocio y a un equilibrio en los costos de publicación. Acceso y condiciones de transparencia para su reutilización Se debe fomentar el acceso amplio y no discriminatorio, eliminando acuerdos de exclusividad y barreras o restricciones sobre las formas en que se puede acceder, utilizar, volver a utilizarse, etc., de tal forma que toda información accesible quede abierta para ser reutilizable por todos. Registro de entidades publicadas No solo se deben publicar las entidades correspondientes sino que se debe informar de forma fehaciente su existencia, su publicación y demás información relevante. Esto puede hacerse por cada organización o sector, pero idealmente se debería manejar un reservorio único donde pudiera accederse a toda la información publicada por una administración. Calidad Para cada entidad se deben explicitar los parámetros de calidad aplicados en la recolección, procesamiento y resguardo. Los datos se deben entregar con la misma calidad con que son utilizados en el organismo que los gestiona. La cooperación entre los diversos organismos involucrados en la creación, colección, procesamiento, almacenamiento y la distribución de la información del sector público, es un factor fundamental para mejorar la calidad, que debe ser utilizado lo más posible para evitar inconsistencias entre las publicaciones individuales de dos o más organismos. Integridad Se debe establecer las salvaguardias adecuadas para proteger la información de modificaciones no autorizadas o de la negación deliberada o involuntaria de acceso autorizado a la información.


Preservación Atendiendo la obsolescencia tecnológica y los desafíos de largo plazo de preservación de los datos, se deben encontrar formas para mantener las entidades publicadas utilizables en el tiempo, esquivando prácticas de mercado que fomentan la obsolescencia. Derechos de Autor Los derechos de propiedad intelectual deben ser respetados, pero se debe asegurar que existan los acuerdos correspondientes para que la información gestionada por el sector público esté libre de copyright. Se debe fomentar el ejercicio de los derechos de autor de manera que facilite reutilización (incluida la supresión de los derechos de autor y la creación de mecanismos que faciliten exención de derechos de autor cuando los dueños del copyright están dispuestos y sean capaces de hacerlo) y, donde los titulares de derechos de autor estén de acuerdo, el desarrollo de mecanismos sencillos para promover un mayor acceso y uso. Precios Dependiendo de la normativa vigente, los datos administrados por el sector público pueden tener algún costo. Normalmente, los costos con cargo al usuario que no deben exceder los costos marginales de mantenimiento y distribución y, en casos especiales costos adicionales, por ejemplo de digitalización. Las estrategias de precios de los datos deberían terne en cuenta consideraciones de competencia entre las empresas que ofrecen servicios de valor añadido. Deben perseguir la neutralidad, la igualdad y la oportunidad de acceso y tener en cuenta la posibilidad de subvenciones cruzadas de otras actividades del gobierno. Mecanismos de atención Como todo servicio, la publicación debe tener asociados mecanismos de atención de usuarios que asistan a su explotación al igual que disponer de accesos simples para cuando existan quejas o procesos de apelación ante los datos publicados. Las asociaciones público-privadas. Facilitar la colaboración público-privada cuando sea apropiado y viable en la toma de información del sector público disponibles, por ejemplo, encontrar formas creativas de financiar los costos de digitalización, mientras que el aumento del acceso y la reutilización de los derechos de terceros. El acceso internacional El acceso diferenciado o no a usuarios no nacionales es un tema delicado. Se debería buscar la mayor coherencia en el acceso internacional en apoyo a la cooperación para la reutilización comercial o no comercial. En estos casos es necesario considerar el ejercicio de la interoperabilidad para facilitar el intercambio y la comparación con bases de datos internacionales.

3 Hacia un modelo de madurez Como todo proceso complejo, la implementación de la publicación sistemática de datos no puede hacerse de un día para otro. La generación de las capacidades institucionales para realizarla correctamente, asegurando una buena ecuación entre servicio y costo, debe hacerse en forma gradual e incremental. Para este tipo de situaciones es útil utilizar Modelos de Madurez como es habitual en tantas disciplinas relacionadas a la gestión tecnología3. No es pretensión de este documento armar un Modelo de Madurez para la Publicación de Datos, solamente se expondrán las principales dimensiones y variables analíticas necesarias para la descripción de fenómeno utilizando dicha matriz de pensamiento. Inicialmente podemos definir las siguientes variables: 1. Sistematización del proceso 2. Nivel de apertura 3. Utilización de estándares 4. Oportunidad 3

Véase por ejemplo Poggi (2008) una aplicación de Modelos de Madurez para la interopearbilidad.


5. Accesibilidad 6. Calidad Niveles Variables

Sistematización del proceso

Nivel de apertura

1

2

3

4

5

Inicial

Administrado

Definido

Medido

Optimizado

Datos recopilados artesanalmente y publicados con uso intensivo de mano de obra.

Proceso de recopilación automático con procesos manuales para su formateo, selección, verificación y publicación.

Proceso de captura sistematizado con verificación y publicación manual.

Proceso de captura y verificación sistematizado con publicación manual.

Proceso de captura, verificación y publicación sistematizado según un proceso formalmente establecido.

Entidad de uso público no comercial.

Entidad libre de uso comercial.

Entidad que solo requiere reconocimiento de fuente.

Estándares abiertos con metadata.

Estándares abiertos con metadata y material descriptivo.

Entidad protegida por Copyright que restringe su utilización. Requiere de proceso manual de solicitud / autorización para su acceso o uso.

Entidad para uso privado. Se permite su reuso sin aprobación solo para fines privados no comerciales.

Estándares abiertos y documentados

Estándares cerrados o ausentes.

Estándares utilizados

Entidad publicada con estándares o especificaciones propietarios. (doc, xls)

Oportunidad

Publicación solo por demanda formal.

Estándares abiertos. Entidades publicadas con estándares abiertos como archivos individuales. (csv, txt, odb, odt, ods, etc.)

Publicación a pedido.

Las entidades se publican con estándares abiertos y con información descriptiva sobre el contenido. (csv, odb, odt, ods + información adicional como tamaño, tipo de dato, rango de valores, cantidad de registros, etc.)

Publicación discrecional.

Las entidades se publican con estándares abiertos y con información descriptiva sobre el contenido procesable. (open API, URI, rdf sin información adicional)

Publicación periódica.

Las entidades se publican con estándares abiertos y con información descriptiva sobre el contenido procesable y con información adicional. (rdf con información adicional) Acorde a la natural actualización de la entidad y/o con períodos de actualización claramente establecidos.


Niveles Variables

Accesibilidad

1

2

3

4

5

Inicial

Administrado

Definido

Medido

Optimizado

Disponible en Web pero requiere de cierta elaboración o procesamiento para completar la entidad.

Disponible en Web pero requiere de cierta elaboración o procesamiento para completar la entidad. Se deben diferenciar por la fecha de actualización.

Disponible por API documentada o algún otro lenguaje de consulta apropiado.

Solo disponible por requerimiento específico y manual.

Disponible en Web con acceso restringido.

4 Desafíos organizacionales De las variables anteriormente mencionadas se puede deducir que la puesta en práctica de la publicación de datos en los organismos públicos presenta una serie de desafíos a nivel de cada institución como de la propia administración que los contiene. Solo a modo demostrativo podemos presentar algunas de las más importantes: Cambiar la cultural organizacional

El tradicional aislamiento y opacidad de los organismos públicos debe ser roto, tanto para relacionarse con los demás como para transparentar su accionar. La particular resistencia a abrir los datos utilizados en la gestión, ya sea por sensación de poder, vergüenza o desidia, debe ser cambiada y esto afecta a los aspectos más básicos de las culturas organizacionales.

Asegurar la calidad de los datos

Los organismos gestionan la calidad de sus datos en función de sus propias necesidades y capacidades. Al publicar y compartir estos datos, las necesidades de calidad y actualización pueden cambiar significativamente. Por lo tanto, es preciso articular los medios para una gestión creciente de calidad, la que impacta en todos los planos de la gestión organizacional.

Gestión presupuestaria

La publicación no puede quedar atada a la disponibilidad presupuestaria coyuntural, sino que debe ser asumida como actividad organizacional básica. Por lo tanto se deben hacer las previsiones presupuestarias necesarias para que las actividades relacionados no queden expuestas al vaivén de los ciclos económicos.

Aumento del interés público

La responsabilidad de los organismos no termina con la publicación, sino que deben hacerse cargo del servicio posterior de consumo y explotación de los mismos, siendo ellos mismos publicitadores de su existencia.

Equilibrio entre control y efectividad

Como todo proceso sujeto a controles de calidad y seguridad, la publicación de datos tendrá su punto de equilibrio donde la suma de los costos se minimiza. Buscar este punto es fundamental para evitar la sobre exigencia de capacidad institucional para temas que no lo ameritan.

Asegurar la rendición de cuentas

La Publicación, como todo servicio debe tener su correspondiente nivel de servicio y asistencia al usuario externo. Los procesos no se terminan cuando los datos salen de la frontera sino que las instituciones deben hacerse caso de lo producido y atender las inquietudes, necesidades y reclamos que esto genere.

Gestionar la infraestructura tecnológica

La Publicación exige de procesos institucionales y de sistemas de información para su gestión, estos a su vez se apoyan en infraestructura tecnológica que debe estar adecuada en tiempo y forma a las necesidades.

Garantizar la seguridad

La seguridad de los datos es un proceso trasversal a todos los demás e impacta sobre toda la organización y no solo sobre el área de TI. La seguridad en su visión más amplia debe ser entendida como parte esencial de proceso de Publicación de datos tanto en sus características específicas como generales.

Mantenimiento de normativas

Al igual que todo el quehacer institucional público, la Publicación debe ir acompañada por un ajuste normativo que le de seguridad y legitimidad. Por lo tanto, las instituciones deberán acomodar sus normativas internas y las administraciones deberán a su vez realizar los ajustes pertinentes para las normativas generales.


5 Recomendaciones Para la implementación de todo proceso que afecte significativamente la operatoria de las organizaciones en todos sus planos, se pueden realizar algunas recomendaciones generales, como las que se presentan a continuación: Utilizar un enfoque de implementación por fases

No es sensato pensar que todos los cambios se pueden hacer de un momento para otro, ni esperar obtener todas las capacidades institucionales para hacerlo. Por lo tanto, usando instrumentos tipo Modelo de Madurez, se deben ir planificando las actividades relacionadas a la publicación en forma incremental y permanente.

Considerar la realización de proyectos piloto.

Hacer aproximaciones preliminares en procesos y entidades de complejidad razonable suele ser una buena estrategia para ir haciendo experiencia e ir adquiriendo de a poco la capacidad institucional.

Asegurar los recursos necesarios

Las previsiones presupuestarias y de los demás recursos se deben ir asegurando con el tiempo para evitar faltantes que amenacen retroceder en los avances logrados.

Dar prioridad a la utilización de la regla 80/20

Seleccionar las entidades centrales que hacen al quehacer de la organización y no perderse en detalles de poco interés.

Alinear las iniciativas de gobierno abierto con los objetivos del organismo

Incluir las iniciativas estratégicas relacionadas al OD en los planes estratégicos de la organización evitando que sean medidas aisladas o parciales.

Establecer mecanismos de gobernanza para el intercambio de datos

La gestión de datos, espacialmente cuando se exterioriza, debe quedar bajo control del organismo. No pueden permitirse fugas o debilidades que atenten contra los recursos organizacionales o la seguridad y la privacidad.

Trabajar en el cambio cultural

Las personas, como parte central del quehacer organizacional, deben ser capacitadas e inducidas a apropiar la publicación, en paralelo o anticipadamente a los cambios organizacionales.

Hacer público el compromiso

Explicitar y transparentar las acciones, los logros y los planes relacionados a la Publicación. Como mecanismo de transparencia, como estímulo y para evitar demandas excesivas.

Institucionalizar

Evitar la discrecionalidad apuntando a incardinar los cambios en la organización, rearmando los procesos, formando a las personas, ajustando las normativas y los mecanismos de control.

Apropiar la tecnología adecuada

Sin la tecnología adecuada no se pueden hacer estos cambios significativos salvo en escalas muy reducidas o a costos muy altos. Por lo tanto la informatización institucional y la apropiación de tecnología específica debe ser parte del proceso de cambio.

Coordinar las organizaciones

La integración de la organización al resto de la administración y a la sociedad, a través del flujo de información es un objetivo central de la Publicación de datos. Se deben evitar la simple publicación para cumplir con los requisitos a favor de que esta sea un vínculo de la organización con el exterior.

Desarrollar comunidades de práctica

A nivel de la Administración se debe aprovechar la creación de comunidades de práctica con los involucrados en las tareas propias de la Publicación en los distintos organismos, aprovechando el conocimiento colectivo.

Desarrollar y comunicar una estrategia de todo el gobierno

También a nivel Administración se debe desarrollar y comunicar el plan común a todos los organismos, asumiendo los compromisos y explicitando los logros y los problemas.

6 Experiencias de publicación Se presentan a continuación distintas experiencias sobre Open Data para tomar como ejemplo y referencia de lo expuesto. Aporta

Proyecto Aporta del Ministerio de Ciencia y Tecnología de España. Son interesantes as definiciones que contiene. www.aporta.es/web/guest/guia_reutilizacion.

Asturias

El Principado de Asturias, uno de los tres casos testigo de España. url.ctic.es/datosasturias


Cataluña

Uno de los referentes de España. En el portal de la Generalitat se puede consultar y también descargar el catálogo con todas las iniciativas de datos abiertos dentro de la institución. Incluso un conjunto significativo de datos se encuentran en los formatos que se consideran de alta calidad para su reutilización como el RDF. dadesobertes.gencat.cat/es/

Coins

Un ejemplo concreto del Reino Unido donde recientemente se ha publicado la base de datos que contiene todo el gasto del gobierno nacional. data.gov.uk/dataset/coins

CTIC

El CTIC (fundación especializada en el desarrollo de políticas, estrategias y proyectos de sociedad de la información, si.ctic.es) mantiene un mapa de las iniciativas de Open Data a nivel mundial. Partiendo de esta base y de los amplios conocimientos en el desarrollo y la aplicación de la Arquitectura Web, CTIC ha desarrollado una metodología propia en varias fases que van desde el análisis y la asesoría estratégica a los gobiernos sobre qué datos publicar y cómo, hasta todas las piezas técnicas necesarias para realizar dicha publicación utilizando tecnología Web 3.0, pasando por el despliegue de un catálogo de datos y la construcción de aplicativos de ejemplo que podrían utilizar dichos datos. datos.fundacionctic.org/sandbox/catalog/map

Estados Unidos

Uno de los casos ejemplo de Open Data. www.data.gov. Véase también www.whitehouse.gov/open

Euskadi

El País Vasco, uno de los tres casos testigo de España. opendata.euskadi.net

FAO

La tendencia hacia la liberación del acceso a datos se extiende también a los organismos internacionales. Por ejemplo, a partir del 1/07/2010 puede accederse libremente en línea a la mayor base de datos mundiales sobre alimentos, agricultura y hambre de la FAO (Food and Agriculture Organization of the United Nations). FAOSTAT permite el acceso a más de 3 millones de series cronológicas y estructuras de datos. Su nueva versión a nivel nacional CountrySTAT ofrece un puente de ida y vuelta entre estadísticas subnacionales, nacionales e internacionales.faostat.fao.org/default.aspx

Reino Unido

Uno de los precursores del Open Data. data.gov.uk y www.nationalarchives.gov.uk/doc/open-government-licence/open-governmentlicence.htm

W3C

Open data es actualmente una materia de interés para W3C eGovernment donde se desarrollan “las mejores prácticas” sobre cómo publicar open data. Puede tratarse de cosas sencillas como: "es mejor publicar en XML que en Excel" como de cosas más complicadas: "cómo publicar un catálogo de Linked Government Data" (es decir, como llevar el "open data" a formar parte de la Web 3.0, o “Web de los Datos"). Una de las tareas más recientes es la creación de un formato uniforme para describir los catálogos de "open data", algo que aún no existe y que permitirá agregar, filtrar y comparar los diferentes catálogos de "open data" que los gobiernos están poniendo en la Web.

Zaragoza

datos.zaragoza.es.

Aporta

Proyecto Aporta del Ministerio de Ciencia y Tecnología de España. Son interesantes as definiciones que contiene. www.aporta.es/web/guest/guia_reutilizacion.

Asturias

El Principado de Asturias, uno de los tres casos testigo de España. url.ctic.es/datosasturias

Cataluña

Uno de los referentes de España. En el portal de la Generalitat se puede consultar y también descargar el catálogo con todas las iniciativas de datos abiertos dentro de la institución. Incluso un conjunto significativo de datos se encuentran en los formatos que se consideran de alta calidad para su reutilización como el RDF. dadesobertes.gencat.cat/es/

7 Conclusiones y reflexiones Existen varias tensiones en ciertos aspectos de la implementación de la Publicación de Datos, por ejemplo: ¿los datos deben publicarse como un repositorio plano o interpretados? A muchas autoridades les gusta más la segunda opción ya que existe "temor de las interpretaciones de terceros", argumento que se ha escuchado en varias oportunidades; ¿qué pasa si de una determinada base de datos se sacan conclusiones sin el contexto? Por lo tanto se plantea que debe existir la "interpretación oficial", si bien es relevante dicha interpretación es relevante que exista la posibilidad de procesamiento independiente de la data, desde su fuente primaria. Otro tema difícil es la gestión de la metadata: ¿qué tipo de marcas y qué documentación se van a elaborar y publicar junto con los datos? Ambas tareas que requieren de un esfuerzo importante y


que además se irá depurando en el tiempo. Es importante destacar que este es un proceso continuo y no coyuntural. La experiencia del data.gov ha dejado algunas enseñanzas: •

Focalizarse en el acceso: la plataforma de publicación debe permitir un acceso lo más cerca a la fuente original posible, incluso plantea que los datos residan en las instituciones generadoras.

Plataforma abierta: debe permitir no sólo la descarga sino además la interacción vía API (del inglés: Application Programming Interface) u otros instrumentos semejantes.

Datos desagregados al máximo nivel posible: sin que se entre en atentar contra la privacidad y los datos personales de los individuos.

Retroalimentación: crecimiento y mejoramiento por la vía del aporte de los usuarios.

Hacerse cargo: las agencias que publican deben hacerse responsables de la caducidad y la privacidad de los datos, sin recargar a los consumidores en temas que son de incumbencia estatal.

Estandarizar: apropiar buenas prácticas en temas de publicación de datos y gestión de información

Van a continuación algunas reflexiones no como conclusiones sino todo lo contrario, como iniciadores de nuevas reflexiones y generadores de intercambios: •

La Publicación de Datos exige a las administraciones y organismos públicos poner en marcha cambios profundos que afectan a todos los planos de su quehacer: cultural, político, legal, organizacional, informacional y tecnológico.

No se puede exigir a las administraciones y organismos públicos que publiquen todo y en un corto plazo. Asumir la publicación como una actividad institucional más es un proceso que requiere esfuerzo y tiempo para apropiación institucional de nuevas capacidades.

La Publicación no es gratuita, los organismos deben hacer esfuerzo para realizarla como corresponde. Por lo tanto, el objetivo es lograr que se haga de forma sistemática y correctamente soportada por la tecnología que la haga viable.

La Publicación debe hacerse siguiendo los estándares y las buenas prácticas establecidos de gestión de datos, al igual que cualquier proceso institucional.

8 Bibliografía AR/SGP/FRRII (2008) “Mapa de restricciones a la Interoperabilidad en el sector público”. Presentación del trabajo realizado por el Grupo de Interoperabilidad del Foro de Responsables Informáticos de la ONTI/SGP en USUARIA 2006. rrii.sgp.gob.ar/index.php? option=com_docman&task=cat_view&gid=154&Itemid=200002 Barros, Alejandro (04-12-11): “Data.xx ya no existen excusas”. www.alejandrobarros.com Eaves David (200) “Open Data: USA vs. Canada”, October 2009. eaves.ca/2009/10/08/open-dataus-vs-canada/ Gwanhoo Lee y Young Hoon Kwak (2011): “An Open Government Implementation Model: Moving to Increased Public Engagement”. En Using Technology Series. http://www.businessofgovernment.org/report/open-government-implementation-modelmoving-increased-public-engagement Lakhani, Karim, Austin, Robert & Yumi Yi (2010): Data.gov, a Harvard Bussines School Case Studies. www.data.gov/documents/hbs_datagov_case_study.pdf Lista de catálogo de Open Data, eadminblog.net/post/2010/04/11/lista-de-catalogos-de-open-data-en-el-mundo MELODA: Methodology for Releasing Open Data Version 0.4. www.meloda.org OCDE (2008) “Recomendación para el mejor acceso y el efectivo uso de la información pública”. www.oecd.org/dataoecd/0/27/40826024.pdf


OEA (2010) Boletín Electrónico del Foro de e-Goierno de la Organización de Estados Americanos, N° 56, agosto de 2010. www.suboletin.com/contentsoea/docs/Boletin_56/Principal56.htm Open Data USA, www.data.gov Poggi, Eduardo (2008): “Modelos de Madurez para la Interoperabilidad”. Monografía presentada en el 2° SIE / 37° JAIIO 2008, Santa Fe, Argentina, Septiembre de 2008. (2° Premio Nacional de Gobierno Electrónico Edición 2008) Tauberer, Joshua (2009) “Open Data is Civic Capital: Best Practices for Open Government Data", versión 1.3 del 14/04/2010. http://razor.occams.info/pubdocs/opendataciviccapital.html W3C (2009) Publishing Open Government Data, W3C Working Draft 8 September 2009. www.w3.org/TR/2009/WD-gov-data-20090908/ Wikipedia, es.wikipedia.org


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.