La filosofía de los datos abiertos
Mariano Crowe. Investigador asociado a Escuelab.org
La filosofía de datos abierto (open data) es el libre acceso a la información sin restricciones de licencias ni patentes, en particular para la información científica, estadística y administrativa generada y/o recopilada por las entidades públicas. ¿Por qué liberar la información? Los datos que recopilan las entidades oficiales, son de todos. Nosotros (los ciudadanos) los generamos, nosotros debemos tener acceso a ellos tal y cómo se produjeron, y los terceros también pero sin vulnerar ilegítimamente nuestros datos personales. De la misma manera con los datos científicos, la era de la información requiere de las entidades de gobierno una actitud acumulativa y protectora. Pero además esa información tiene que ser accesible de manera análoga (digital) a los ciudadanos. Es como la evolución de una “Biblioteca Nacional”.
Paradójicamente, la data ya es pública y accesible, aunque toneladas de pdfs, xls y gráficos no son realmente accesibles para realizar análisis automatizados y/o estadísticos. Son datos ya procesados. Los volúmenes de información “cruda” (sin procesar) son inconsumibles (ilegibles e inentendibles) para los seres humanos. Sólo pueden ser consumidos por las máquinas. Por lo tanto los centralizadores de la información no deberían ser los únicos entes con acceso a esa información para ser analizada de manera profesional y semi-automatizada.
Créanme: 100 tablas Excel de 100 kb de peso tienen mucho menos información y generan más sobre-trabajo, que un archivo CSV de 10,000 kb. Esto agiganta la brecha de acceso a la información por parte de los desarrolladores de software y desalienta su empleo libre o ‘hackeo’ (por lo menos el cívico).
¿Para qué liberar la información? Para brindar más posibilidades, criterios y medios de evaluación, comunicación y auditoría con los ciudadanos. Y así recíprocamente, ayudar a mejorar la imagen del Estado y su relación con los primeros, a través de una clara muestra de buena fe (actitud transparente). Ante el gobierno y la ocultación de información, presunción de culpabilidad: si el gobierno tiene algo que quiere esconder, es porque algo está haciendo mal. Los ciudadanos podemos ayudar a encontrar qué.
¿Cuál sería el plan?
En un primer estadío, que el Estado provea a la ciudadanía la data cruda, en formato estándar y sobre tecnologías abiertas (la Municipalidad de Lima lleva a cabo una iniciativa). ¿Qué significa esto?
Data cruda para hacer más “rico” y “apetecible” el archivo de datos (dataset) y promulgar la transparencia: Estos son los ingredientes y que cada uno se los cocina como quiera.
Formato estándar para que cualquiera tenga un marco de referencia de cómo está estructurada la data e, idealmente, cómo y con qué herramientas se puede consumir la información.
Y sobre tecnologías abiertas porque si la información es pública, debe ser replicable por cualquier persona con el interés y los conocimientos, independientemente de sus posibilidades económicas o preferencias tecnológicas. A diferencia de los protocolos y tecnologías privativas, creadas en el marco económico de una empresa, los estándares y tecnologías abiertas nacen de manera colaborativa y evolutiva, a partir del trabajo de comunidades heterogéneas de usuarios, expertos y desarrolladores.
En un segundo momento, el Estado debe complementar la información liberada con herramientas, tanto para los consumidores definitivos como para los programadores que quieran “jugar un rato” con la información, presentada en modo “lean”. Por ejemplo, facilitando herramientas infográficas y filtros de búsqueda y navegación, e interfaces de programación de aplicaciones (API en inglés) para el consumo de la información sin necesidad de replicación (sin ‘bajarse’ los archivos de datos de la web estatal que los aloja). El Estado también debería generar aplicaciones que utilicen la información publicada para dar un punto de referencia o ejemplos de “qué es lo que se puede hacer” y además promover la cultura ciudadana de los datos abiertos.
En un tercer estadío, el Estado debe minimizar los procesos y tiempos de liberación de data ‘cruda’. En un escenario ideal la disponibilidad de la información debería ser inmediata. Esto se logra tendiendo a una homogenización de las tecnologías encargadas de la recopilación de la información y las tecnologías encargadas de su publicación, y procurando llevar a cero la cantidad de intermediarios tecnológicos, entre el recopilador de la información y los consumidores.
Esta filosofía aplicada de manera transversal tanto al nivel de ciudadanía como al nivel de desarrolladores de tecnología, puede convertirse en vía para fomentar la innovación local, tanto por el estímulo a la diversificación y la experimentación, como reorientando los fondos antes dedicados a licencias, hacia focos locales de promoción del desarrollo tecnológico.
Además la información liberada puede ser la inspiradora y primer sustento para iniciativas (start-up) ciudadanas. Como estrategia sostenible, una filosofía de los datos abiertos madura e implantada como línea de base extiende mandatos, intereses personales e ideologías políticas. Los productos tecnológicos de código abierto (open source) tienen ciclos de vida más largos y evoluciones más constantes y menos críticas que aquellos basados en tecnología privativa. No dependen exclusivamente de nadie y son de todos (igual que la data).
Finalmente. ¿Cuál sería el peor escenario? El peor escenario posible es que los datos abiertos no sean utilizados por nadie. Ese escenario es casi idéntico al escenario actual con la diferencia de que el Estado ya habrá hecho su parte… de ahí dependerá de la ciudadanía.
PD: Este documento se basa en la agenda de reuniones que desde 2011 mantienen Escuelab.org y la Municipalidad Metropolitana de Lima en el marco de su iniciativa de Datos Abiertos.
_______________________________
Qué es Suma Ciudadana?
Escrito por
Promoviendo la participación ciudadana
Publicado en
Promoviendo la participación ciudadana