Datos, información, conocimiento

El desprestigio de la prensa, en parte, se explica por su crisis de credibilidad
¿Se puede equiparar el incremento en la producción de datos con el incremento en la producción de información?
Los datos son valores numéricos que representan una realidad abstracta, la información es el refinamiento de esos datos

23 de abril de 2013 06:00 h

En los años treinta del siglo pasado T.S. Eliot se preguntaba: “¿dónde está la sabiduría que hemos perdido en el conocimiento? ¿dónde está el conocimiento que hemos perdido en la información?” Hoy, habría que añadir: ¿dónde está la información que hemos perdido en los datos?

Los datos —en el sentido de data, en inglés—, se convierten en el nuevo ADN de la información. Temas tan distintos como el número de personas que dejan de cobrar el paro; las millones de búsquedas que se realizan todos los días en la red; indicadores de salud pública, tráfico aéreo, votos y gasto municipal; todo se cuantifica y registra en formatos más ágiles y cada vez más accesibles (se conocen como machine readable, el nuevo estándar de la transparencia pública). Según cálculos de Google, desde el comienzo de los registros escritos y hasta 2003 se crearon cinco hexabytes (mil millones de gigabytes) de datos. En 2010 se produjo la misma cantidad en tan solo 48 horas.

Surgen así nuevos campos de estudio; múltiples disciplinas desarrollan métodos de análisis e interpretación de datos. En la academia, áreas de estudio como la economía, el urbanismo, la química y la biología; en la empresa se crean nuevas divisiones de valoración de datos; y, más interesante aún, en el espacio público, surge tanto un nuevo tipo de periodismo conocido como “periodismo de datos” como una nueva forma de entender y valorar el trabajo de las administraciones y la rendición de cuentas.

Pero, ¿cómo entender el papel de los datos en esta nueva estructura? ¿Qué son los datos en su esencia? O, dicho de otra manera, ¿se puede equiparar el incremento en la producción de datos con el incremento en la producción de información? Más importante todavía: ¿esta nueva información necesariamente se traduce en mayor conocimiento?

Los datos, en su definición más elemental, son valores numéricos que representan una realidad abstracta. La información es el refinamiento de esos datos. Es decir, el valor que se extrae de datos inconexos que se convierten en información cuando se conectan y relacionan. La información, a su vez, se destila y, con la experiencia, se convierte en conocimiento. Cambia, por tanto, la forma en la que procesamos y ordenamos la gestión del conocimiento. Y, como consecuencia, cambia la forma en la que se estructura la esfera y opinión pública. Me centro aquí específicamente en la transformación que ello supone para la intersección del periodismo y la rendición de cuentas.

El desprestigio de la prensa, en parte, se explica por su crisis de credibilidad. Con la masificación de internet a mediados de la década de los noventa, la ya tocada naturaleza vertical, unidireccional y en muchos casos elitista —o, peor, populista— de los mass media, dio paso en una primera etapa a la democratización de la opinión (encarnada por el surgimiento y ascenso de medios sensacionalistas como el Huffington Post en Estados Unidos). Más medios, más canales, más opiniones. Se ampliaba y atomizaba la esfera pública con la diversidad de puntos de vista como bandera. Un soplo de aire fresco en el rancio ambiente de los medios, sin duda; pero muy poco aportaría para generar un debate público más rico e informado.

Sin embargo, una segunda etapa más reciente (nuevamente liderada por medios anglosajones) está dando paso a un periodismo basado en el rigor de la estadística y la información cuantificable. Es decir, de los datos. El ejemplo más sobresaliente hasta el momento es el del economista y estadístico Nate Silver. Conocido por su trabajo como analista electoral en Estados Unidos, Silver aplica datos a los datos. Es decir, complementa la naturaleza unidimensional de las encuestas tradicionales con otros indicadores que le ayudan a construir modelos de análisis más robustos y complejos. Analiza encuestas, pondera su desempeño histórico e incorpora series de información demográfica y electoral. Utilizando este método produjo un análisis más preciso y estable del estado de la elección presidencial de 2012 que cualquiera de los medios tradicionales —o los tertulianos— que se empeñaron en caracterizar la contienda como una lucha empatada (Romney en ningún momento igualó a Obama en los números del Colegio Electoral).

Y, así como cambia la base del análisis de las encuestas electorales, otros medios comienzan a utilizar grandes repositorios de datos como nuevas fuentes de información y base de una conversación pública más fundamentada en el rigor del análisis y menos en el abuso de las opiniones. Silver lo resumió bien en una entrevista reciente: “Ahora se trata de los números —con todas sus imperfecciones— versus la demagogia de las opiniones”.

El mismo criterio se puede aplicar a la forma en la que gobiernos y administraciones han utilizado tradicionalmente la información. Procesos altamente burocratizados, verticales, lentos y de difícil acceso para la ciudadanía, dan paso a formas más abiertas y eficaces de ordenar y utilizar la información pública. El Center for Disease Control en Estados Unidos (la agencia federal con más competencias en sanidad), por ejemplo, utiliza datos de búsquedas en Google para anticipar, modelar y predecir la trayectoria de brotes de diversas infecciones; comienza a diseñar políticas de prevención basadas en esta nueva fuente de información.

El Banco de Inglaterra, por su parte, experimenta con búsquedas en Internet relacionadas con impagos y desahucios para tomar un pulso más preciso y en tiempo real de la economía. Recientemente Downing Street creó la Cabinet Office Open Policy Making, una división dentro de la oficina del primer ministro encargada de abrir los procesos de formulación de políticas públicas y acercar a los expertos en cada materia.

Se trate de medios de comunicación o gobiernos, se comienza a replicar un proceso similar al de las iteraciones en ciencia y tecnología: prueba y error. Es decir, un círculo virtuoso de retroalimentación basado en la medición y rectificación constantes. O, en otras palabras, la beta permanente aplicada a las instituciones. Por debajo de la capa tradicional de conocimiento que se ha utilizado para valorar y tomar decisiones, se está insertando una capa de análisis cuantitativo —datos— que pronto constituirá los cimientos de la mayor parte de la información pública.

En el fondo, el desafío de los datos es un desafío de expertises. Es decir, de conocimiento aplicado. De saber reconstruir los procesos institucionales del mundo pre digital en unos que sepan aprovechar los cambios y el avance de la tecnología. Y el reto en este apartado es mayúsculo. Los datos en sí mismos aportan poco. Es la forma en la que se descifran, analizan y reordenan, lo que añade valor. La originalidad con la que se utilizan para encontrar patrones en la información y plantear alternativas antes no imaginadas. Para conseguirlo se necesitan, sobre todo, expertos: en presupuestos públicos, en ciencia, en transporte, en el sistema electoral, en corrupción, en sanidad... La antítesis, en otras palabras, del burócrata o periodista generalista con poder de mando o influencia pero sin conocimientos profundos sobre la materia. La fuente de autoridad en la esfera pública, pues, se desplaza; cambian sus intermediarios.

“Todos tienen derecho a su propia opinión; pero nadie a sus propios hechos”, solía decir Daniel Patrick Moynihan, el senador e intelectual público estadounidense. Una máxima sabia y difícil de llevar a la práctica que el senador proponía como eje del debate público. Una máxima que cobra nueva relevancia en una esfera pública conectada en red y apuntalada por los datos.

De los datos, a la información, al conocimiento. En ese orden. Esa es la nueva estructura de la conversación pública que viene. O de la que ya está aquí.

Etiquetas