MDN
Laberinto de datos - 1
José-Carlos Mariátegui

El 2003, un grupo de economistas y teóricos de la información de la Universidad de Berkeley publicó el estudio "How Much Information?" [1] (“¿Cuánta información?”), considerado uno de los primeros intentos sistemáticos de cuantificación de la información que se produce y almacena en todo tipo de soportes, que incluyen de forma destacada a los medios digitales. Los expertos de Berkeley demostraron que el crecimiento de la información se duplicaba aceleradamente en intervalos cada vez más reducidos. Un estudio del 20122  del International Data Corporation (IDC) ofreció nuevos aportes y señaló que, entre el 2005 y el 2020, el universo digital de datos se duplicaría cada dos años, es decir, llegaría a 40.000 exabytes o 40 trillones de gigabytes. Si buscamos ilustrar esta cantidad de datos, podríamos imaginar que, si un libro equivale a un megabyte de información, necesitaríamos 3.000 columnas de libros, cada una con una altura similar a la distancia que existe de la tierra al sol (149.6 millones de kilómetros). Se trata de cifras que producen vértigo y que escapan a cualquier tipo de percepción humana de cantidad. 

— Factores en juego —
Son varios los factores que conducen a este crecimiento de la información. Uno determinante ha sido la migración de las imágenes y del video al dominio digital, algo que se ha dinamizado desde la proliferación de los teléfonos móviles con cámaras. Otro factor importante es la transformación de la información analógica a la digital, y la espectacular circulación de información duplicada (en los dos soportes). El 70% de la información digital es generada por los usuarios por medio de las redes sociales, incluyendo el envío de imágenes y videos entre smartphones. Incluso, si hablamos en términos geopolíticos, el universo digital ya no es un fenómeno del mundo desarrollado. Los mercados emergentes contribuirán con el 62% de la información digital para el 2020. Tan solo China generará el 21% de este gran flujo de datos.
    Para el 2020 también, casi el 40% de la información del universo digital se encontrará en la nube, como comúnmente se conoce a los servicios de almacenamiento online, que nos permiten subir videos a YouTube, colocar fotos en Instagram o descargar contenido digital en un teléfono. Utilizando la nube accedemos al contenido en cualquier dispositivo y momento, una condición de omnipresencia que permite trazar la “huella digital” del individuo, lo que genera a la vez más datos y activa sofisticados sistemas automatizados con recomendaciones a la medida de cada persona. 
    Google, Amazon, Facebook, Apple y Microsoft concentran buena parte de la información pública y personal existente en el mundo digital, lo que evidencia que buena parte de nuestra vida digital viene siendo gestionada e integrada por grandes corporaciones privadas.
    Las estadísticas nos permiten reconocer que nos encontramos en un período de la humanidad marcado por el impacto de la información. Sin embargo, la simple proliferación de dispositivos de captura, producción y difusión no basta para explicar este fenómeno ni sus sutiles consecuencias. Lo cierto es que tan solo una pequeña fracción del universo digital ha sido explorada por el poder de la tecnología; es decir, nos encontramos al inicio de un proceso que será un factor socioeconómico determinante durante el siglo XXI.

— La metadata —
Para Jannis Kallinikos, profesor de la London School of Economics y uno de los más acuciosos investigadores del tema, existen características propias de la información en la era del Internet, como la autorreferencialidad, la interoperabilidad y su carácter efímero. La primera de estas características nos indica que cada vez que se manipula información requerimos generar, precisamente, más información. Esto se evidencia en el uso de la metadata (eso mismo, información acerca de la información). Comúnmente la metadata se encuentra en las descripciones de fotos y videos online, en los tags de Facebook o en los #hashtags de Twitter. 
    La metadata sirve para describir la información digital y esto nos lleva a un espiral multiplicador: esta información al interoperarse con una de otro tipo crea híbridos a partir de fuentes desconectadas. El ars combinatoria de los datos producidos por fuentes de información de los más diversos temas viene facilitando el desarrollo de nuevas formas de trabajo, que armonizan las disciplinas sociales más dispares. Por último, una de las circunstancias incuestionables que ha promovido el crecimiento de la información es su corta vida: esto la convierte en un producto altamente desechable. La información financiera, por ejemplo, el monitoreo en tiempo real de operaciones, los feeds de Facebook o Twitter son particularmente sensibles a esta corta vida. Los mensajes efímeros de Snapchat, la red social más popular entre adolescentes y jóvenes, rompe también con el hábito de acumulación de información para pasar a la autodestrucción de la misma.
    La acumulación de información se establece a partir de la creciente expansión de los aspectos más triviales hasta los más importantes de la vida que se registran en grandes bases de datos con estados financieros, médicos o legales, perfiles y hábitos en línea. Estas bases de datos confluyen con la sofisticación de la tecnología para conferir a los datos un papel nuevo e interesante en la vida de las personas y el funcionamiento de las instituciones. Se infiltra así cada vez más en el tejido social, construyendo la percepción de acontecimientos locales y globales, definiendo prioridades y relevancias, y enmarcando las formas en que nos acercamos a la realidad.

— Los usos del big data —
A partir del uso de grandes repositorios de información, generalmente conocidos como big data, es posible combinar diferentes tipos de información de múltiples fuentes que permiten, a su vez, desarrollar nuevos servicios, sobre todo mediante el uso de Internet. El big data se vuelve parte de nuestra vida cotidiana cada vez que solicitamos un taxi por una app y este llega en pocos minutos, o cuando Waze nos recomienda el mejor camino para evitar el tráfico. Una evidencia extraordinaria del uso del big data es el cambio de hábito en nuestras relaciones para encontrar pareja. En Estados Unidos, en el 2014, uno de cada tres matrimonios se concretó a partir de relaciones que empezaron en apps y páginas web de citas románticas en línea. Hoy es el principal medio para conocer parejas en ese país, y supera los encuentros en reuniones de amigos y otras actividades de entretenimiento. La evolución y sofisticación de la tecnología para ‘emparejar’, mediante modelos conductuales basados en el comportamiento real de las personas y los datos que recogen los smartphones, ha contribuido significativamente a hacer más eficiente el cruce de datos entre personas para lograr relaciones a largo plazo.
    El valor del big data reside también en su capacidad de utilizar los datos agregados de información para adelantarse a tragedias producidas por fenómenos naturales. Una prueba sorprendente es el sistema sísmico de alerta temprana en Japón, que permitió avisar a la población del terremoto de marzo del 2011 con un minuto de anticipación, debido al uso de una compleja red de miles de sensores de alta precisión que, al detectar un nivel alto de ondas geológicas “P”, envía una alarma a los celulares en menos de diez segundos. Así se salvaron miles de vidas.
    Hace una década no pensábamos que los likes en Facebook o las búsquedas en Google nos proveerían de información que pudiera tomar el pulso emocional de la humanidad para definir estrategias de marketing que influyeran en el transcurrir de nuestras vidas. El big data genera nuevos mecanismos y estructuras de datos difusas y cambiantes que retan las prácticas estadísticas tradicionales. Este tipo de tecnología se humaniza a partir del procesamiento algorítmico de múltiples fuentes de información que aprenden continuamente el comportamiento de un individuo en un contexto determinado. Los datos creados por artefactos conectados a Internet dejan una sombra digital del individuo que los usa, y esta puede ser rastreada y relacionada con otras actividades. Entonces, quiénes somos o cómo actuamos —es decir, nuestra identidad y comportamiento— yace oculto en repositorios gigantescos que registran hábitos, patrones transaccionales y otras características derivadas del análisis y la comparación de las bases de datos combinadas. Esto nos despoja de toda privacidad, y nuestro discurrir diario puede ser analizado en aspectos que incluso escapan a nuestra percepción y comprensión. Esta nueva condición digital nos lleva a reflexionar críticamente sobre las formas de control computacional que ejerce la tecnología sobre el individuo y que vulnera, de modo sutil, nociones básicas de libertad, pensamiento y acción. 
    Hoy resulta imposible liberarse totalmente de dicho control, pues nuestro transcurrir cobra vida en el mundo digital para integrarse espontáneamente con sistemas de recomendaciones que se han institucionalizado.

— Vladivideos y arte —
La naturaleza de la data, su condición pública y privada, ha permitido generar una transparencia de información nunca antes vista en la historia de la humanidad, que incluso puede ser amplificada por las redes sociales. Hace unas semanas el Centro de Documentación e Investigación del Lugar de la Memoria, la Tolerancia y la Inclusión Social, publicó en su canal de YouTube 155 vladivideos[3]. En cuestión de horas fueron compartidos por miles de peruanos, lo que derivó en una discusión pública y necesaria acerca de la etapa de corrupción que se vivió en la década de los noventa ad portas de las elecciones presidenciales. 
    Es innegable que esta acción permitió visibilizar contenidos que no se encontraban hasta ese entonces disponibles. Como estos existen muchos otros repositorios de datos abiertos que esperan ser utilizados con fines sociales y ciudadanos, por ejemplo el sistema de información del Ministerio de Cultura (InfoCultura[4]), o los de la Municipalidad de Lima[5], Miraflores[6] y San Isidro[7], entre otros. 
    Toda esta confluencia de datos, información y prácticas sociales nos lleva a una práctica inter y transdisciplinaria que ha permitido usar también el big data para generar obras de arte electrónico que se valen de diversos mecanismos para entender el impacto social de la información, más allá del simple dato abstracto. Es decir, no se trata ya de obras construidas con tradicionales criterios estéticos o narrativos, sino que pueden ser aplicaciones o programas de usos múltiples. 
    El teórico en nuevos medios Lev Manovich explica que la novela y el cine privilegiaron un esquema narrativo como la forma preponderante de expresión cultural. Hoy, la tecnología computacional y las bases de datos privilegian un nuevo tipo de forma cultural basada en la combinación de aquellos, que pueden desembocar en una compleja matriz de significados. Estamos pasando de un universo de datos relativamente homogéneo y narrativo, principalmente monosemiótico y alfanumérico, a otro de datos heterogéneos y de complejos contenidos transemióticos (simultáneamente texto, imagen y sonido). 
    Gracias a este fenómeno de la tecnología, podemos extraer un significado nuevo de las cosas, que impacta en nuestra forma de aprender, en nuestra memoria, y evidencia que hoy el valor de la información no yace ya ni en la información per se ni en la fuente de dichos datos, sino en las interfaces computacionales y las bases de datos que nos permitirían generar nuevos significados.

Big Bang Data
Desde anteayer y hasta el 16 de octubre, el Espacio Fundación Telefónica presentará Big Bang Data, una muestra que exhibe proyectos que buscan hacer tangible la compleja y masiva infraestructura industrial que se requiere para mantener los datos digitales, conocidos comúnmente como data centers y que hoy utilizan el 2% del consumo energético global; así como el silencioso y desconocido mundo de los cables submarinos que unen la red de información global, y que son de tal fragilidad que, si se dañaran, podrían dejar sin acceso a Internet a países o continentes enteros por días. 
    Entre los proyectos expuestos se busca mostrar los usos y alcances del big data en el mundo para promover, por ejemplo, una democracia participativa y controlar la contaminación ambiental, como el realizado por el Smart Citizen Kit, un artefacto basado en el “Internet de las cosas” (IoT), que usa sensores para medir la calidad del aire, la temperatura, el sonido, la humedad y la luz, y que permite a los ciudadanos acceder a esta información y colaborar en el análisis del impacto de la polución local o global. 
    La literatura también ha servido aquí de inspiración para proyectos. Santiago Ortiz propone una compleja animación para explicar los derroteros de una lectura “no lineal” de "Rayuela", de Julio Cortázar (novela que, recordemos, se puede leer saltando capítulos). Esta aplicación permite una nueva lectura de una obra publicada hace más de medio siglo. Curiosee aquí: https://goo.gl/ZwGbYm.
    El proyecto Cinema Redux, por otro lado, procesa el contenido de 27 de películas para generar un patrón que resume en pocos fotogramas el ritmo de la edición y los principales patrones de color utilizados por sus directores. Finalmente, James Bridle trazó sus desplazamientos en 202 mapas ejecutados entre junio del 2010 y abril del 2011. De esta manera descubrió lugares que olvidó haber visitado y encontró otros a los que nunca había ido, pero que aparecían como consecuencia de errores computacionales.
    Como mencionan los españoles Olga Subirós y José Luis de Vicente, curadores de Big Bang Data, “la muestra explora la emergencia de la base de datos como un marco de pensamiento cultural y político, y también crítico de los efectos de la datificación del mundo: un proceso tan determinante en el siglo XXI como lo fue la electricidad en el XIX”.
    “Para nosotros —dice Subirós, quien vino a Lima a presentar la muestra— esta es la oportunidad de llevar a una sala de exposiciones piezas que son como una caja de herramientas que nos sirven para interpretar este fenómeno que está ocurriendo ahora, en tiempo real, ya que somos los primeros en la historia experimentando y participando de este cambio; un movimiento acelerado por el uso de los dispositivos móviles que lo está cambiando todo: la cultura, la sociedad, la política, la vida privada”.

Contenido sugerido

Contenido GEC