Los Grandes Números

Uno de los lugares comunes de esta Internet que nos ha tocado vivir en los últimos años es el “tamaño” que cada vez importa más. Manejamos cantidades ingentes de datos, hasta tal punto que el empirismo amenaza con determinar la desaparición de los teóricos en la Red, convertidos en “gurús” investidos por la efímera autoridad que confiere el conocimiento superficial de los (pen)últimos estadísticos sobre este o aquel particular.

The Data Deluge

¿Qué decir del periodismo, afectado por la retórica informática a todos los niveles? En cierta forma, nos estamos convirtiendo en una especie de remedo orgánico del popular robot “Número 5″ de Cortocircuito, que evolucionaba entre los humanos al grito de “datos, necesito datos”. Pensemos que la característica “rastreabilidad” o trazabilidad de nuestros perfiles y/o avatares en la Red se sustancia en un comportamiento orientado al consumismo, pero muy productivo desde el punto de vista de la acumulación de datos sobre nuestra naturaleza como usuarios/clientes en la Red.

Nuestra propia identidad e intimidad se redefinen en función de la accesibilidad de esos filones de datos que se consolidan a distintas profundidades en la Web. Pero la gestión de esa inmensidad de información en potencia conlleva, tal y como apuntaban algunos colegas en la MIT Technology Review recientemente, una gran responsabilidad.

Big Data

La reflexión de marras, muy pertinente, no se debe a Spiderman, sino que nos lleva a un artículo reciente firmado por Danah Boyd y Kate Crawford. Bajo el “provocador” título de “Six Provocations for Big Data“, la conocida investigadora de Microsoft y la joven profesora de la Universidad de Nueva Gales del Sur realizan un breve ensayo en el que llaman la atención sobre seis características básicas de un entorno, como puede ser la Red que conocemos hoy, soportado sobre una proliferación desmedida de datos y medios para interpretarlos y tratarlos de mil formas distintas.

Big Data

Su tesis, mucho más interesante quizás que su ulterior desarrollo en el artículo es que lo realmente destacable de de esos Datos Masivos (Big Data) no es tanto su volumen sino el hecho de que se trata de una gran masa de datos cuyas piezas se encuentran altamente relacionadas: citando a las autoras,

Big Data is fundamentally networked. Its value comes from the patterns that can be derived by making connections between pieces of data, about an individual, about individuals in relation to others, about groups of people, or simply about the structure of information itself“.

Sin tiempo de profundizar aquí en ellos, me detendré brevemente en la enumeración de los seis aspectos que ponen sobre la mesa Boyd y Crawford y que pueden motivar el debate alrededor de una buena revisión de la literatura reciente que es lo mejor que aportan:

La Automatización cambia la definición de Conocimiento. “This is a world where massive amounts of data and applied mathematics replace every other tool that might be brought to bear. Out with every theory of human behavior, from linguistics to sociology. Forget taxonomy, ontology, and psychology. Who knows why people do what they do? The point is they do it, and we can track and measure it with unprecedented fidelity. With enough data, the numbers speak for themselves (Chris Anderson, 2008)“.

Se confunden Objetividad y Precisión. “Big Data offers the humanistic disciplines a new way to claim the status of quantitative science and objective method [···] All researchers are interpreters of data [···] Spectacular errors can emerge when researchers try to build social science findings into technological systems“.

Más Datos no significa Mejores Datos. “Social scientists have long argued that what makes their work rigorous is rooted in their systematic approach to data collection and analysis [···] Unfortunately, some who are embracing Big Data presume the core methodological issues in the social sciences are no longer relevant. There is a problematic underlying ethos that bigger is better, that quantity necessarily means quality“.

No todos los Datos son iguales. “Big Data introduces two new popular types of social networks derived from data traces: ‘articulated networks’ -those that result from people specifying their contacts through a mediating technology-, and ‘behavioral networks’ -derived from communication patterns, cell coordinates, and social media interactions“.

La Accesibilidad no garantiza un planteamiento Ético. “There are significant questions of truth, control and power in Big Data studies: researchers have the tools and the access, while social media users as a whole do not“.

El Acceso Limitado provoca nuevas Brechas Digitales. “The current ecosystem around Big Data creates a new kind of digital divide: the Big Data rich and the Big Data poor“.

Esta visión de una Red densamente conectada y constituida por nodos de una red social cada vez más tupida, una especie de “Grafo Global Gigante” es la que ha motivado el lento desarrollo de las modernas “Ciencias de la Web” y algunas realizaciones técnicas notables como la infraestructura federada de ‘Linked Data‘, que busca dotar de una infraestructura coherente a la plétora de conjuntos disjuntos de datos que se reproducen en la Red como por esporas, estimulando al ingeniero que llevo dentro con desafíos más y más complejos que surgen de la simple naturaleza reticular de nuestro Nuevo Entorno Tecnosocial.

Twitter Digg Delicious Stumbleupon Technorati Facebook Email

No hay comentarios aún... ¡Se el primero en dejar una respuesta!

Dejar un Comentario