Target, una empresa de venta por catálogo, sabe que cuando una pareja espera un hijo, cambian sus hábitos de consumo: por ejemplo, les interesan menos los artículos de ocio y empiezan a buscar cosas para niños. Por eso, Target elaboró un algoritmo para adivinar embarazos de sus clientes a partir de lo que miran en Internet. En un caso famoso en la breve historia de los big data, un hombre protestó cuando llegaron a su hija catálogos de ropa de bebé, cunas y productos semejantes, y luego tuvo que disculparse al comprobar que la chica estaba embarazada y Target se había enterado antes que él.
¿He ahí Big Brother usando Big Data? Joaquín Fernández, responsable de relaciones con los medios internacionales en Ferrovial, relató la anécdota en la Jornada de Comunicación Siglo XXI, sobre los big data, celebrada el pasado 5 de abril en el Colegio Mayor Albayzín (Granada). Y también advirtió que Target no siempre acierta, y el error puede resultar embarazoso para la compañía. Aunque los big data, añadió Fernández, podrían hacer que nuestra vida privada quedara bajo control, esa posibilidad está aún muy lejos. Nadie puede captar y elaborar los ingentes datos que serían necesarios para mantener vigilada a la población.
En efecto, la NSA de Estados Unidos es incapaz de procesar los 1.700 millones de registros de comunicaciones electrónicas que amasa diariamente, según se cree. Ahora bien, cuando quiere investigar a alguien, puede escarbar en ese inmenso pajar para encontrar las agujas que revelan con quién se ha puesto en contacto el sospechoso.
Hoy en día, hasta los datos más inocuos pueden revelar la identidad de una persona si se han recopilado en número suficiente
Protecciones que ya no funcionan
Cuando usamos los medios digitales, no nos observa nadie, pero dejamos huellas que se pueden rastrear. Los datos masivos, advierten los autores de Big data, implican mayores problemas para la protección de la privacidad. No solo porque los hagan más grandes, por la mayor cantidad de datos personales que se recopilan, sino sobre todo porque crean problemas de otra naturaleza.
Hasta ahora, la protección de los datos personales se basa en notificar a cada interesado y pedirle consentimiento, antes de obtenerlos, y en hacerlos anónimos cuando se usan para otros fines o se ceden a terceros. Esto ya no funciona en la era de los big data.
¿Sirve realmente para algo el aviso que es preceptivo en la Unión Europea sobre el uso de cookies? Nadie se para a leer las normas al respecto en cada web que visita, ni prohíbe las cookies, que en parte son necesarias para que el sitio funcione a gusto del usuario. Al final, la notificación es una mera formalidad, o peor aún: una molesta ventana emergente que uno ha de cerrar cada vez que entra en un sitio.
Además, anonimizar los datos se ha vuelto muy difícil ahora que se capturan tantos datos y se puede combinarlos de muchas formas, como muestran dos ejemplos que aportan los autores de Big data. Para facilitar estudios de mercado, AOL y NetFlix publicaron datos de búsquedas y calificaciones de películas, respectivamente, hechas por sus usuarios, después de sustituir la marca de cada uno por un número convencional. Pese a ello, sendos periódicos demostraron que se podía identificar a gran parte de los usuarios: en el caso de AOL, relacionando distintas búsquedas correspondientes a una misma persona; en el de NetFlix, cruzando las calificaciones de películas alquiladas con las puestas en la Internet Movie Database.
Nuevo modelo de privacidad
El panorama, pues, ha cambiado. “Antes sabíamos muy bien lo que constituía información personal identificable –nombre, número de afiliación a la Seguridad Social, registros fiscales, etc.– y, por ende, resultaba relativamente sencilla de proteger. Hoy en día, hasta los datos más inocuos pueden revelar la identidad de una persona si se han recopilado en número suficiente”.
El consentimiento expreso ya no es suficiente por otra razón: el valor de los datos masivos reside también en los usos secundarios, distintos de aquellos para los que originalmente se hace la recopilación. De hecho, “empresas de todo tipo amasan montones de informaciones personales relacionadas con todos los aspectos de nuestras vidas, las comparten con otras sin nuestro conocimiento… y las usan de maneras que difícilmente hubiéramos imaginado”, a veces para beneficio nuestro también. El registro de nuestra actividad cuando visitamos una web permite personalizarla, destacando lo que a cada uno le gusta más y seleccionando los anuncios según los intereses particulares.
Por eso, los autores de Big data proponen un nuevo modelo de protección de la privacidad: pasar del sistema basado en la autorización del titular de los datos personales a otro basado en la responsabilidad de quienes los explotan. Las entidades que los recopilan podrían conservarlos más tiempo, aunque no indefinidamente, y tendrían permiso implícito amplio, para usarlos de muchos modos. Pero ya no estarían cubiertas simplemente por la autorización genérica, y tendrían que responder de los usos que finalmente hicieran.
Datos borrosos
En particular, los autores definen qué condiciones habría que exigir cuando los big data se emplean para tomar decisiones que nos afectan personalmente, como la concesión de un crédito o el precio de un seguro médico. La primera es transparencia: el algoritmo por el que se llega al resultado a partir de los datos debería ser público y (segunda) estar sujeto a certificación por parte de un analista independiente que corrobore la exactitud y la imparcialidad del cálculo. En tercer lugar, refutabilidad: el interesado tiene derecho a contestar la decisión.
Otra protección es la que los autores llaman “privacidad diferencial”. Consiste en hacer borrosos los datos, para que una consulta no dé resultados exactos, y por tanto sea prácticamente imposible identificar a las personas. Es lo que hace Facebook con la información que suministra a los anunciantes: les dice solo un número aproximado de miembros con las características relevantes (por ejemplo, profesionales liberales menores de 30 años), para que no se pueda descubrir a ninguno cruzando datos.
Vendo mis datos
El libro sugiere una idea para que recobremos el control de los datos que nos pertenecen, pero de una manera distinta al poder de otorgar o negar el consentimiento para reunirlos y usarlos, bastante debilitado. Ahora que muchas empresas obtienen ganancias explotando datos personales, ¿no podríamos participar de los beneficios? Hasta el presente, regalamos datos mientras recorremos Internet o usamos dispositivos móviles; ¿por qué no venderlos?
Naturalmente, un solo individuo no tiene fuerza para negociar con los explotadores de datos, pues lo que tiene valor es la acumulación de datos de muchas personas. Pero se podrían constituir bolsas de datos, que los vendieran a las empresas interesadas y compartieran el dinero con los cedentes. No parece tan utópico: la venta de datos ya existe, pero si son personales, nadie paga a los titulares.
En cualquier caso, necesitamos encontrar un equilibrio justo y razonable entre la facilidad para reunir y explotar datos, y la protección de la libertad y la intimidad de las personas. Hay que aprovechar los big data y a la vez tener a raya al Big Brother. Aún no tenemos la fórmula adecuada.