Te quedan 2 artículos gratuitos este mes.

Accede sin límites desde 55 €/año

Suscríbete  o  Inicia sesión

‘Big Data’, el nuevo Eldorado de Internet

Comparte
Pertenece a la revista
Octubre 2013 / 7

La Red permite recopilar una cantidad ingente de datos y en los próximos años el potencial de amasarlos se incrementará todavía mucho más. La tecnología abre nuevas perspectivas, pero también muchos interrogantes sobre su uso.

¿Se ha dado cuenta de que la publicidad que aparece en los sitios web que visita corresponde en general al tipo de productos que le interesan? 

¿Es una simple coincidencia? No. En general, esos mensajes publicitarios están dirigidos a usted,  gracias al análisis de las huellas que deja en la Red cuando navega por ella. Algunas de dichas huellas las deja deliberadamente, por ejemplo, cuando se inscribe a una newsletter. Pero también hay datos invisibles contenidos en los cookies (literalmente, ‘testigos’ en inglés) depositados en su navegador a través de los sitios que usted visita. A ellos hay que añadir sus comentarios en las redes sociales y las informaciones sobre sus desplazamientos transmitidos por los instrumentos de geolocalización… En un reciente estudio, el gabinete de asesoría IDC estima que de aquí a ocho años, el número de datos disponibles será 50 veces superior al actual.  Hoy ya se envían y almacenan a escala mundial ¡200 millones de correos electrónicos por minuto!

 

Importantes evoluciones tecnológicas

La mejora de las redes explica en parte esa evolución. En los años 2000 la sistematización del alto rendimiento, vía ADSL, multiplicó por 100 la capacidad de transmisión. La fibra óptica, actualmente en desarrollo, va a permitir multiplicarla de nuevo por 10.   También se están desarrollando las redes sin hilo, que ofrecen a cada nueva generación tecnológica un rendimiento cada vez mayor. Además, la capacidad de almacenamiento de los datos ha aumentado considerablemente, mientras que su coste de adquisición o uso se ha hundido. Además, se han generalizado las soluciones para la conservación de datos o de servidores distantes, denominada la cloud (‘nube’, o ‘informática en las nubes’), con ofertas gratuitas en ocasiones para los particulares.

ILUSTRACIÓN: ALBERT SALA

Esta evolución ha multiplicado la posibilidad de interconexión entre los diferentes soportes desde los que acceder a Internet. La pantalla del ordenador personal no es ya el único instrumento de acceso a los contenidos online. La utilización de Internet en los smartphones y las tabletas táctiles (el Instituto GFK prevé vender seis millones en 2013 en Francia frente a los 3,6 millones en 2012) se generaliza. Estos soportes amplían el uso del digital a través de las aplicaciones con vocación utilitaria o lúdica.  

Finalmente, la extremada miniaturización de los dispositivos (las nanotecnologías) posibilita que se conecten online objetos denominados inteligentes, como por ejemplo Navigo, que gestiona los abonos de transporte de los usuarios de la región Île de France. Un informe reciente de la Comisaría General de la Estrategia y la Prospectiva subraya que este “Internet de los objetos” está aún en sus comienzos. Sus usuarios potenciales, como por ejemplo en el ámbito de la sanidad, son innumerables. En este sentido, la Universidad de Washington y Microsoft han puesto a punto unas lentes de contacto que miden el índice de glucemia en las lágrimas  y lo transmite a una aplicación de teléfono para facilitar el control individualizado del tratamiento de la diabetes. Solamente en Francia, hay 620.000 insulinodependientes. Las perspectivas de mercado para este tipo de tecnologías son, pues, considerables. Ericsson prevé que de aquí a 2020 habrá más de 50.000 millones de objetos interconectados frente a los 12.000 millones actuales. 

 

Big data, big business

Este tsunami de datos constituye un reto comercial para gran número de empresas, si logran hacerse con ellos y explotarlos: lograr que sea útil esta masa de informaciones no es sencillo. Es el reto de lo que se denomina Big Data; es decir, el tratamiento de un volumen gigantesco de datos. “Se pueden recuperar informaciones sobre el comportamiento y  las tendencias de consumo de los internautas, y seguir su navegación”, explica Hélène Gombaud-Saintonge, directora general de FullSix Data, agencia de comunicación y marketing digital. “Dichas informaciones deben ser utilizadas después para dirigir la oferta adecuada de producto al cliente adecuado”. Para ello se han desarrollado una serie de algoritmos que clasifican y segmentan los datos. “Respondemos mejor a las necesidades de los consumidores”, insiste Hélène Gombaud-Saintonge, “a la vez que les enviamos menos ofertas”. Este enfoque permite reducir costes y aumentar ingresos. “Si personalizamos el mensaje y aumentamos su pertinencia, podemos esperar un aumento de la cifra de negocio del 10% al 15%”, subraya Claire Koralewski, directora asociada de FullSix Data.

Pero el marketing no es el único horizonte del Big Data. “Se trata de un movimiento insoslayable”, subraya Benoit Thieulin, presidente del Conseil National du Numérique, “que puede añadir valor a los internautas y hacer variar los modelos económicos de algunas empresas”. Debido a los múltiples usos de la utilización de los datos (véase el recuadro), la consultora McKinsey ha cifrado los aumentos de productividad generados por el Big Data en el 0,7% en sanidad y el 1% en el sector de comercio. Solamente el comercio de recogida y análisis de los datos es estimado por la consultora estadounidense en 50.000 millones de dólares anuales de aquí a 2017. Un mercado del que Francia puede beneficiarse. “Nuestro país cuenta con dos bazas: empresas internacionales poseedoras de enormes bases de información, como los bancos, y unos excelentes matemáticos”, recuerda Benoit Teuidin. Fleur Pellerin, ministra delegada para las Pymes, la Innovación y la Economía Digital, ha puesto en marcha un plan de ayuda a la rama francesa del Big Data  .

 

La difícil protección de los datos

Sin embargo, la mala calidad de los datos recogidos, en gran parte inutilizables por estar corrompidos, o ser incompletos o imprecisos, constituye un primer obstáculo para el desarrollo del Big Data. Según IDC, solo ¡el 3% de los datos en línea son realmente utilizables! Además, los internautas son cada vez más reticentes a dejar informaciones personales en la Red, sobre todo, tras  el caso Prisme —nombre del programa de los servicios secretos estadounidenses para la recogida masiva de datos personales en Internet—, que ha reavivado legítimamente sus temores. La Caisse des Dépôts y la Association de l’Économie Numérique (Acsel) considera, en su barómetro de junio de 2013,  que el 47% de los internautas da informaciones personales falsas en Internet. Seguramente tienen razón al hacerlo: la protección de sus datos no está garantizada, y el almacenamiento de las informaciones se hace en unos servidores a veces instalados en la otra punta del globo en  ciberparaísos de legislación laxista.

Ese riesgo no afecta solo a los particulares, sino también a las empresas: “El Big Data transforma la problemática de la seguridad en la empresa”, concede Christian Aghroum, presidente de la comisión de seguridad digital del Club de Sécurité des Entreprises (CDSE). “Gestionamos un gran volumen de informaciones almacenadas por todo el mundo con legislaciones diferentes e imprecisiones en lo que a las jurisdicciones competentes se refiere. En caso de problema, ¿cuál elegir? ¿La del territorio donde se producen los datos? ¿La del territorio donde se utilizan? ¿O la de donde se almacena?”

¿Qué regulación?

La Convención de Budapest sobre la cibercriminalidad, encargada de garantizar el “desarrollo armonioso” de las nuevas tecnologías en Europa, data de 2001. ¡Una eternidad a escala de Internet! “No hay una reglamentación internacional precisa sobre estos datos, ni sobre el régimen de su propiedad”, subraya Myriam Quemener, magistrada especialista en cibercriminalidad. “Hay un gran vacío jurídico, aunque las cosas están cambiando”. La Unión Europea  ha afrontado, sin embargo, el problema mediante una directiva sobre la regulación de la protección de datos que se está discutiendo desde hace un año. Este proyecto prevé, fundamentalmente, la armonización de las legislaciones europeas, facilitar recursos en caso de problema, así como la obligatoriedad del consentimiento explícito de los internautas antes de transmitir sus datos. 

“Si no se quiere crear una sociedad de control”, recuerda Benoit Thieulin, “es necesario utilizar los datos con total transparencia, con una contrapartida para la gente y con su aprobación”. Las negociaciones con los gigantes de la Red como Amazon, Google o Apple son difíciles. En efecto, parte de su actividad comercial se basa en la explotación de los datos de sus millones de visitantes y clientes. Estos grupos ejercen una fuerte presión sobre los diputados europeos, y con razón, pues se aprovechan de la diferencia entre los Estados para beneficiarse de las legislaciones más favorables.

El caso de la explotación de los datos es el mismo que el de la fiscalidad, ámbito en el que las estrategias de esas empresas consisten fundamentalmente en llevar sus ganancias a los territorios donde hay menos impuestos. Las conclusiones del informe sobre la fiscalidad digital  están dirigidas a establecer un nuevo marco basado, en parte, en la fiscalización de los datos. Sus dos autores, Pierre Collin y Nicolas Colin, que parten de la constatación de que la actividad de numerosas empresas en Internet se basa en la recogida y utilización de informaciones personales de los internautas, proponen establecer un impuesto para su utilización. Ello exigiría, como mínimo, un marco jurídico común a nivel europeo. Lo que constituye un reto fundamental para que ese Eldorado de los datos no se convierta a la larga en un infierno.

 

Horizonte nuevo

Los múltiples usos del Big Data

La utilización masiva de los datos abre nuevas perspectivas. En primer lugar, “el análisis de los datos que me afectan me permiten volver sobre mí mismo”, subraya Renaud Francou, de la Fondation pour un Internet Nouvelle Génération (FING). “Hay herramientas que me permiten medirme: por ejemplo, el tiempo que duermo, el ritmo cardíaco, lo que compro… Seré capaz de expresar con más claridad lo que soy y formular mejor lo que deseo”. Este enfoque está dirigido a fortalecer  las capacidades de los internautas a través del análisis de sus informaciones personales.

Además, gracias a la apertura de los datos públicos (open data), se desarrollan numerosos servicios (por ejemplo, la información de plazas libres en los aparcamientos en tiempo real)1.  En la industria farmacéutica,  open innovation permite compartir los resultados de la investigación sobre nuevas moléculas2.  Mientras que los entornos digitales de trabajo (ENT, en sus siglas francesas) en las escuelas propician nuevas formas de pedagogía adaptadas a cada alumno3. 

1. Véase “Les promesses de l’open data”, Alternatives Économiques, nº 313, disponible en nuestrios archivos online (http://www.alternatives-economiques.fr/). En la industria farmacéutica, el open innovation” permite compartir resultados de la investigación sobre nuevas moléculas.

2. Véase, “Medicaments le big bang industrielle”, Alternatives Économiques, nº 324, disponible en nuestros archivos online.

3. “École: une révolution numérique inachevée”, Alternatives Économiques, nª 323, disponible en nuestros archivos online.

 

UN RETO DEMOCRÁTICO

La protección de los datos es una preocupación fundamental. “El reto consiste en proteger nuestros datos y a la vez tener la posibilidad de exponerlos para beneficiarnos de los servicios ligados a su utilización”, subraya Renaud Francou, coordinador del proyecto Mes Infos de la Fondation pour un Internet Nouvelle Génération (FING). “Ponemos en marcha un experimento basado en un principio simple: las empresas que tienen informaciones que me interesan me las dan en una caja fuerte digital. Puedo utilizarlas, lo que me permite definir mejor mis necesidades. A cambio, puedo compartir mis datos con las empresas que elijo para que me hagan propuestas comerciales que se adapten auténticamente a mis necesidades”. FING va a realizar en los próximos meses un  experimento con 300 usuarios y empresas asociadas como Orange, Monoprix y Crédit Coopératif. 
 

¿ORO NEGRO?

Para muchos actores del mundo digital, los datos constituyen un nuevo oro negro. Como todo lo que tiene valor, los riesgos de robo, piratería y corrupción son muy grandes. Como subraya Christian Aghroum, presidente de la comisión de seguridad digital del CDSE: ”Siempre ha habido robo de informaciones, pero hoy, los medios técnicos permiten almacenar un número incalculable de datos, y otro tipo de medios, capturarlos muy deprisa sin que nadie se entere”. La concentración de los datos en servidores permite que millones de informaciones puedan ser robadas de una vez, para ser revendidas después en un auténtico mercado negro en el que toda la información se monetariza. Albert González, condenado a 20 años de prisión por robo de datos en 2009, robó los números de más de 130 millones de tarjetas de crédito en Estados Unidos.

 

ALGUNAS HERRAMIENTAS FÁCILES Y GRATUITAS PROCEDENTES DEL BIG DATA

Numerosas herramientas gratuitas, ligadas a la explotación de los datos, están disponibles en Internet.  Por ejemplo, un plano de París, realizado por estudiantes, que informa sobre el ingreso fiscal medio o los diplomas de los residentes de la capital en función de su estación de metro (http://dataparis.io/#). Utiliza los datos públicos puestos on line por diversas administraciones.

También, uno puede obtener un balance de sus relaciones sociales a través de un análisis de los correos electrónicos que envía. Si posee un correo Gmail (Google), puede utilizar “Inmersión”, una herramienta gratuita desarrollada por el Massachusetts Institute of Technology (MIT) que permite elaborar una cartografía del conjunto de sus intercambios de correo electrónico utilizando las informaciones personales disponibles en su correo (los datos así utilizados no se conservan).
Finalmente, el análisis de los datos se basa en modelos estadísticos cuyo principal interés es su capacidad de predecir. Por ejemplo, el seguimiento de las epidemias de gripe. Google ha puesto online una herramienta que perfila el número de preguntas efectuadas en su motor de búsqueda (en posesión de más del 65% del mercado mundial de los motores de búsqueda a finales de 2012, según comScore QSearch) relativas a la gripe. Su análisis permite seguir con dos semanas de anticipación la evolución de la epidemia. Los investigadores de Google se dieron cuenta de que había una correlación entre las búsquedas sobre la gripe efectuadas en su motor y la aparición de los primeros síntomas gripales. Estos usos abren perspectivas para mejorar la farmacovigilancia, por ejemplo.
Para saber más: para utilizar Inmersión: http://inmersion.media.mid.edu; para seguir la evolución de la epidemia en el mundo, en Google: www.google.org/flutrends/
 
 

Para saber más

Véase “Internet: prospective 2030”, accesible en www.strategie.gov.fr/content/internet-prospective-2030-na-02-juin-2013

Véase “Big Data: The Next Frontier for Innovation, Competition and Productivity”, accesible en www.macksiney.com/inside/business_thecnology/bigdata_d_next_frontier_for_innnovation   

Véase “Le soutien à l’economie numérique à l’innovation”, accesible en www.gf.finaces.gouv.fr./webdav/site/igf/shared/nos_Rapports/documents/2012/2011-m-050-02.pdf

Véase “Mission d’expertise sur la fiscalité de l’économie numérique”, accesible en www./regressement-productif.gouv.fr/files/rapport-fiscalité-du-numerique_2013.pdf