2 ago. 2010

La nueva mina de oro en Internet: vender la información que sacaron de su computadora

Por Julia Angwin

Escondido en el interior de la computadora de Ashley Hayes-Beaty, un pequeño ayuda a recolectar detalles personales de su navegación, los cuales serán puestos a la venta por un décimo de penique de dólar.

El archivo comprende un sólo código— 4c812db292272995e5416a323e79bd37— que secretamente la identifica como una mujer de 26 años en Nashville, Tennessee

El código sabe que sus películas favoritas son Como si fuera la primera vez, Princess Bride y Diez cosas que odio de ti, Sabe que le gusta la serie de TV Sex and the City. Sabe que lee noticias de entretenimiento y que le gusta responder a cuestionarios.

"Me gusta pensar que me queda algo de misterio, ¡pero aparentemente no es así!", dijo Hayes-Beaty cuando se le dijo lo que esa hilera de números revelaba sobre ella. "El perfil es perturbadoramente correcto".

Hayes-Beaty está siendo monitoreada por Lotame Solutions Inc., una compañía de Nueva York que usa un software sofisticado llamado "beacon" para capturar lo que la gente escribe en un sitio web, como los comentarios que hacen sobre las películas, o su interés en contenido sobre embarazos y cómo ser buen padre. Lotame empaca todos esos datos en un perfil sobre individuos, todo sin determinar el nombre de la persona, y vende los perfiles a compañías en busca de clientes. Los gustos de Hayes-Beaty pueden ser vendidos al por mayor (un grupo de personas a las que les encantan las películas por US$1 por cada mil) o en grupos específicos (personas de 26 años que vivan en el sur del país y a los que les guste Como si fuera la primera vez).

"Podemos segmentarlo hasta llegar a una persona", dice Eric Porres, el director de marketing de Lotame.

¿Quiénes espían?

Una investigación de The Wall Street Journal descubrió que uno de los negocios de mayor crecimiento en Internet es espiar a los usuarios en la web.

El WSJ llevó a cabo un extenso estudio que valoró y analizó la amplia gama de cookies y otras tecnologías de vigilancia que las compañías están usando para rastrear a los usuarios de Internet. Revela que el seguimiento de los consumidores se ha vuelto omnipresente y mucho más profundo de lo que muchos, a excepción de un puñado de gente en la vanguardia de la industria, se da cuenta.

El estudio descubrió que los 50 sitios más visitados por los estadounidenses (entre los que se encuentran varios sitios globales a los que acceden millones de latinoamericanos) instalaron en promedio 64 piezas de tecnología de seguimiento en las computadoras de sus visitantes, usualmente sin ningún aviso. Una decena de sitios instaló más de cien. La organización sin ánimo de lucro Wikipedia no instaló ninguno.

La tecnología de rastreo se está volviendo más inteligente y se inmiscuye cada vez más en la privacidad de los usuarios. Monitorear estos archivos anteriormente se limitaba principalmente a eliminar los archivos "cookie" que graban los sitios que la gente visita. Pero el WSJl encontró nuevas herramientas que escanean en tiempo real lo que la gente está haciendo en una página web, luego determinan al instante la ubicación, ingresos, intereses de compras e incluso problemas médicos de los usuarios. Algunas de estas herramientas se multiplican secretamente incluso después que los usuarios tratan de eliminarlas.

Estos perfiles de individuos, que se actualizan constantemente, son comprados y vendidos en mercados similares a las bolsas bursátiles, los cuales han aparecido en los últimos 18 meses.

Las nuevas tecnologías están transformando la economía de Internet. Anteriormente, los anunciantes compraban anuncios en páginas web específicas, como un anuncio de autos en una página sobre carreras. Pero ahora, los anunciantes están pagando extra para seguir a la gente por Internet, sin importar a dónde vayan, con mensajes altamente específicos.

Entre el usuario de Internet y el anunciante, WSJ identificó más de 100 intermediarios, compañías de rastreo, corredores de datos y redes de anunciantes, que compiten para satisfacer la creciente demanda de datos sobre comportamientos e intereses individuales.

Por ejemplo, los datos sobre los hábitos cinematográficos de Hayes-Beaty, se están ofreciendo a los anunciantes en BlueKai Inc., una de las nuevas bolsas.

"Es un mar de cambios en la forma en la que trabaja la industria", dice Omar Tawakol, presidente ejecutivo de BlueKai. "Los anunciantes desean comprar acceso a gente, no a páginas web".

The Wall Street Journal examinó los 50 sitios más populares en EE.UU., lo cual representa cerca del 40% de las páginas web que visitan los estadounidenses. (También se hicieron pruebas a nuestro sitio WSJ.com y WSJAmericas.com) y luego se analizaron los archivos de rastreo y los programas que estos sitios descargaron a una computadora de prueba.

Como grupo, los 50 sitios colocaron 3.180 archivos de rastreo en la computadora de prueba del WSJ. Cerca de un tercio de estos eran inofensivos, colocados para recordar la contraseña de un sitio favorito o para contar los artículos más populares.

Sin embargo, más de dos tercios, 2.224, fueron instalados por 131 compañías, muchas de las cuales están en el negocio de rastrear a los usuarios de Internet para crear bases de datos de perfiles de los consumidores, las cuales pueden vender.

El principal sitio en el que se empleó esta tecnología, según la investigación, fue Dictionary.com, propiedad de IAC/InterActive Corp. Una visita a este diccionario en línea resultó en 234 archivos o programas descargados a la computadora de prueba, 223 de los cuales eran de compañías que rastrean a los usuarios de Internet.

La información que las compañías recolectan es anónima, en el sentido en que los usuarios de Internet son identificados por un número asignado a su computadora, no por un nombre específico. Lotame, por ejemplo, asegura que no conoce el nombre de usuarios como Hayes-Beaty—sólo su comportamiento y atributos, identificados por un código. La gente que no desea ser rastreada puede sacarse a si misma del sistema de Lotame.

Además, la industria asegura que los datos se usan sin causar daños. David Moore, presidente de la junta de 24/7 RealMedia Inc., una red de anuncios propiedad de WPP PLC, asegura que este tipo de rastreo le da a los usuarios de Internet una mejor publicidad.

"Cuando un anuncio está bien dirigido, deja de ser un anuncio y se convierte en información importante", dijo.

¿Cómo instalan los rastreadores?

El seguimiento a las personas en la web no es nada nuevo. Pero la tecnología está creciendo y ganando tanto poder y omnipresencia que incluso algunos de los sitios analizados dicen que no estaban al tanto, hasta que WSJ les informó, de que estaban instalando archivos para espiar en las computadoras de sus visitantes.

WSJ encontró que el popular portal de Microsoft Corp. MSN.com plantó un archivo de rastreo lleno de datos: tenía una predicción de la edad de la persona que navegaba, su código postal, género e incluso un código que contenía cálculos de ingresos, estado civil, presencia de niños y si era dueño de su hogar o no, según la compañía de rastreo que creó el archivo, Targus Information Corp.

Tanto Targus como Microsoft dicen que no sabían cómo llegó el archivo a MSN.com y agregaron que este no contenía información "que identifique a las personas".

El rastreo es llevado a cabo por archivos minúsculos y programas conocidos como "cookies", "Flash Cookies" y "beacons". Estos son plantados en una computadora cuando un usuario visita un sitio web. Las cortes estadounidenses han decretado que es legal colocar el tipo más sencillo de archivo, los cookies, de la misma forma en la que alguien que usa un teléfono puede permitir que un amigo escuche la conversación. Las cortes no se han pronunciado sobre los rastreadores más complejos.

El rastreo que más se inmiscuye proviene de lo que se conoce en el negocio como archivos de rastreo "de terceros". Estos funcionan de la siguiente manera: la primera vez que un usuario visita un sitio, este instala un archivo de rastreo, el cual asigna a la computadora un número de identificación único. Después, cuando el usuario visita otro sitio asociado con la misma compañía de rastreo, puede tomar nota de dónde estuvo ese usuario antes y dónde se encuentra ahora. De esta forma, al pasar el tiempo, la compañía puede armar un perfil robusto.

El efecto sobre los usuarios

Uno de tales ecosistemas es la red de anuncios de Yahoo Inc. la cual obtiene pagos al colocar anuncios dirigidos a usuarios específicos en sus sitios web. La red de Yahoo sabe muchas cosas sobre Cate Reid, quien se acaba de graduar del colegio. Sabe que es una mujer de entre 13 y 18 años que está interesada en temas de pérdida de peso. Reid pudo determinar eso cuando un reportero le mostró una función poco conocida en el sitio de Yahoo, el Ad Interest Manager, que muestra parte de la información que Yahoo ha recolectado sobre ella.

La información de Yahoo sobre Reid, que en aquel momento tenía 17 años, dio en el blanco: ella estaba preocupada porque posiblemente estaba pasada de peso. Ella dice que ha menudo ha hecho búsquedas sobre temas de pérdida de peso.

"Cada vez que entro a Internet", dice, ve anuncios de pérdida de peso. "Soy auto consciente sobre mi peso", dice Reid, cuyo padre pidió no revelar la ciudad en la que reside. "Trato de no pensar en ello… pero los anuncios me hacen pensar sobre ello".

La portavoz de Yahoo Amber Allman dice que la empresa no dirige conscientemente anuncios de pérdida de peso a menores de 18 años, aunque si lo hace con los adultos.

"Es probable que esta usuaria haya recibido un anuncio no dirigido", dice Allman. También es posible que Reid haya visto anuncios dirigidos hacia ella por parte de otras compañías de rastreo.

El seguimiento de los consumidores es la fundación de una economía de publicidad en línea que recaudó US$23.000 millones en gastos de publicidad el año pasado. La actividad de rastreo se ha disparado. Investigadores de los laboratorios de AT&T Labs y el Instituto Politécnico Worcester descubrieron tecnología de rastreo en 80% de 1.000 sitios populares el año pasado, frente a 40% en esos sitios en 2005.

WSJ encontró archivos de rastreo que recolecta datos financieros y de salud sensibles. En el diccionario en línea Merriam-Webster.com, propiedad de Encyclopaedia Britannica Inc., un archivo de rastreo de Healthline Networks Inc., una red de anuncios que escanéa la página que el usuario está viendo y presenta anuncios relacionados con lo que ve allí. Así que por ejemplo, una persona que esté buscando palabras relacionadas con depresión podría ver anuncios de Healthline sobre tratamientos contra la depresión en esa página y en páginas subsecuentes vistas en otros sitios.
Healthline dice que no permite que los anunciantes sigan por otros páginas a los usuarios que hayan visto temas sensibles como el Sida, enfermedades de transmisión sexual, desórdenes alimenticios e impotencia. La compañía permite que los anunciantes sigan a gente con desordenes bipolares, vejiga hiperactiva y ansiedad, según sus materiales de marketing.

Los anuncios dirigidos pueden volverse demasiado personales. El año pasado, Julia Preston, una diseñadora de software de educación de 32 años en Austin, Texas, buscó información sobre desórdenes uterinos en línea. Poco después comenzó a notar anuncios de fertilidad en los sitios que visitaba. Ahora sabe que no tiene un desorden, pero igual sigue recibiendo los anuncios.

"Es desesperante", dice.