Cuando la minería de redes sociales se equivoca

Ahora se puede reconstruir una imagen compleja de su vida personal utilizando una variedad de fuentes de datos públicos y técnicas de extracción de datos cada vez más sofisticadas. Pero, ¿qué tan precisa es esa imagen?

La semana pasada en Las Vegas, en la conferencia de seguridad informática Sombrero negro , Compras de Alessandro , profesor asociado de tecnología de la información y políticas públicas en el Heinz College de la Carnegie Mellon University, mostró cómo se puede usar una fotografía de una persona para encontrar su fecha de nacimiento, número de seguro social y otra información mediante el uso de tecnología de reconocimiento facial para hacer coincidir la imagen con un perfil en Facebook y otros sitios web. Acquisti reconoce las implicaciones de privacidad de este trabajo, pero advierte que el mayor problema podría ser la inexactitud de esta y otras técnicas de extracción de datos.

Acquisti dice que su trabajo actual es un intento de capturar el futuro hacia el que estamos caminando. En este futuro, él ve que la información en línea se usa para prejuzgar a una persona en muchos niveles: como una posible fecha, prestatario, empleado, inquilino, etc. Internet, dice, podría convertirse en un lugar donde todos conozcan tu nombre: una pequeña ciudad mundial que no te dejará vivir nada mal.

Más allá de las preocupaciones obvias de que los extraños sepan más que nunca sobre usted, Acquisti se preocupa por lo que sucederá cuando la tecnología cometa errores. Tendemos a hacer fuertes extrapolaciones sobre datos débiles, dice Acquisti. Es imposible luchar contra eso, porque está en nuestra naturaleza.

Varias empresas ya han comenzado a utilizar las redes sociales para medir y rastrear la reputación. La empresa de Santa Bárbara, California Inteligencia social , por ejemplo, realiza evaluaciones de antecedentes en las redes sociales de los posibles empleados y promete revelar información negativa, como comentarios racistas o fotos sexualmente explícitas, o información positiva, como signos de influencia de las redes sociales dentro de un campo específico. Otras empresas, como Klout , realiza un seguimiento del nivel de influencia social de los usuarios, lo que permite a los anunciantes ofrecer recompensas especiales a aquellos con puntuaciones altas.

Pero la investigación de Acquisti demostró los peligros de otorgar demasiada relevancia a los datos de las redes sociales. Su equipo tomó fotos de voluntarios y usó un reconocedor de rostros listo para usar llamado PittPatt (adquirido recientemente por Google) para encontrar el perfil de Facebook de cada voluntario, que a menudo revelaba el nombre real de esa persona y mucha más información personal. Con esta información, el equipo a veces podría averiguar parte del número de seguro social de una persona. También crearon un prototipo de aplicación para teléfonos inteligentes que obtiene información personal sobre una persona después de que se captura con la cámara del dispositivo.

En su experimento, el equipo pudo emparejar alrededor de un tercio de los sujetos con los perfiles correctos. A partir de ahí, hicieron otras predicciones. El setenta y cinco por ciento de las veces, predijeron correctamente los intereses de los sujetos. Ellos predijeron correctamente los primeros cinco dígitos de los números de seguridad social de los voluntarios alrededor del 16 por ciento del tiempo en dos intentos. (La precisión aumenta con más intentos).

Pero esto significa que dos tercios de las veces no identificaron a las personas correctamente. Y aquellos que fueron identificados correctamente todavía fueron asignados incorrectamente el 25 por ciento del tiempo a intereses personales particulares, y más del 80 por ciento del tiempo al número de seguro social incorrecto.

Acquisti espera que la tecnología de reconocimiento facial continúe mejorando en los próximos años, y pregunta qué sucederá una vez que se considere lo suficientemente buena como para confiar en ella la mayor parte del tiempo. Podría ser una pesadilla para aquellos que están mal identificados. No hay nada que nosotros, como individuos, podamos controlar, dice.

Otros investigadores están explorando la confiabilidad de la minería de datos sociales. En Defcon , una conferencia de piratería en Las Vegas el fin de semana pasado, un grupo llamado Fundación de privacidad en línea presentó los resultados de su Experimento de los cinco grandes , un estudio que tenía como objetivo hacer coincidir los rasgos de personalidad de los voluntarios con las cualidades de los perfiles de Facebook. Después de administrar un test de personalidad a los voluntarios, extrajeron perfiles para identificar características clave.

Los investigadores de la Online Privacy Foundation encontraron una correlación positiva entre las personas cuyas personalidades tendían a la apertura y aquellos cuyos perfiles de Facebook estaban cargados con más información: listas de intereses más largas, biografías más largas y más discusión sobre dinero, religión, muerte y emociones negativas. También encontraron una correlación positiva entre las personas agradables, definidas como compasivas, cooperativas, con la capacidad de perdonar y ser pragmáticas, y los estados de Facebook que estaban escritos en oraciones más largas, que hablaban de emociones positivas o tenían relativamente más comentarios, amigos y fotos. Sin embargo, en ambos casos, las correlaciones fueron relativamente débiles.

Los investigadores concluyen que un perfil de Facebook no es una fuente de información confiable. El punto clave es recordar que esto es una apuesta, dice el cofundador de la fundación. Chris Sumner . El mensaje es que sí, hay un vínculo, pero no lo use solo para decisiones críticas.

Acquisti y Sumner dicen que es posible que se necesiten nuevas políticas gubernamentales para proteger a las personas de la minería de datos excesiva y del uso indebido de su información. Esto podría implicar el establecimiento de estándares de precisión que las organizaciones deben cumplir. La pregunta que define a nuestro tiempo, dice Acquisti, es ¿cómo tratamos nosotros, como sociedad, con el big data?

esconder