Para entender la publicidad digital, estudie sus algoritmos

Algoritmos de estudios ALAN MISLOVE. Recientemente, su investigación en Northeastern University, en Boston, ha demostrado que el software de Facebook filtraba los números de teléfono de los usuarios a los anunciantes. También ha encontrado nuevas formas de auditar ese mismo software por sesgo racial. Pero trabaja como enfrenta sus desafíos. El raspado de datos de sitios web públicos a menudo se acerca al incumplimiento de sus términos y condiciones. Y las empresas a las que pertenecen esos sitios web generalmente no están dispuestas a dar a los investigadores un acceso más directo a sus sistemas.

Además, examinar los algoritmos de otras personas requiere la creación de los tuyos para hacerlo. El grupo del Dr. Mislove a menudo pasa meses simplemente escribiendo el código necesario para recopilar datos sobre los objetos de su investigación. Esto significa que solo aquellos con suficientes habilidades informáticas pueden estudiar los programas informáticos que desempeñan un papel cada vez más importante en la sociedad, no solo en el comercio, sino también en la política, la economía, la justicia y muchas otras áreas de la vida. Esto es malo para la investigación y para el público.

Ahora, mientras Facebook se encuentra en medio de un escándalo por el manejo de los datos y el poder de su software publicitario hiperdestinado, el Dr. Mislove está trabajando con un grupo de investigadores del Instituto de Tecnología de Massachusetts (MIT) que piensan que tienen una respuesta a estos problemas. Este grupo, dirigido por Iyad Rahwan, ha tomado una hoja del libro de BF Skinner, un conductista animal que, hace varias décadas, trabajó en el camino de MIT en Harvard. Skinner inventó un dispositivo, ahora conocido como una caja Skinner, que estandarizó el proceso de experimentación conductual. Usó sus cajas para controlar los estímulos de entrada (comida, luz, sonido, dolor) y luego observó el comportamiento de salida en un intento de vincular el uno con el otro. Aunque de ninguna manera perfecto, la caja de Skinner fue un gran avance en el campo. El Dr. Rahwan espera hacer algo similar al software utilizando lo que él llama una caja de Turing.

Esta «caja» es en sí misma una pieza de software. Coloque un algoritmo en él, controle las entradas de datos, mida los resultados, y podrá determinar exactamente cómo se comporta en diferentes circunstancias. Cualquiera que quiera estudiar un algoritmo puede subirlo a un cuadro de Turing. El software de la caja luego comenzaría a ejecutar el algoritmo a través de un conjunto de datos estándar del tipo para el que fue diseñado. Todos los algoritmos de reconocimiento de rostros, por ejemplo, recibirían el mismo conjunto de rostros científicamente validados. La salida del algoritmo, en este caso, cómo clasifica diferentes caras, se registraría y analizaría. La esperanza del Dr. Rahwan es que las empresas quieran que los científicos políticos y sociales usen el recuadro para analizar sus algoritmos en busca de fallas potencialmente dañinas (por ejemplo, tratando caras de forma diferente por motivos raciales), y que los investigadores se alinearán para hacer las pruebas.

De hecho, sus ambiciones van más allá todavía. Su intención es que la caja de Turing se convierta en solo un componente de un nuevo campo, el estudio científico del comportamiento exhibido por las máquinas inteligentes y el impacto de ese comportamiento en las personas. Un documento de demostración que él y sus colegas presentaron para su publicación en la Conferencia Conjunta Internacional sobre Inteligencia Artificial describe el sistema, así como los detalles más amplios de este nuevo campo de comportamiento de la máquina. Planea terminar el software Turing-box para el verano, y dice que publicará el código bajo licencia de código abierto poco después, para que cualquier persona pueda volver a utilizarlo. El funcionamiento de la plataforma se dejará en manos de una firma sin fines de lucro que planea sacar del MIT.

Boxeo inteligente

Es una idea clara y oportuna. Los algoritmos se están desarrollando mucho más rápido de lo que se están estudiando y comprendiendo sus impactos (ver tabla). La caja de Turing, si funciona según lo previsto, podría ayudar a cambiar el rumbo. Comprender el comportamiento de los algoritmos es particularmente urgente en el «ecosistema» de publicidad digital existente, en el cual los usuarios individuales de software están, en efecto, en sus propias cajas de Skinner, con sus acciones constantemente monitoreadas y recompensas personalizadas. El furor de Facebook, por ejemplo, gira en torno a acusaciones de que Cambridge Analytica, una firma de cabildeo digital, obtuvo datos de Facebook de manera inapropiada y los utilizó para apuntar anuncios que influyeron en las elecciones presidenciales estadounidenses de 2016 (la empresa ha negado haber cometido alguna falta).

El Dr. Rahwan reconoce que la reticencia de muchas empresas que forman parte del ecosistema de la publicidad digital para cargar sus algoritmos para su inspección lo convierten en un mal lugar para comenzar. Entonces, para empezar, trabajará en otra parte, estudiando sistemas menos controvertidos y comercialmente sensibles, como los algoritmos de código abierto para el procesamiento del lenguaje natural.

Él dice, sin embargo, que el objetivo final es permitir el estudio de los algoritmos que algunas de las empresas de TI más valiosas del mundo tienen más querido: el suministro de noticias de Facebook, por ejemplo, o el software de recomendación de productos de Amazon. Esto significa observar el comportamiento de estos algoritmos en un entorno lo más cercano posible a aquel en el que operan normalmente, de modo que se pueda medir su impacto en el mundo real. Esto, a su vez, requerirá que las empresas que los poseen les brinden a los investigadores independientes acceso a sus sistemas y datos.

Los últimos años han visto que las cosas van en la dirección opuesta. Según Michal Kosinski de la Stanford Graduate School of Business, que en 2012 fue pionera en el uso de datos de Facebook para estudiar la personalidad, «los investigadores académicos prácticamente no tienen acceso a datos disponibles públicamente sin romper los términos de servicio de una plataforma determinada». Los escrúpulos de las empresas en estos asuntos no son impulsados ​​solo por el deseo de secreto comercial. Como han demostrado los eventos de esta semana, una filtración de datos personales de una investigación académica puede ser tan dañina como la de un socio de negocios descuidado.

Por lo tanto, la investigación de datos particularmente confidenciales puede requerir que los académicos estén físicamente presentes dentro de una organización para poder acceder a esos datos, un proceso similar al de estudiar en la sección de libros raros de una biblioteca. También podría ser una buena idea contar con árbitros independientes de algún tipo, para garantizar que tanto las empresas como los investigadores se mantengan firmes.

Facebook parece estar abierto a la idea de trabajar con investigadores de esta manera. En una declaración dada a The Economist unos días antes de que la historia de Cambridge Analytica se rompiera, la firma manifestó su deseo de trabajar con investigadores para comprender el impacto de sus sistemas, pero advirtió que tenía que proteger los datos de sus usuarios de terceros. . Facebook también dijo que está «trabajando activamente» en un enfoque que logra ambos objetivos, aunque se negó a proporcionar ningún detalle de ese trabajo. Contactado más tarde en la semana, el equipo de ciencia de datos de la empresa se negó a emitir ninguna declaración adicional.

La caja de Turing está solo en las primeras etapas de desarrollo, pero tanto ella como otros sistemas ofrecen inyectar algo vital en la discusión de las prácticas digitales: evidencia causal reunida de forma independiente. Sin eso, la gente nunca saldrá de las cajas de Skinner en las que las empresas tecnológicas las han colocado.

Lee mas

Por admin

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.