Día de la privacidad de datos: novedades sobre la privacidad diferencial
29 de Enero de 2021Escribe Miguel Guevara, Gerente de producto, Oficina de Privacidad y Protección de Datos, Google
En Google, siempre hemos creído en el poder del código abierto para fomentar la innovación. La tecnología abierta y disponible de forma gratuita habilita la colaboración y respalda soluciones para problemas del mundo real. Los proyectos de código abierto mejoran la experiencia general de Internet para todos. La privacidad también ha sido fundamental para este trabajo y continuaremos invirtiendo en estas tecnologías de privacidad para ayudar a mantener tu información personal privada y segura. La privacidad diferencial, la tecnología de anonimización de clase mundial, se utiliza en nuestros productos todos los días, como Google Maps.
En 2019, liberamos el código de nuestra biblioteca de privacidad diferencial y la hicimos de libre acceso, fácil de implementar y útil para los desarrolladores de todo el mundo. Y mientras el mundo combate el COVID-19, el año pasado publicamos nuestros Informes de movilidad comunitaria COVID-19, que utilizan la privacidad diferencial para ayudar a los funcionarios de salud pública, economistas y legisladores a nivel mundial a medida que toman decisiones críticas para sus comunidades.
Tratar la información de manera responsable es manejar tus datos con cuidado.
A medida que continuamos invirtiendo en el campo de la privacidad algorítmica, hoy anunciamos una nueva asociación de código abierto centrada en tecnologías que preservan la privacidad, un nuevo producto de código abierto, una nueva forma en que aplicamos la privacidad diferencial en Google Play y actualizaciones a nuestra oferta de aprendizaje automático.
Fortaleciendo nuestros productos principales con privacidad diferencial
Lanzamos por primera vez la privacidad diferencial en Chrome hace casi siete años, desde entonces, Google ha agregado privacidad diferencial a muchos de sus productos. El año pasado, publicamos los informes de movilidad comunitaria COVID-19 y el conjunto de datos de tendencias de gripe, ambos fueron posibles gracias a la tecnología que desarrollamos internamente que brinda fuertes protecciones de privacidad, como la privacidad diferencial.
Este año, nos complace anunciar que Google Play comenzará a compartir nuevas métricas con los desarrolladores utilizando la privacidad diferencial que proporcionará nuevos conocimientos sobre cómo se utiliza su aplicación, sin permitir que los datos de ninguna persona se distingan o se reconozcan. Miles de millones de usuarios se benefician de Play Store todos los días y, al agregar privacidad diferencial a nuestra oferta, brindamos un alto nivel de privacidad a las personas que usan Google Play, al tiempo que garantizamos que los desarrolladores puedan tener acceso a datos significativos que les permitan mejorar sus aplicaciones.
Si bien la versión inicial de estas métricas fue posible utilizando parámetros similares a los que hemos usado anteriormente, planeamos expandir la cantidad de métricas que proporcionamos a los desarrolladores. Estas expansiones pueden requerir parámetros más flexibles para adaptarse a la mayor cantidad de métricas.
Nueva asociación con OpenMined centrada en tecnologías de preservación de la privacidad
Nuestro trabajo en privacidad diferencial está impulsado por nuestro objetivo principal de fortalecer el ecosistema de código abierto de una manera que proporcione privacidad de clase mundial para todos de manera global. Es por eso que nos hemos asociado con OpenMined, un grupo de desarrolladores de código abierto que se enfoca en abordar tecnologías que preservan la privacidad y expandir su uso en todo el mundo. Junto con OpenMined, crearemos un sistema de procesamiento de datos orientado a los desarrolladores de Python. Esta asociación tiene como objetivo replicar la infraestructura diferencialmente privada que tiene Google y reducir las barreras de entrada para los desarrolladores de Python. Esta asociación proporcionará a los desarrolladores de Python una forma nueva y única de tratar sus datos con privacidad de clase mundial.
Además, estamos lanzando una especificación de consulta que se usa internamente. Esta especificación guía miles de búsquedas que se realizan todos los días en Google de forma diferencialmente privada. Este es un paso adelante en la democratización del análisis de datos de manera privada. Esperamos que esta versión permita a los científicos de datos de todo el mundo realizar análisis de manera privada.
Mejorando el estado del aprendizaje automático
Hace dos años, presentamos TensorFlow Privacy (GitHub), una biblioteca de código abierto que facilita a los desarrolladores no sólo el entrenamiento de modelos de aprendizaje automático con privacidad, sino también a los investigadores para avanzar en el estado del arte en aprendizaje automático con garantías de privacidad sólidas. Gracias a una colaboración con investigadores de la Universidad de Waterloo, hemos mejorado la privacidad de TensorFlow.
En algunos casos, el entrenamiento con privacidad puede ser costoso o inviable. Hemos tratado de abordar esto respondiendo a la pregunta: ¿qué tan privado es un modelo de aprendizaje automático? El año pasado liberamos el código de nuestra biblioteca de ataques. Esta biblioteca realiza ataques a los modelos de aprendizaje automático para responder a esa pregunta. Desde entonces, nos hemos asociado con investigadores de la Universidad de Princeton y la Universidad Nacional de Singapur. Estos investigadores han agregado nuevas funcionalidades que amplían el alcance de la biblioteca a modelos generativos de texto y modelos de redes no neuronales. Esto significa que cualquiera que use la biblioteca podrá obtener una visión más completa sobre la privacidad de sus modelos. Recientemente, investigadores de la Facultad de Medicina de Stanford lo probaron en algunos de sus modelos para probar la memorización. Esta prueba les ayudó a comprender el comportamiento de privacidad de sus modelos, algo que no era posible antes.
Nuestro trabajo continúa a medida que invertimos en privacidad de clase mundial que brinda protecciones algorítmicas a las personas que usan nuestros productos al mismo tiempo que fomentamos y expandimos un ecosistema de código abierto saludable. Creemos firmemente que todos en el mundo merecen privacidad de clase mundial y seguiremos asociándonos con más organizaciones para cumplir con esa misión.
(*) Miguel Guevara: Gerente de producto, Oficina de Privacidad y Protección de Datos, Google