Es normal que Apple, como cualquier mega-corporación, quiera saber lo máximo posible acerca de sus clientes. Es sabido que se comercializa con los datos. En la WWDC, Apple informó que ha optado por la privacidad diferencial. El Vicepresidente Senior de la empresa en Ingeniería del Software indicó que Apple hace cifrar extremo a extremo iMessage y Facetime y trata de mantener la mayor información personal en el dispositivo y no en los servidores de Apple.
Se tuvo que admitir que la recogida de información de los usuarios es fundamental para hacer un buen software, especialmente en una época dónde el análisis del Big Data y aprendizaje es fundamental. ¿Qué es la privacidad diferencial? En resumidas cuentas es la ciencia estadística de tratar de aprender tanto como sea posible acerca de un grupo, mientras se aprende tan poco como sea posible acerca de cualquier individuo de ella. Es decir, se intenta anonimizar el máximo detalle de cualquier individuo de una muestra, pero se intenta extraer el máximo de información del conjunto. La privacidad diferencial es un tema de investigación en las áreas de estadísticas y datos de análisis que utiliza elementos como la inyección de hash, submuestreo y el ruido para permitir el aprendizaje.
Figura 1: Libro sobre Privacidad Diferencial de Aaron Roth |
Con la privacidad diferencial, Apple puede recoger y almacenar los datos de sus usuarios en un formato que permite conocer nociones útiles sobre lo que se hace, por ejemplo, como se hace y la necesidad, pero no se puede extraer información de un solo individuo. Se está logrando respetar una violación de la privacidad. En teoría, tampoco podrían otros observadores información concreta de un individuo.
Figura 2: Esquema de Differential Privacy |
"Con un gran conjunto de datos registrados de individuos, ejecutando el algoritmo de aprendizaje automático, se puede derivar conocimientos estadísticos a partir de la base de datos en su conjunto", indica Aaron Roth, profesor de la Universidad de Pennsylvania. Apple abre la puerta a la posibilidad de extraer información de un conjunto de individuos, sin necesidad de conocer cosas sobre un individuo de dicha muestra.
No hay comentarios:
Publicar un comentario