Datenschutz bei Google -Federated Learning






Standard-Lernansätze erfordern die Zentralisierung der Trainingsdaten auf einer Maschine oder in einem Rechenzentrum. Und Google hat eine der sichersten und robustesten Cloud-Infrastrukturen für die Verarbeitung dieser Daten gebaut, um unsere Dienstleistungen besser zu machen. Jetzt für Modelle, die von der Benutzerinteraktion mit mobilen Geräten trainiert werden, stellen wir einen zusätzlichen Ansatz vor: Federated Learning.


Federated Learning ermöglicht es Mobiltelefonen, gemeinsam ein gemeinsames Vorhersagemodell zu erlernen, während alle Trainingsdaten auf dem Gerät gespeichert werden, die Fähigkeit, das Lernen zu messen, von der Notwendigkeit, die Daten in der Cloud zu speichern, zu entkoppeln. Dies geht über die Verwendung von lokalen Modellen hinaus, die Vorhersagen auf mobilen Geräten (wie die Mobile Vision API und On-Device Smart Reply) machen, indem sie auch Modelltraining auf das Gerät bringen.

Es funktioniert so: Ihr Gerät lädt das aktuelle Modell herunter, verbessert es, indem es von Daten auf Ihrem Telefon lernt und fasst dann die Änderungen als kleines fokussiertes Update zusammen. Nur dieses Update auf das Modell wird an die Cloud gesendet, mit verschlüsselter Kommunikation, wo es sofort mit anderen User-Updates gemittelt wird, um das gemeinsame Modell zu verbessern. Alle Trainingsdaten bleiben auf Ihrem Gerät und keine individuellen Updates werden in der Cloud gespeichert.

Das ist eine Funktion, die Datenschutz-sensiblen Menschen oft ausschalten, weil die Vorhersage in der Regel "in der Cloud" geschieht. Dies bedeutete, dass alles, was man tippt, zum Anbieter gesendet wird. Bis heute.

Bereits jetzt nutzt Google in ihrer aktuellen Tastatur (Gboard-App). Damit hat Google Datenschutz einfach eingebaut, ohne großen Rummel. Natürlich nicht nur zum Selbstzweck: Google nutzt damit die Rechenleistung aller Smartphones, um das eigene neuronale Netz zu trainieren. Dies ist fair, weil der Nutzer etwas davon hat - eine verbesserte Wortvorhersage.


Und das, ohne dass Google die getippten Inhalte überhaupt erhält. Nebenbei spart dies auch noch Datenübertragungsvolumen. Gepaart mit dem vorgestellten Kommunikationsprotokoll ist selbst die Rückrechnung einzelner vom Smartphone geschickter Trainings-Updates unmöglich: es stellt (beweisbar) sicher, dass nur verdichtete Daten ausgewertet werden können. Selbst dieses Protokoll für sich genommen ist (auch für andere Anwendungen wie z.B. Befragungen) ein echter Gewinn für den Datenschutz.

Kommentare