Von wegen anonym: Unsere Identität und unsere persönlichen Daten lassen sich selbst in anonymisierten Datensätzen leicht zuordnen, wie nun eine Studie enthüllt. Demnach sind die meisten Menschen selbst über ganz legal verkaufte Daten identifizierbar – trotz Anonymisierung. Dafür reichen oft schon vier gängige Angaben aus, die meisten Datensätze enthalten allerdings weit mehr Attribute pro Person, wie die Forscher im Fachmagazin „Nature Communications berichten.
Ob beim Surfen, der App-Nutzung oder beim Bezahlen mit EC- und Kreditkarten: Bei fast allem, was wir tun, hinterlassen wir inzwischen eine Datenspur. Diese persönlichen Daten geraten jedoch oft an Dritte, zum Beispiel weil Apps die Daten weitergeben, Datenbanken gehackt werden oder aber weil die Datensätze von Marketingunternehmen oder auch zu Forschungszwecken genutzt werden – oft ganz legal. Denn wenn die Datensätze anonymisiert sind – also der Name und andere eindeutige Kennzeichen wie Kontonummer, Sozialversicherungsnummer und ähnliches entfernt werden, ist diese Nutzung und Weitergabe erlaubt.
Das aber weckt die Frage: Wie anonym sind diese Daten wirklich? Besteht nicht doch die Gefahr, dass eine Person allein aufgrund der noch enthaltenen Merkmale identifiziert werden kann? Tatsächlich haben Forscher schon vor einigen Jahren anhand von Kreditkartendaten demonstriert, dass genau dies möglich ist – mit teilweise erstaunlich wenigen Anhaltspunkten.
Wie verräterisch sind unsere Attribute?
Einen noch umfassenderen Test haben nun Luc Rocher von der Universität Louvain und seine Kollegen durchgeführt. Sie nutzen einen lernfähigen Algorithmus, um herauszufinden, mit welcher Sicherheit man eine anonymisierte Person selbst in einer großen Datenmenge eindeutig identifizieren kann. Als Datenquellen verwendeten die Forscher die anonymisierten Daten der US-Volkszählung und vier weitere öffentlich verfügbare Datensätze.