Was können soziale Netzwerke im Internet über Menschen wissen, die selbst kein Nutzerprofil besitzen, aber Freunde von Mitgliedern sind? Das haben Forscher jetzt genauer untersucht. Sie stellten fest, dass man durch gezielte Analyse durchaus herausfinden kann, welche dieser Nicht-Mitglieder miteinander befreundet sind. Aus dem Wissen um den Freundeskreis wiederum lässt sich auf bestimmte Hobbies, politische Ansichten und selbst etwas so Privates wie die sexuelle Orientierung schließen.
Bereits seit einigen Jahren gehen Wissenschaftler der Frage nach, welche Schlussfolgerungen sich mit Hilfe des Computers aus direkt oder indirekt eingegebenen Daten ziehen lassen. In einem sozialen Netzwerk können beispielsweise auch dann Informationen wie die sexuelle Orientierung oder politische Ausrichtung mit hoher Präzision berechnet werden, wenn das Mitglied sie nicht selbst angegeben. Es reicht, wenn genug Freunde des betreffenden Nutzers die entsprechende Information über sich selbst freigegeben haben. „Sobald bestätigte Freundschaftsbeziehungen bekannt sind, ist die Vorhersage bestimmter unbekannter Eigenschaften keine allzu große Herausforderung mehr für die maschinelle Datenanalyse“, sagt Fred Hamprecht, Mitbegründer des Interdisziplinären Zentrums für Wissenschaftliches Rechnen (IWR) der Universität Heidelberg
Untersuchungen dieser Art beschränkten sich bislang jedoch auf Nutzer von sozialen Netzwerken, also auf Personen, die dort über ein Nutzerprofil verfügen – und damit den jeweiligen Datenschutzbedingungen zugestimmt haben. „Nicht-Mitglieder besitzen hingegen keine derartige Vereinbarung. Aus diesem Grund haben wir ihre Anfälligkeit für die automatische Generierung sogenannter Schattenprofile untersucht“, erläutert Katharina Zweig, die bis vor kurzem am IWR tätig war.
Netzwerke erfassen auch Kontaktdaten von Nicht-Mitgliedern
In einem sozialen Netzwerk im Internet ist es möglich, unter anderem mit Hilfe einer Funktion zum Auffinden von Bekannten an Informationen über Nicht-Mitglieder zu gelangen. So werden Neumitglieder von Facebook dazu aufgefordert, bei ihrer Registrierung dem Netzwerk ihre kompletten E-Mail-Kontakte zur Verfügung zu stellen – auch Kontakte zu Personen, die selbst nicht Mitglied bei Facebook sind. „Dieses sehr grundlegende Wissen darüber, wer mit wem in einem sozialen Netzwerk bekannt ist, lässt sich mit Informationen darüber verknüpfen, wen Nutzer außerhalb des Netzwerks kennen. Mit dieser Verknüpfung kann dann wiederum ein wesentlicher Teil des Bekanntschaftnetzes zwischen Nicht-Mitgliedern abgeleitet werden“, erläutert Ágnes Horvát, die am IWR forscht.
Für ihre Berechnungen nutzten die Heidelberger Wissenschaftler ein Standard-Verfahren des maschinellen Lernens, das auf der Analyse von Strukturmerkmalen von Netzwerken aufbaut. Da die Daten, die für diese Untersuchung benötigt wurden, nicht frei erhältlich sind, haben die Forscher mit einem Testsatz echter Grunddaten gearbeitet. Die Aufteilung in Mitglieder und Nicht-Mitglieder sollte dabei mit einer möglichst großen Bandbreite von Methoden simuliert werden. Mit handelsüblichen Computern konnte in nur wenigen Tagen berechnet werden, welche Nicht-Mitglieder mit großer Wahrscheinlichkeit miteinander befreundet sind.
40 Prozent richtig erraten
Für die Heidelberger Wissenschaftler war dabei überraschend, dass alle Simulationsansätze qualitativ dasselbe Ergebnis brachten. „Unter realistischen Annahmen darüber, wieviel Prozent einer Bevölkerung Mitglied eines sozialen Netzwerkes sind und mit welcher Wahrscheinlichkeit diese ihr E-Mail-Adressbuch hochladen, hat sich gezeigt, dass es mit den Berechnungen möglich war, rund 40 Prozent richtige Vorhersagen über Bekanntschaften zwischen den Nicht-Mitgliedern zu treffen.“ Kennt man aber die Freundschaften, dann kann man häufig auch Rückschlüsse auf Vorlieben, die Lebensweise und ähnliches ziehen.
„Unsere Untersuchung hat deutlich gemacht, welches Potenzial soziale Netzwerke besitzen, um Informationen über Nicht-Mitglieder abzuleiten. Die Resultate sind auch deshalb erstaunlich, weil sie auf reinen Kontaktdaten beruhen“, betont Hamprecht. Viele soziale Netzwerke und Dienstleister verfügen jedoch über weitaus mehr Informationen der Nutzer, etwa Alter, Einkommen, Ausbildung oder Wohnort. Mit der Verwendung solcher Angaben, einer entsprechenden technischen Infrastruktur und weiteren Strukturmerkmalen der Netzwerkanalyse ließe sich – so die Wissenschaftler – die Vorhersagegenauigkeit vermutlich noch deutlich steigern.
„Insgesamt zeigt unser Projekt damit auf, dass wir als Gesellschaft eine Vereinbarung dafür finden müssen, inwieweit Informationen genutzt werden dürfen, zu denen es keine Freigabe der betroffenen Personen gibt“, sagt Zweig.
(PLoS ONE, 2012; doi:10.1371/journal.pone.0034740)
(Ruprecht-Karls-Universität Heidelberg, 04.05.2012 – NPO)