In seinem „Kleine-Welt-Experiment“ kam der US-Psychologe Stanley Milgram 1967 zu dem Schluss, dass jeder Mensch auf der Welt jeden beliebigen anderen Menschen über durchschnittlich sechs Ecken kennt. Damals wurde sein Experiment wegen der geringen Teilnehmerzahl von unter 300 Personen kritisiert.
„Messenger“ bestätigt Milgram
Im Jahr 2008 aber bestätigte die Analyse von Daten des Nachrichtendienstes Microsoft Messenger Milgrams These. Nun überzeugte es mit einer Datenbasis von 30 Milliarden Unterhaltungen zwischen 240 Millionen Nutzern des Nachrichtendienstes, aus denen eine repräsentative Stichprobe gezogen wurde. Beispiele wie dieses verdeutlichen die Anwendbarkeit von Data-Mining, findet der Informatiker York Sure-Vetter. „Sie dürfen aber nicht über die Tatsache hinwegtäuschen, dass Big Data für die empirische Sozialforschung und viele andre Disziplinen ein bisher weitgehend ungenutztes Potenzial darstellt.“
Neben dem Schutz personenbezogener Daten bilden Lizenzbedingungen privatwirtschaftlicher Unternehmen, die den Zugang zu Daten kontrollieren, eine weitere Barriere. Diese gefährde einen Grundsatz wissenschaftlicher Praxis, warnt der Informatiker: die Replizierbarkeit von aus Big Data gewonnen Forschungsergebnissen, also die Möglichkeit, diese bei exakt gleichem Versuchsaufbau zu überprüfen.
Forschung nur mit Datenschutz
Um diese Barriere zu überwinden, brauche es ein wirksames Zusammenspiel von Politik, Wirtschaft und Wissenschaft. „Gerade die Sozialwissenschaften arbeiten oft eng mit Datenschützern zusammen, um große Studien durchzuführen.“ Die Anonymisierung von Daten helfe, Rückschlüsse auf Individuen auszuschließen, Ethik-Kommissionen könnten Studien von Beginn an überwachen und so eine verantwortungsvolle Planung von Forschungsvorhaben sicherstellen.
Der Zugang zu Big Data könnte zudem institutionalisiert werden: Schon heute ermöglichen sogenannte Forschungsdatenzentren, akkreditierte und überwacht durch den Rat für Sozial- und Wirtschaftsdaten, der Wissenschaft Zugriff auf amtliche und nicht-amtliche Statistik. „Dieses Modell ist richtungsweisend und könnte auf das Arbeiten mit Big Data übertragen werden“, sagt Sure-Vetter. Geschehe dennoch nichts – diese Befürchtung teilen er und Iris Pigeot vom BIPS – könnten Datenschutz und Lizenzen den Weg zu dem Gemeinwohl nützlichen Daten auch weiter versperren.
{3l}
Größte Gesundheitsstudie Deutschlands
Das Problem fehlenden Datenzugangs wird die „Nationale Kohorte“ nicht haben. Im Rahmen dieser größten Gesundheitsstudie in der Geschichte Deutschlands werden ab dem kommenden Jahr 200.000 Männer und Frauen zwischen 20 und 69 Jahren untersucht. In die Studienteilnahme haben sie eingewilligt. „Für Deutschland fehlte eine solche Langzeitstudie bisher“, sagt Wolfgang Ahrens, wissenschaftliches Vorstandsmitglied der Kohorte und stellvertretender Direktor des BIPS.
Über bis zu 30 Jahre wird die Kohorte die Probanden begleiten, um mehr über den Einfluss von Genen, Umweltbedingungen und Lebensstil auf die Entstehung von Volksleiden wie Krebs, Diabetes und Demenz zu erfahren. Dabei werden unter anderem über 200 Millionen Blut- und andere Bioproben entstehen.
Karl-Heinz Karisch, David Schelp / Leibniz Journal
Stand: 11.07.2014