Bildung

Der Wissenschaft droht ein Daten-Alzheimer

Forscher stellen alarmierenden Verlust an Rohdaten schon nach wenigen Jahren fest

In den Laboren und Forschungseinrichtungen werden Milliarden von Daten erzeugt. Doch diese Rohdaten drohen schnell verloren zu gehen. © SXC

Der Forschung droht ein schleichender Verlust ihrer Daten: Durch schlampige Speicherung und veraltete Kontakt-Informationen bleiben schon nach wenigen Jahren die Rohdaten vieler Studien unauffindbar. Nach 20 Jahren sind 80 Prozent der Rohdaten verloren, wie kanadische Forscher jetzt herausfanden. Das aber ist fatal: Ohne Rohdaten lassen sich Ergebnisse nicht nachvollziehen, Methoden und Schlussfolgerungen nicht überprüfen und auch eine Weiterführung der Forschung ist oft kaum möglich.

Jedes Jahr werden hunderte von Studien und Experimenten durchgeführt, Forscher sammeln dabei Unmengen von Rohdaten an. „Die meisten dieser Daten sind einzigartig und unersetzlich, andere nur mit großem Aufwand zu rekonstruieren“, erklärt Timothy Vines von der University of British Columbia in Vancouver. Doch bisher gibt es keine Regelung dazu, diese Daten besonders zu schützen oder zentral aufzubewahren. Stattdessen bleibt es jedem Wissenschaftler selbst überlassen, wo und wie er seine Forschungsdaten speichert.

Wie gefährdet sind die Rohdaten?

Das aber birgt ein Risiko, dann unter Umständen ist ein Autor nicht mehr erreichbar oder aber vergisst nach einer Weile, alte Daten weiterhin zu speichern. Das könnte bedeuten, dass wertvolle Rohdaten verloren gehen und so Studienergebnisse nach einiger Zeit nicht mehr reproduzierbar sind. Wie groß die Gefahr für solche Datenverluste ist, haben Vine und seine Kollegen nun überprüft.

Für ihre Studie suchten sie nach Studien, die zwischen 1991 und 2011 morphologische Untersuchungen an Tieren und Pflanzen mit Hilfe einer bestimmten Form der Analyse durchgeführt hatten. In dem 20-Jahres-Zeitraum waren dies 516 Veröffentlichungen. Nun versuchten die Wissenschaftler, an die Rohdaten dieser Studien heranzukommen. Sie suchten die E-Mail-Adressen der Autoren heraus und kontaktierten diese.

Publikationen allein reichen nicht, um eine Studie zu überprüfen, zu erweitern oder sie nachzuvollziehen. Dafür benötigt man die Rohdaten. © SXC

Ungültige Kontaktdaten und schlampige Speicherung

Dabei zeigte sich bereits die erste Hürde: Je älter die Veröffentlichungen waren, desto wahrscheinlicher war es, dass die im Paper angegebene E-Mail-Adressen nicht mehr gültig waren und dass sich auch durch Suche im Internet keine Ersatz-Kontaktmöglichkeit fand. Um rund sieben Prozent sank die Wahrscheinlichkeit pro Jahr, wie die Forscher berichten.

Und noch ein Problem zeigte sich: Von den Forschern, die erfolgreich kontaktiert werden konnten, hatten viele selbst die Rohdaten nicht mehr – weil das Speichermedium veraltet war, der Rechner nicht mehr existierte oder sie nicht ausreichend gesichert wurden. Während bei zwei Jahre alten Studien noch alle Datensätze erhalten waren, sank die Chance mit jedem Jahr Abstand um rund 17 Prozent. Bei den ältesten Studien warten 80 Prozent der Daten unauffindbar. „Keiner erwartet, dass es leicht ist, Rohdaten für eine 50 Jahre alte Studie zu finden. Aber es war schon überraschend festzustellen, dass schon nach 20 Jahren fast alle Rohdaten verloren gegangen waren“, so Vine.

Zentrale Datenbanken als Lösung

Dieses Ergebnis bestätige, dass Forschungsdaten nicht verlässlich über lange Zeit gesichert werden können, wenn sie beim einzelnen Forscher bleiben. „Das aktuelle System bedeutet, dass die meisten Daten im Laufe der Zeit verloren gehen – und damit keine Möglichkeit mehr besteht, die ursprünglichen Ergebnisse nachzuvollziehen oder aber diese Daten für neue Studien auszuwerten“, konstatiert Vine.

Er und seine Kollegen appellieren daher an die wissenschaftlichen Fachjournale, ihre Praxis zu ändern und Rohdaten der Forscher, die bei ihnen veröffentlichen in einer zentralen, öffentlich zugänglichen Datenbank zu lagern. Einige Fachmagazine wie das renommierte British Medical Journal (BMJ) praktizieren dies bereits. Das hat auch einen weiteren Vorteil: Fälschungen oder Schöngefärbte Ergebnisse lassen sich so ebenfalls leichter entlarven, da dann andere Forscher die Daten überprüfen können. „Der Verlust wissenschaftlicher Daten ist eine Verschwendung von Forschungsgeldern und begrenzt zudem eine effektive Forschung“, sagt Vine. Konzertiertes Handeln sei daher dringend nötig, um dies zu ändern und die Daten auch für die Zukunft zu sichern. (Current Biology, 2013; doi: 10.1016/j.cub.2013.11.014)

(University of British Columbia, 03.01.2014 – NPO)

Keine Meldungen mehr verpassen – mit unserem wöchentlichen Newsletter.
Teilen:

In den Schlagzeilen

News des Tages

Skelett eines ungeborenee Kindes

So entstehen die Knochen des ungeborenen Kindes

Astronomen entdecken jüngsten Transit-Planet

Mehr Blackouts durch Wind- und Sonnenstrom?

Parkinson: Wenn mehr Dopamin mehr Zittern bedeutet

Diaschauen zum Thema

Dossiers zum Thema

Bücher zum Thema

Mekkas der Moderne - Pilgerstätten der Wissensgesellschaft von Hilmar Schmundt, Milos Vec und Hildegard Westphal

4000 Jahre Wissenschaft - von Patricia Fara (Autor) und Andrea Kamphuis (Übersetzerin)

Kampfhähne der Wissenschaft - Kontroversen und Feindschaften von Heinrich Zankl

Irrwitziges aus der Wissenschaft - Von Dunkelbirnen und Leuchtkaninchen von Heinrich Zankl

Top-Clicks der Woche