Ein lange ungeklärtes statistisches Problem haben jetzt Bochumer Forscher gelöst: Sie entwickelten ein neues Schätzverfahren für komplexe Systeme, das widerspruchsfreie Ergebnisse liefert. Es eignet sich zum Beispiel, um Ausfallwahrscheinlichkeiten von Maschinen zu berechnen und zuverlässig zu schätzen.
{1r}
Je komplexer solche Anwendungen sind, desto weniger gilt die so genannte Normalverteilungsannahme, wie sie etwa bei der Modellierung von Körpergröße und Gewicht verwendet wird. Über ihr neues Verfahren berichten die Wissenschaftler in der aktuellen Ausgabe des „Journal of the Royal Statistical Society“.
Die Normalverteilung
Wer kennt sie nicht: die Kurven aus dem Kinderuntersuchungsheft, die die Körpergröße als Funktion des Alters beziehungsweise des Körpergewichts zeigen. In der Medizin heißen diese Kurven Somatogramm 1 und 2. In der Statistik spricht man von Quantils- oder Percentilskurven. In jeder Abbildung befinden sich drei Kurven.
Die Mittlere, auch Mediankurve genannt, gibt bei einem festen Alter dasjenige Körpergewicht bzw. diejenige Körpergröße an, bei der 50 Prozent der Kinder dieses Alters weniger wiegen (bzw. kleiner sind) als der entsprechende Medianwert. Die untere und obere Kurve geben entsprechende Werte für drei bzw. 97 Prozent der Kinder an.
Widersprüchliche Aussagen möglich
Diese Kurven basieren auf der Normalverteilungsannahme, ihnen liegt die Gaußsche Glockenkurve zugrunde. Während diese Annahme zum Beispiel für die Population von Kindern eines bestimmten Alters gerechtfertigt ist, gibt es viel komplexere Anwendungen, etwa bei technischen Anlagen und Bedienungssystemen, bei denen solche Annahmen nicht greifen. In diesem Fall müssen die entsprechenden Kurven „verteilungsfrei“ geschätzt werden.
Die bisher in der Literatur vorgeschlagen Methoden ohne die Annahme der Normalverteilung liefern aber Kurven die sich schneiden. Das kann dann zu sich widersprechenden Aussagen führen, zum Beispiel: 20 Prozent der Mädchen im Alter von sechs Jahren wiegen weniger als 22 Kilo, aber 30 Prozent der Mädchen in demselben Alter wiegen weniger als 20 Kilo.
Kurven, die sich nicht schneiden
Professor Holger Dette und sein Kollege Stanislav Volgushev haben ein neues Schätzverfahren entwickelt, das zwei Fliegen mit einer Klappe schlägt: Mit seiner Hilfe können sie solche Kurven ohne Annahmen an die Verteilung – zum Beispiel der zugrunde liegenden Population – schätzen und erhalten zugleich Wachstumskurven, die sich nicht schneiden können.
Das Verfahren besteht aus zwei Schritten. Zunächst werden Wahrscheinlichkeiten p(t) geschätzt, dass bei einem bestimmten Wert X – hier: das Alter – die von X abhängige Größe Y (zum Beispiel das Gewicht eines Mädchens im Alter von X Jahren) einen bestimmten Wert t nicht übersteigt. Theoretisch ist die so erhaltene Funktion monoton ansteigend.
Problem Umkehrfunktion
„Im zweiten Schritt müssen wir eigentlich nur noch die Umkehrfunktion berechnen“, so Dette. „Allerdings ist schon lange bekannt, dass die – mathematisch – besten Schätzungen solcher Funktionen im Allgemeinen nicht monoton sind, und wir daher nicht ohne weiteres die Umkehrfunktion bestimmen können.“
Aufbauend auf klassischen Ergebnissen der Mathematiker Hardy und Littlewood aus den 1930er-Jahren haben die Bochumer Wissenschaftler ihr Verfahren so entwickelt, dass es gleichzeitig eine Monotonisierung der Schätzung und eine Berechnung der zugehörigen Umkehrfunktion ermöglicht. Es liefert auch Informationen über den Stichprobenumfang, der jeweils für die gewünschte Genauigkeit bei der Schätzung notwendig ist.
(idw – Ruhr-Universität Bochum, 23.04.2008 – DLO)