Eine der verschiedenen Möglichkeiten, mit denen die Max-Planck-Forscher Muster charakterisieren, bietet die von ihnen entwickelte und inzwischen patentierte Skalierungsindex-Methode. Mit ihrer Hilfe können Wissenschaftler eine Punktverteilung entsprechend ihrer Dimensionalität in Cluster zerlegen. Die Dimension dieser Cluster wird durch den Skalierungsindex Alpha ausgedrückt: „So liefert beispielsweise eine Häufung von Punkten an einer bestimmten Stelle einen Wert nahe null“, erklärt Bunk. „Eine Linie, die aus Punkten besteht, liefert einen Wert nahe bei eins – und so weiter.“
Eine rein zufällige Verteilung der Punkte liefert als Alpha-Wert immer die Dimension des Raumes, in den sie eingebettet ist – sind die Punkte also wahllos auf einer ebenen zweidimensionalen Fläche verteilt, hat Alpha den Wert zwei. „Das Muster charakterisieren wir dann, indem wir die Häufigkeitsverteilung der Skalierungs-Indizes analysieren, die sich als eine Art Struktur-Spektrum interpretieren lässt“, erklärt Wolfram Bunk. So lassen sich zum Beispiel kosmologische Strukturen in verschiedene Strukturelemente auflösen.
Multimedia-Daten als Punktverteilungen
Digitalisierte Multimedia-Daten bestehen – mathematisch gesehen – auch aus Punkteverteilungen, die mithilfe der Mustererkennung analysiert werden können. So wird es möglich, mit den Methoden aus der Astrophysik störendes Rauschen aus Bildern oder Musik zu entfernen oder es zumindest zu reduzieren. Für jedes Pixel eines Bildes kann im statistischen Sinne beispielsweise festgestellt werden, ob es zu einer Struktur – dem eigentlichen Signal – gehört oder reines Rauschen darstellt.
„So lassen sich die Rausch-Pixel entfernen, und mithilfe einer Interpolation oder anderen Rekonstruktionsansätzen wird dann aus den verbleibenden Bildpunkten das Foto zumindest teilweise wiederhergestellt“, so Bunk, der auch gleich den Beweis antritt und das Foto einer hübschen Frau von störendem Datenmüll befreit. „Es gibt aber auch Anwendungen im Automobilbau, zum Beispiel bei der Charakterisierung der Rauigkeit von Zylinder-Oberflächen in Verbrennungsmotoren.“
Wie ähnlich sind sich die Klang-Spektren?
Und eben auch für die Analyse von Musik: Dafür setzen die Forscher auf ein Clustering-Verfahren und analysieren dabei nicht die Struktur-Spektren, sondern Klang-Spektren: Nachdem der Computer die kurzen Audio-Schnipsel in ihre einzelnen Frequenzspektren zerlegt hat, berechnet er ein spezifisches Abstandsmaß zwischen den Spektren – dieses gibt an, wie ähnlich oder unähnlich sie sich sind.
Dann werden sie in Klassen eingeteilt – die Cluster, deren Mitglieder sich gleichen. Jetzt kann aus jedem Cluster ein Repräsentant ausgewählt werden. So lässt sich ein ganzes Musikstück durch eine Sequenz von charakteristischen Klängen darstellen, wie sie auch im Erkennungsalgorithmus verwendet werden, und seine Klangstruktur erkennen.
Christian Buck/ MaxPlanckForschung
Stand: 20.11.2009