Tübinger Wissenschaftler haben gezeigt, dass wir einen Gesichtsausdruck live oder in einem Film viel besser erkennen können als auf einem Foto. Um die Stimmung der jeweiligen Personen zuverlässig deuten zu können, muss ein Film jedoch mindestens eine zehntel Sekunde lang sein.
Diese Forschungsergebnisse könnten dazu beitragen, dass uns computeranimierte Wesen in Zukunft noch realistischer und glaubwürdiger vorkommen, berichten die Forscher vom Max-Planck-Institut für biologische Kybernetik in Tübingen in der Fachzeitschrift „Journal of Vision“.
Auch in der digitalisierten Welt findet ein Großteil unserer Kommunikation im direkten Austausch mit unserem Gegenüber statt. Damit uns der andere versteht, setzen wir nicht nur unsere Stimme, sondern zusätzlich ein vielfältiges Repertoire an Gestik und Mimik ein. Die Mimik hat einen starken Einfluss auf die Qualität eines Gesprächs. Ihre Abwesenheit gefährdet das Verständnis und den Gesprächsfluss. Ein Gesichtsausdruck kann viel aussagen: Ein Nicken bedeutet Zustimmung, ein Stirnrunzeln sagt: „Bitte erklären Sie mir das noch mal“.
Stimmung erkennen dauert 100 Millisekunden
Die Tübinger Forscher haben in ihrer neuen Studie nun festgestellt, dass wir einen Gesichtsausdruck besser erkennen, wenn sich dieser natürlich bewegt, als wenn er auf einem Foto „eingefroren“ ist. Allerdings können wir erst nach 100 Millisekunden die Stimmung unseres Gegenübers gut erfassen. Ist die Aufnahme kürzer, ist unser Gehirn nicht in der Lage, den Ausdruck des anderen zuverlässig zu deuten. Die dynamischen Informationen, die in den unterschiedlichen Mimiken vorkommen, beruhen auf unterschiedlichen Bewegungsabläufen.
Manche Gesichtsausdrücke entstehen durch eine Kopfbewegung, wie zum Beispiel ein Nicken oder Kopfschütteln, andere durch komplexe Verformungen unseres Gesichts, beispielsweise einem Naserümpfen um Ekel zu signalisieren oder einem Runzeln der Stirn.
Mimik im Visier
Um zu untersuchen, in wie weit man die Stimmungen eines Gesprächspartners an Hand der Mimik erkennen kann, zeigten die Wissenschaftler Testpersonen Bilder von Menschen mit unterschiedlichen Gesichtsausdrücken – darunter einfache emotionale Ausdrücke wie glücklich und traurig, aber auch komplexere wie Zustimmung, Verwirrung oder Überraschung, die der Betonung von Worten in der Unterhaltung dienen.
Um zu vergleichen, ob bewegte oder statische Bilder besser erkannt werden, wurde den Testpersonen sowohl eine kurze Videosequenz der Mimik vorgespielt als auch ein Bild derselben gezeigt. Die Testpersonen mussten dann jeweils eine Emotion dem Bild oder der Videosequenz zuordnen. In weiteren Versuchsreihen wurde ihnen eine Bilderreihe einer Mimik gezeigt. Obwohl die Testpersonen diesmal nicht nur ein Bild, sondern den ganzen Verlauf als Fotocollage sehen konnten, erkannten die Probanden die Gestik auf der Filmsequenz besser.
25 Bilder pro Sekunde
Um heraus zu finden, inwiefern das Erkennen der Mimik von der Bewegung abhängig ist, zeigten die Forscher den Probanden dann wieder eine Videosequenz. Diese bestand aus 25 Bildern pro Sekunde, womit der Eindruck einer fließenden Bewegung vermittelt wurde. In dieser Versuchsreihe jedoch wurden die einzelnen Bilder durcheinander gewürfelt und erneut abgespielt. Auch diesmal erkannten die Testpersonen die Mimik in den Originalvideosequenzen besser.
Dies zeigt nach Ansicht der Wissenschaftler, dass weder mehrere Bilder noch die Bewegung allein von Bedeutung sind, sondern die Kombination der richtigen Reihenfolge und der dynamische Ablauf der Gesichtsbewegungen. Auch die zeitliche Richtung muss stimmen. Spielt man die Filmsequenzen rückwärts ab, erkannten die Probanden die Stimmungen deutlich schlechter.
Gesichtsausdrücke als dynamisches Phänomen
„Gesichtsausdrücke sind ein dynamisches Phänomen und müssen, genauso wie Körperbewegungen oder Gesten, mit Hilfe von Videos untersucht werden, um ein genaues Bild von der Verarbeitung dieser wichtigen kommunikativen Signale erstellen zu können“, sagte Christian Wallraven, Leiter der Studie.
„Unsere Ergebnisse haben auch für die Computeranimation eine große Bedeutung, da es deren Ziel ist, künstliche Avatare und Gesichtsanimationen zu schaffen, die vollkommen realistisch und glaubwürdig kommunizieren können“, so der Physiker und Wahrnehmungswissenschaftler.
(idw – Max-Planck-Institut für biologische Kybernetik, 04.01.2010 – DLO)