Bedingt humorfähig: KI-Systeme wie ChatGPT können zwar Witze erzählen, aber wie gut verstehen sie unseren menschlichen Humor? Das haben Forschende am Beispiel von Cartoons mit dazugehörenden „Onelinern“ getestet. Das Ergebnis: Die KI-Systeme konnten zwar Text und Bild teilweise korrekt zuordnen und auch erklären, worin die Komik liegt. Insgesamt schnitt aber selbst GPT-4 schlechter ab als menschliche Testpersonen. Im Erkennen von implizitem Humor hinken die künstlichen Intelligenzen uns demnach noch hinterher.
Ob Situationskomik, Wortwitz oder satirische Cartoons: Humor zu verstehen, ist oft gar nicht so simpel. In vielen Fällen müssen wir dafür um die Ecke denken, sprachliche Eigenheiten wie die doppelte Bedeutung eines Worts kennen oder den gesellschaftlichen Kontext verstehen. Das wirft die Frage auf, wie gut künstliche Intelligenzen dafür gerüstet sind. KI-Systeme wie ChatGPT können zwar überzeugende Texte, Bilder und auch Witze produzieren. Nach gängiger Annahme fehlt der generativen KI aber ein echtes Verständnis der Inhalte.
Cartoons als Testfall
Wie weit das Humor-Verständnis künstlicher Intelligenzen reicht, haben Jack Hessel vom The Allen Institute for AI und seine Kollegen nun untersucht. Für ihren Test ließen sie verschiedene KI-Systeme den sogenannten „Cartoon Caption Contest“ des US-Magazin „The New Yorker“ absolvieren. Ausgangspunkt dafür sind Cartoons, die ihren Witz aus dem Zusammenhang des Dargestellten mit einem begleitenden Zitat oder Satz beziehen.
Ein Beispiel für einen der Cartoons: Im Bild ist ein typischer Konferenzraum zu sehen, die am Tisch Sitzenden haben verschiedene Tierköpfe. Der Begleittext ist der Ausspruch eines der Sitzungsteilnehmer: „Gegenüber der Öffentlichkeit sagen wir immer noch, es gebe keine Nebenwirkungen.“ Die Pointe ist für uns Menschen relativ schnell ersichtlich: Offenbar handelt es sich um ein Meeting bei einer Pharmafirma und der Cartoon karikiert auf übersteigerte Weise die gängigen Annahmen zu Profitgier und Vertuschungen dieser Branche.