Maschinenhirn als Diplomat: Künstliche Intelligenz schlägt uns Menschen nicht nur in Strategiespielen – auch wenn es um geschicktes Verhandeln geht, kann sie mithalten, wie das neuentwickelte KI-System „Cicero“ beweist. Dieses hat sich in im Spiel „Diplomacy“ erfolgreich – und unerkannt – gegen menschliche Mitspieler durchgesetzt. Das Besondere daran: In diesem Multiplayer-Spiel geht es neben Strategie auch um gegenseitige Absprachen und geschickte Kommunikation.
Wenn es um Muster, Strategien oder komplexe Daten geht, haben künstliche Intelligenzen inzwischen die Nase vorn: Die auf neuronalen Netzen basierenden, selbstständig lernenden Algorithmen besiegen menschliche Spieler in Strategiespielen wie Schach, Go und sogar beim Bluffen im Poker, sie knacken jahrzehntelang unlösbare Proteinstrukturen oder entwickeln neue mathematische Theoreme und Beweise. Auch bei der Spracherkennung und -ausgabe sind KI-Systeme längst Alltag.
Diplomacy: Kooperation und Täuschung
Jetzt beweist ein neues KI-System, dass es auch die hohe Kunst der Kommunikation beherrscht: das diplomatische Verhandeln. Als Test dafür diente das Spiel „Diplomacy“, in dem sieben Spieler darum wetteifern, sich Versorgungszentren in verschiedenen Ländern Europas nach dem Ersten Weltkrieg zu sichern. Die Besonderheit besteht darin, dass bei diesem Spiel sowohl strategische und militärische Entscheidungen als auch geschicktes Verhandeln und die Absprache mit potenziellen Bündnispartnern nötig ist.
„Diplomacy ist eine besondere Herausforderung, weil der Erfolg darauf beruht, in einer von Misstrauen geprägten Spielumgebung das Vertrauen anderer zu gewinnen“, erklären Anton Baktin vom KI-Forschungszentrum des Facebook-Konzerns Meta und seine Kollegen. „Um erfolgreich zu sein, muss die Künstliche Intelligenz berücksichtigen, dass die Mitspieler ihr Wort nicht halten oder auch seinen eigenen Aussagen keinen Glauben schenken.“ Das KI-System muss daher sowohl in Strategie wie auch in der Kommunikation überzeugen.
Strategie und Sprachverarbeitung kombiniert
Um diese Aufgabe zu bewältigen, haben die Forschenden das KI-System „Cicero“ entwickelt. Dieses beruht auf zwei Modulen selbstlernender Algorithmen. Das erste ist ein Strategie-Modul, das anhand von mehr als 125.000 Diplomacy-Online-Spielverläufen vielversprechende Spielzüge und Reaktionen auf die Aktionen der Mitspieler gelernt hat. Die zweite Komponente ist ein Sprachmodul, das mit mehr als 40.000 Dialogen aus Diplomacy-Spielen trainiert wurde. Als Zusatzinformation zu den Sätzen erhielt die KI dabei Informationen zum Kontext und den mutmaßlichen Absichten.
Zusätzlich musste die Künstliche Intelligenz lernen, die Perspektive ihrer Mitspieler und damit Gegner einzuschätzen. „Wenn Cicero beispielsweise gemeinsam mit einem Verbündeten einen Angriff koordiniert, muss seine Vorhersage der gegnerischen Reaktionen auch berücksichtigen, dass dieser nichts über die beabsichtigte Kooperation weiß“, erkläre die Forschenden. Umgekehrt muss auch die KI damit rechnen, dass gegnerische Spieler geheime Absprachen treffen.
Erfolg gegen menschliche Spieler
Ob das KI-System diesen Herausforderungen gewachsen war, testete das Team Im Sommer 2022 in einer Online-Version von Diplomacy. „Cicero“ nahm dabei unerkannt an 40 Spielen gegen 82 menschliche Konkurrenten teil und absolvierte auch ein Turnier mit 21 Teilnehmern. Das Ergebnis: Cicero landete nach 40 Spielen unter den obersten zehn Prozent der Rangliste und gewann das aus acht Spielen bestehende Turnier.
„Darüber hinaus wurde Cicero von den anderen Spielen nicht als KI erkannt“, berichten Baktin und seine Kollegen. Im Schnitt schickte das KI-System pro Spiel rund 130 Nachrichten an Mitspieler und nutzte dabei – offenbar überzeugend – auch umgangssprachliche Wendungen. Allerdings gab es auch Ausrutscher, bei denen die Botschaften nicht zur Strategie passten oder zum Kontext. Dies war bei rund zehn Prozent der Nachrichten der Fall.
„Wir vermuten aber, dass diese Fehler keinen Verdacht weckten, weil unter Zeitdruck gespielt wurde und auch menschlichen Spielern ähnliche Fehler passieren“, erklären die Forschenden. Bei Spielrunden ohne eine solche strenge Zeitbegrenzung könnte es für das KI-System allerdings schwieriger werden, nicht aufzufliegen.
„Durchbruch für die kooperative KI“
Nach Ansicht von Baktin und seinem Team demonstriert der Erfolg von Cicero, dass KI-Systeme nicht nur rein strategische Aufgaben bewältigen, sondern auch die damit oft verknüpften diplomatischen und kommunikativen Herausforderungen bewältigen können. Die Kombination von fortgeschrittener Strategie- und Sprachverarbeitung verleihe der künstlichen Intelligenz die Fähigkeit, Allianzen zu schmieden, Pläne zu koordinieren und die Absichten anderer einzuschätzen.
„Ein System, das bei einem so strategisch komplexen Spiel wie Diplomacy mit Menschen mithalten kann, ist ein echter Durchbruch für die kooperative KI“, konstatiert Yan LeCun, Chef-KI-Wissenschaftler bei Meta AI. Ähnlich sehen es auch Vertreter der Konkurrenz – vom Google-Forschungszentrum DeepMind: „Das sind spektakuläre Ergebnisse“ kommentierte DeepMind-Forscher Yoram Bachrach in „Science“.
Ob und in welcher Form solche KI-Systeme zukünftig eingesetzt werden, wird sich noch zeigen müssen. Ebenso, welche ethischen Konsequenzen sich daraus ergeben, wenn beispielsweise Unternehmen solche Algorithmen einsetzen. (Science, 2022; doi: 10.1126/science.ade9097)
Quelle: Science