Informatik

Künstliche Intelligenz als Forscher

KI-System findet passende Gleichungen zu Rohdaten – ohne die Formeln vorher zu kennen

KI als Forscher
Die künstliche Intelligenz "AI Descartes" kann auf Basis von Rohdaten neue wissenschaftlich sinnvolle Formeln und Gleichungen finden. © Getty images / i000pixels; Jackie Niam

Ob Keplers Gesetz der Planetenbewegung, Einsteins Zeitdehnung oder das Verhalten von Gasmolekülen: Eine neu entwickelte künstliche Intelligenz hat diese wissenschaftlichen Gesetzmäßigkeiten selbstständig „wiederentdeckt“ und korrekt formuliert. Als Basis dienen dem KI-System „AI Descartes“ dabei unbereinigte Rohdaten und physikalisches Hintergrundwissen. Das System entwickelt daraus die korrekten Formeln für die Gesetze, gibt aber auch an, wo Abweichungen bestehen und mehr Daten nötig sind.

Ob ChatGPT, BARD, Alphafold oder andere künstliche Intelligenzen: Der Entwicklungssprung bei neuen KI-Systemen ist unübersehbar. Die lernfähigen Algorithmen und neuronalen Netzwerke können nicht nur Texte verfassen, Bilder erstellen oder Spiele meistern, längst machen sie sich auch in Forschung und Wissenschaft nützlich. Sie entschlüsseln Proteinstrukturen, diagnostizieren Krankheiten, finden mathematische Beweise oder entwickeln chemische Synthesewege.

GRundprinzip
Das KI-System kombiniert zwei Ansätze miteinander. © gemeinfrei

Grundprinzip der Wissenschaft

Jetzt kommt ein KI-System hinzu, das auch das Grundprinzip hinter wissenschaftlichen Entdeckungen beherrscht: „Wissenschaftler suchen nach Gleichungen und Gesetzmäßigkeiten, die ihre experimentellen Daten akkurat beschreiben „, erklären Cristina Cornelio von IBM Research in New York und ihre Kollegen. Dabei besteht die Herausforderung zum einen darin, in einer Fülle von Daten diejenigen zu erkennen, die die Information über die Gesetzmäßigkeit enthalten, und sie von bloßem „Störrauschen“ zu unterscheiden.

Zum anderen erfordert es Wissen, Intuition und wissenschaftliche Kreativität, um auf Basis der Daten und des bestehenden Hintergrundwissens auch völlig neue Zusammenhänge zu erkennen und mittels Gleichungen zu beschreiben. Erst dieser Prozess führt zu bahnbrechenden Fortschritten in der Wissenschaft.

Zwei Ansätze kombiniert: symbolische Regression…

Doch kann das auch eine künstliche Intelligenz leisten? Genau dies wollten Cornelio und ihre Kollegen herausfinden. Dafür haben sie ein KI-System entwickelt, das zwei bereits gängige Ansätze kombiniert. Der erste ist die sogenannte symbolische Regression, bei der die KI aus einer Auswahl ihr vorgegebener Rechenoperationen die am besten zu den Daten passenden auswählt und daraus eine Formel zusammenstellt. Im einfachsten Fall kann dies beispielsweise eine Liste bestehend aus + , -, × und ÷ sein.

Das KI-System erzeugt dann aus den vorgegebenen Formelbausteinen Millionen Gleichungen und überprüft, welche am besten zu den Daten passt. „Solche symbolischen Regressionsmodelle sind typischerweise besser interpretierbar als neuronale Netzwerke und erfordern weniger Daten“, erklären die Forschenden. „Allerdings haben sie Probleme damit, unter den zu den Daten passenden Formeln diejenigen zu identifizieren, die auch in wissenschaftlicher Hinsicht Sinn ergeben.“

Aufbau von AI Descartes
Aufbau und Funktionsweise des KI-Systems „AI Descartes“.© Cornelio et al./ Nature Communications, CC-by 4.0

…und logische Herleitung

An diesem Punkt kommt die zweite Komponente des KI-Systems ins Spiel: das sogenannte „Reasoning System“. Dieses wurde zuvor mit einer Reihe von grundlegenden wissenschaftlichen Theorien und Gesetzmäßigkeiten gefüttert und kann nun logisch herleiten, welche der von passenden Gleichungen auch wissenschaftlichen Sinn ergibt. „Dies erlaubt es dem KI-System, sinnvolle Modelle für eine breite Palette von Anwendungen zu erstellen“, sagt Cornelio.

Die Kombination aus Formelzuordnung und logischer Überprüfung unterscheidet das „AI Descartes“ getaufte System auch von generativen künstlichen Intelligenzen wie ChatGPT. Diese Großen Sprachmodelle orientieren sich primär an gängigen, in den Trainingsdaten häufigen Sprachmustern und gehen nicht logisch vor. Daher scheitern sie an vielen mathematisch-wissenschaftlichen Fragestellungen und produzieren plausibel klingenden Unsinn.

Keplers Planetenbahnen als erster Test

Doch wie gut ist AI Descartes? Um das zu testen, stellten ihm die Forschenden drei Aufgaben. Auf Basis unbereinigter Daten und einer Reihe von allgemeinen physikalischen Grundprinzipien sollte das KI-System drei bahnbrechende Erkenntnisse der Physik „wiederentdecken“ und in Form von Gleichungen beschreiben, ohne sie zuvor zu kennen.

Als erstes Problem sollte das KI-System das dritte Keplersche Gesetz erkennen, das die Bahnen und Umlaufzeiten von Planeten beschreibt. „Diese Gesetz aus experimentellen Daten zu extrahieren ist anspruchsvoll, vor allem wenn die Planeten Massen sehr unterschiedlicher Größenordnungen haben“, erklären die Wissenschaftler. Doch mithilfe seines Reasoning-Moduls schaffte es AI Descartes, die physikalisch korrekte Formel zu finden – es hatte Keplers drittes Gesetz der Planetenbewegungen „wiederentdeckt“.

Einsteins Zeitdehnung und Langmuirs Adsorption

Die zweite Aufgabe war die von Albert Einsteins spezieller Relativitätstheorie beschriebene Zeitdehnung. Nach dieser verlangsamt sich die Zeit für sich schnell bewegende Objekte. Hier gelang es dem KI-System zwar nicht, die Einsteinsche Gleichung aufzustellen, es konnte aber die Formel identifizieren, die dem beschriebenen Phänomen am nächsten kommt, wie das Team berichtet. Dafür erkannte das System korrekt, dass hier nicht newtonsche, sondern relativistische Physik zum Tragen kommt.

Als dritte Aufgabe sollte das KI-System die vom Chemiker Irving Langmuir entwickelte Formel zur Adsorption von Gasmolekülen an Oberflächen finden. Dafür erhielt AI Descartes experimentelle Daten zur Adsorption von Methan an Glimmer und Isobutan an Silikalit sowie die Erkenntnis, dass Feststoffe Gasen „Andockstellen“ bieten. Das KI-System konnte auf dieser Basis eine Formel entwickeln, die beschreibt, wie viele Gasmoleküle das Material unter den Versuchsumständen binden kann.

Erst der Anfang

Nach Ansicht von Cornelio und ihren Kollegen eröffnen KI-Systeme wie AI Descartes damit neue Möglichkeiten, die wissenschaftliche Datenanalyse zu unterstützen. „Einer der spannendsten Aspekte unserer Arbeit ist das Potenzial, die Wissenschaft damit signifikant voranzubringen“, sagt Cornelio. Das Team plant als nächsten Schritt, dem KI-System die Fähigkeit zum selbständigen Lernen des Hintergrundwissens zu verleihen – indem es eigenständig wissenschaftliche Fachartikel liest und daraus die relevanten Theorien extrahiert.

„Bisher brauchten wir Menschen, die die Axiome in formelle, computerlesbare Sprache übersetzen“, erklärt Koautor Tyler Josephson von der University of Maryland. „In Zukunft möchten wir diesen Teil des Systems automatisieren, um mehr Bereiche der Wissenschaft und Technik abdecken zu können.“ (Nature Communications, 2023; doi: 10.1038/s41467-023-37236-y)

Quelle: University of Maryland

Keine Meldungen mehr verpassen – mit unserem wöchentlichen Newsletter.
Teilen:

In den Schlagzeilen

News des Tages

Skelett eines ungeborenee Kindes

So entstehen die Knochen des ungeborenen Kindes

Astronomen entdecken jüngsten Transit-Planet

Mehr Blackouts durch Wind- und Sonnenstrom?

Parkinson: Wenn mehr Dopamin mehr Zittern bedeutet

Diaschauen zum Thema

Dossiers zum Thema

Alan Turing - Genialer Computerpionier und tragischer Held

Bücher zum Thema

Maschinen mit Bewusstsein - Wohin führt die künstliche Intelligenz? von Bernd Vowinkel

Smarte Maschinen - Wie Künstliche Intelligenz unser Leben verändert von Ulrich Eberl

Top-Clicks der Woche