Im zweiten Anlauf geschafft: Die künstliche Intelligenz ChatGPT hat jetzt auch die US-Examen für Wirtschaftsprüfer und Steuerberater bestanden. Nachdem die frühere Version GPT 3.5 noch scheiterte, löste GPT 4.0 nun 85,1 Prozent aller Testaufgaben korrekt – und bestand damit alle vier Zertifikatsprüfungen im Rechnungswesen. Dies demonstriert, dass KI-Systeme auf Basis großer Sprachmodelle inzwischen fortgeschritten genug sind, um uns Menschen auch in diesem Bereich Konkurrenz zu machen.
Ob ChatGPT, BARD oder Bildgeneratoren: Die künstliche Intelligenz macht zurzeit so rasende Fortschritte, dass selbst KI-Experten vor einer unkontrollierten weiteren Entwicklung warnen. Die auf großen Sprachmodellen und neuronalen Netzwerken beruhenden KI-Systeme können scheinbar mühelos verschiedenste Texte, Programmcodes und Bilder generieren. Selbst fachspezifische Texte oder Prüfungen wie das US-Juraexamen oder Medizinertests haben die generativen KI-Systeme bereits erfolgreich absolviert.

An einem Punkt scheiterte CHatGPT jedoch bisher: Ausgerechnet im Rechnungswesen schnitt die künstliche Intelligenz in ihrer Version GPT 3.5 eher mau ab. In US-Prüfungen zum Certified Public Accountant (CPA) und Enrolled Agent – vergleichbar einem Wirtschaftsprüfer und Steuerberater – erreichte das KI-System nur rund 53 Prozent der Punkte und fiel damit prompt durch. Generell zeigte GPT 3.5 im mathematisch-ökonomischen Bereich noch erhebliche Schwächen.
GPT 4.0 zur Prüfung bitte!
Doch das hat sich nun geändert, wie ein Team um Marc Eulerich von der Universität Duisburg-Essen festgestellt hat. Sie haben die im März 2023 vom US- Unternehmen OpenAI lancierte KI-Version GPT 4.0 zur Prüfung antreten lassen. Die Tests umfassten jeweils 150 bis 300 Fragen aus vier offiziellen US-Examen für Wirtschaftsprüfer und Steuerberater. „Diese Examen decken die Hauptbereiche des Rechnungswesens ab, von finanziellen Aspekten über internes und externes Auditing und Wirtschaftsprüfung bis zur Steuerbuchhaltung“, erklärt das Team.