person pointing his black pen on the paper
Photo by Kindel Media on Pexels.com

Generative KI für die Jahresabschlussprüfung: Ein Blick auf Copilot und Agenten-Workflows

Die Künstliche Intelligenz (KI) verändert die Unternehmenslandschaft in rasantem Tempo. Insbesondere generative KI etabliert sich zunehmend als Schlüsseltechnologie und treibende Kraft für Wettbewerbsvorteile in verschiedenen Arbeitsbereichen. Auch in der Wirtschaftsprüfung hat generative KI das Potenzial, die Qualität von Finanzabschlussprüfungen erheblich zu verbessern. Doch wie genau kann diese vielseitige General-Purpose-Technologie, die Texte, Bilder, Videos und Quellcodes verarbeiten und generieren kann, in der Praxis eingesetzt werden? Dieser Beitrag beleuchtet zwei zentrale Ansätze: den KI-basierten Copiloten und agentenbasierte Workflows.

Grundlagen der Generativen KI

Moderne KI-Systeme, insbesondere generative KI, basieren überwiegend auf Deep-Learning-Methoden. Ein Fundament für generative KI bilden dabei sogenannte Foundation Models. Diese Modelle sind in der Lage, eine Vielzahl komplexer Aufgaben über verschiedene Disziplinen hinweg mit oft minimalem Trainingsaufwand zu bewältigen. Ein bekanntes Beispiel hierfür sind große Sprachmodelle (Large Language Models, LLMs) wie GPT-4.

Die Funktionalität dieser Foundation Models wird in zwei zentralen Phasen erreicht:

  • Pre-Training: Hier wird die Modellarchitektur festgelegt und das Modell mit großen Datenmengen aus verschiedenen Disziplinen trainiert. Das ehemalige GPT-3-Modell verfügte beispielsweise über 175 Milliarden Parameter und wurde mit 45.000 GB aufbereiteter Textdaten trainiert.
  • Fine-Tuning: In dieser Phase wird das Wissen eines großen Sprachmodells gezielt auf eine spezifische Aufgabe abgestimmt, indem die Parameter und Gewichtungen der Modellarchitektur angepasst werden. Dies ermöglicht den effizienten Transfer des im Pre-Training erworbenen Wissens auf nachgelagerte Aufgaben, wie die Analyse von Finanzdaten oder die Bewertung von Nachhaltigkeitsberichten.

Copilot vs. Agent: Zwei Ansätze für die Prüfungspraxis

Für die Anpassung und den Einsatz generativer KI im unternehmerischen Kontext haben sich zwei zentrale Ansätze etabliert, die unterschiedliche Komplexitätsanforderungen bedienen:

  1. Der KI-basierte Copilot:
    • Konzept: Dieses Konzept wurde initial von Gu et al. eingeführt und dient primär der Unterstützung des Abschlussprüfers durch aktive Mensch-KI-Interaktion. Die Kommunikation mit dem LLM erfolgt über dialogbasierte Benutzerschnittstellen, sogenannte Chatbots, mittels Prompts.
    • Anwendung: Der Abschlussprüfer adaptiert die Output-Qualität des vortrainierten Modells durch seine domänenspezifische Fachexpertise in den Prompts. Techniken wie Prompt Engineering, darunter „Tree-of-Thought Prompting“ oder „Chain-of-Thought Prompting“, helfen, komplexe Aufgaben in kleinere Schritte zu zerlegen und zielführende Ergebnisse zu erzielen.
    • Charakteristik: Der Copilot verfolgt einen progressiven Human-in-the-Loop-Ansatz. Er erweitert die Automatisierung auf komplexere Aufgaben, die jedoch stets unter kontextbezogener menschlicher Aufsicht stehen.
  2. Der agentenbasierte Workflow:
    • Konzept: Dieser Ansatz ist technisch komplexer in der Umsetzung. Ein Agent ist eine Entität, die Informationen aus ihrer Umgebung erfasst und darauf reagiert, wobei ihr Verhalten durch eine mathematische Funktion, heute oft durch tiefe neuronale Netzwerke, bestimmt wird.
    • Vorteile: Die Integration großer Sprachmodelle in Agenten bietet signifikante Vorteile gegenüber der isolierten Nutzung einzelner generativer KI-Modelle. Agenten können autonom agieren, komplexe Aufgaben planen und ausführen sowie kontinuierlich lernen und sich anpassen. Im Gegensatz zu statischen LLMs können sich diese Agenten in Echtzeit anpassen und ihre Strategien verfeinern.
    • Charakteristik: Agentenbasierte Workflows ermöglichen eine vollständig autonome Koordination und adressieren eine iterative und autonome Automatisierung vielfältiger und komplexer Aktivitäten durch fortschrittliche Werkzeuge und dynamische Verfeinerungstechniken.

Anwendungsfälle im prüferischen Kontext

Beide Ansätze wurden bereits in der wissenschaftlichen Fachliteratur eindrucksvoll demonstriert und sind von hoher praktischer Relevanz für den Berufsstand der Wirtschaftsprüfer.

Anwendungen des KI-Copiloten in der Jahresabschlussprüfung und IT-Prüfung:

  • Analytische Prüfungshandlungen: Ein Copilot kann Bilanz und Gewinn- und Verlustrechnung analysieren, erste Finanzkennzahlen errechnen und deren Veränderungen zwischen Geschäftsjahren interpretieren. Dies ermöglicht dem Prüfer, sich auf wesentliche Änderungen mit erhöhtem Risiko zu konzentrieren und automatische Interpretationen zu erhalten.
  • Einzelfallbezogene Prüfungshandlungen: Mittels umfangreichen Prompt Engineerings kann ein Copilot die Ordnungsmäßigkeit von Rückstellungen nach HGB beurteilen, Sachverhalte zu Prozesskostenrückstellungen, drohenden Verlusten und ungewissen Verbindlichkeiten bewerten und entsprechende Outputs oder Empfehlungen für eine manuelle Durchsicht ausgeben.
  • Spezialisierte Expertenbots: Diese Bots können durch die Methode der Retrieval-Augmented Generation (RAG) auf geprüfte Datenbanken (z.B. Gesetzestexte) zugreifen und relevante Daten extrahieren, um kohärente und informative Antworten zu formulieren. Sie liefern zuverlässige Ergebnisse und können Quellen angeben.
  • IT-Prüfungen: Ein zielgerichteter KI-Copilot kann basierend auf übertragenen Feststellungen erste Indikationen zur Reaktion darauf geben und seine Aussagen mit Referenzen aus dem Internet untermauern.

Anwendungen von Agenten in der Jahresabschlussprüfung:

  • Detektion doloser Handlungen (nach ISA 240): Ein agentenbasierter Workflow kann hierfür verschiedene autonome Agenten einsetzen, die jeweils spezifischen Aufgaben nachgehen. Beispiele sind:
    • Ein Agent zur Analyse interner Vorschriften, der Policies zusammenfasst.
    • Ein Agent zur Datenbankabfrage, der basierend auf den Vorgaben des ersten Agenten Datenextraktionen vornimmt.
    • Ein Agent zur Interpretation der Daten, der die extrahierten Datensätze sachlogisch interpretiert und Prüfungsergebnisse liefert.
  • Zukünftiger „General AI Auditor“: Dieser zukunftsorientierte, agentenbasierte Ansatz könnte das Konzept eines „General AI Auditors“ umsetzen. Dieser würde multimodale Foundation Models nutzen, um verschiedene Datenformate zu erfassen und spezifische Prüfungshandlungen zu managen. Er würde als zentraler Orchestrator fungieren und entscheiden, ob er Aufgaben selbst erledigt oder spezialisierte Lösungen in Form von Agenten oder weiteren KI-basierten Copiloten nutzt.

Herausforderungen und Ausblick

Trotz der vielversprechenden Potenziale stehen Wirtschaftsprüfungsgesellschaften noch vor Herausforderungen für den flächendeckenden Einsatz generativer KI. Eine wesentliche Hürde ist der Schutz mandatsspezifischer Daten, der als höchstes Gut und Grundlage des Vertrauens gilt. Daher dürfen Wirtschaftsprüfer nur generative KI-Modelle verwenden, die Rechtssicherheit in Bezug auf die DSGVO und die berufsrechtliche Verschwiegenheitspflicht gewährleisten. Dies sind oft lokal ausführbare Modelle mit zugänglichem Quellcode oder tenant-spezifische Cloud-Umgebungen.

Eine weitere Herausforderung ist die mangelnde Nachvollziehbarkeit von Entscheidungen aufgrund komplexer Modellarchitekturen, was die Fehlererkennung erschwert und die Verantwortlichkeiten für den Output einer generativen KI in Frage stellt. Daher bleibt der Grundsatz der Eigenverantwortlichkeit des Wirtschaftsprüfers unerlässlich.

Die hohe Qualität der generierten Inhalte bietet eine solide Grundlage für fundierte Interpretationen durch den menschlichen Abschlussprüfer. Durch gezielte Feinabstimmung und kontinuierliche Optimierung können potenzielle Ungenauigkeiten und Fehler weitgehend eliminiert werden, was Zuverlässigkeit und Genauigkeit signifikant steigert. Dennoch bleibt das Fachwissen und die Erfahrung eines Wirtschaftsprüfers auch in Zukunft unerlässlich, insbesondere beim Review und der kritischen Würdigung des Outputs.

Zusammenfassend lässt sich festhalten, dass generative KI bereits heute bedeutende Unterstützung für den Wirtschaftsprüfer ermöglichen kann und durch den agentenbasierten Workflow völlig neue Dimensionen der Bearbeitung von Aufgaben realisiert werden können.