JUVE Steuermarkt: Wie und in welchen Bereichen setzt Voith Tax Tech und KI ein?
Dr. Wolf-Dieter Mangold: Moderne KI- und Simulationstechnologie kommt in einem Technologiekonzern des Maschinen- und Anlagenbaus wie Voith an vielen Stellen zum Einsatz. Auch im steuerlichen Bereich setzen wir natürlich – wie viele andere – ebenfalls einiges an Technologie ein: angefangen von der automatisierten Steuerfindung bei komplexeren Reihengeschäften und der Einbindung von Tax Engines über den Einsatz von RPAs, also Robotic Process Automation, Kollaborationsplattformen für Betriebsprüfungen sowie GRC-Software für die Operationalisierung des Tax CMS bis hin zur – derzeit noch experimentellen – Nutzung generativer KI.
Ehe wir bei KI einsteigen: Wie groß ist Ihre Steuerabteilung?
In Deutschland liegen wir bei circa 20 Mitarbeiterinnen und Mitarbeitern, global sind wir in der Steuerabteilung knapp 50 Personen. Wir haben auch noch in Brasilien, den USA und China jeweils Satelliten der Konzernsteuerabteilung.
Haben Sie einen Partner, mit dem Sie zusammenarbeiten in Sachen KI?
Nicht konkret. Wir sind aber im Austausch mit den Steuerfunktionen anderer Unternehmen und in Arbeitskreisen vertreten. Man befruchtet sich gegenseitig mit Ideen und Erkenntnissen, für welche Zwecke und an welchen Stellen diese Technologie sinnvoll eingesetzt werden könnte, also welche sinnvollen Use Cases es gibt. Ansonsten haben wir steuerlich aktuell keinen Kooperationspartner, mit dem wir in Sachen KI enger zusammenarbeiten. Wir nutzen und experimentieren inhouse insbesondere mit der ChatGPT-Technologie von OpenAI. Da deren Nutzung über den allgemeinen Weg aus Datenschutzgründen für uns als Unternehmen nur sehr eingeschränkt in Frage käme, haben wir die Technologie von OpenAI in unserer eigenen IT-Landschaft in einem abgetrennten Bereich in Betrieb, damit unsere Unternehmensdaten geschützt sind. In diesem geschützten Bereich können wir datenschutzkonform mit unternehmensinternen Informationen experimentieren und jonglieren.
KI-gestütztes, interaktives und konzernweites steuerliches Content-Management-System
Wofür nutzen Sie diesen geschützten Bereich?
Für Themen innerhalb der Steuerabteilung bereits etwas intensiver, für steuerliche Themen über die Abteilungsgrenzen hinaus derzeit noch experimentell. Ein recht simpler Anwendungsfall liegt beispielsweise im Bereich der Konzernrichtlinien, Arbeitsanweisungen, Handbücher etc., die sich in die KI ‚einspielen‘ und auf dieser Basis Antworten generieren lassen. Hier wäre ein konzernweiter, recht hilfreicher Selfservice denkbar, sobald alles richtig eingespielt ist; wir sind wie gesagt noch in der Testphase. Wenn ich an die Vielzahl an Konzernrichtlinien sowie Arbeits- und Prozessanweisungen im Gesamtkonzern denke, dann sind dies Unmengen an Informationen. Ich gebe zu: Auch ich kenne hier nicht jedes Update von jeder Anweisung aller Voith-Abteilungen und -Divisionen im Detail. Sind jedoch all diese Dokumente als Quelle hinterlegt und stelle ich an die KI bzw. den Chatbot nun gezielt die Frage, wie ich diesen oder jenen Vorgang zu behandeln habe, dann greift die Technologie auf die Summe aller Konzernrichtlinien, Arbeits- und Prozessanweisungen zurück. Hierdurch kann ich – auch im Zusammenspiel mehrerer Richtlinien und Dokumente – schon erstaunlich gute Antworten bekommen. Oder ungewollte Widersprüche aufdecken. Das ist sehr hilfreich. Für den steuerlichen Bereich wären beispielsweise die Konzernsteuer- oder die Verrechnungspreisrichtlinie zu nennen: Nach welchen Grundsätzen muss ich einen bestimmten Vorgang behandeln und bepreisen, damit er auch den internen Vorgaben der Steuerabteilung genügt?
KI-Chatbots sollen die Zusammenarbeit zwischen Steuerabteilung und Fachabteilungen erleichtern
Das heißt, das wäre so eine Art steuerliches Knowledge Management System, das nicht für die Steuerabteilung relevant ist, sondern für die anderen Abteilungen, die steuerlich relevante Vorgänge auslösen? Also durch KI besseres steuerliches Wissen für alle anderen im Unternehmen, welche die Steuerabteilung ansonsten eher piesackt?
Ich hoffe nicht, dass wir die anderen Abteilungen piesacken, aber solch ein System könnte vieles erleichtern. Umgekehrt erleichtert es uns als Steuerabteilung auch, Richtlinien und Inhalte anderer Abteilungen ebenfalls zu durchdringen. Ebenso ist es für jede Mitarbeiterin und für jeden Mitarbeiter im Konzern von Nutzen. Das sind bisweilen banale Themen wie: ‚Bis zu welchem Betrag darf ich einen Geschäftskunden zu einem Arbeitsessen einladen?‘ Anstatt die entsprechende Richtlinie zu suchen und zu durchsuchen, kann man über einen Chatbot deutlich einfacher und schneller die entsprechende Antwort erhalten. Und je leichter vorhandene Informationen und Regelungen allen zugänglich gemacht werden, umso eher ist auch deren Einhaltung und damit die Compliance gesichert.
Wie sind Ihre Erfahrungen innerhalb der Steuerabteilung selbst?
Auch innerhalb der Steuerabteilung lassen sich bereits in recht trivialen Bereichen gewisse Effizienzgewinne erzielen. Wir haben beispielsweise die eine oder andere interne Richtline oder Schulung mit der OpenAI-Technologie vorbereiten oder aufbereiten lassen. Selbstverständlich mussten wir am Wortlaut und ein paar inhaltlichen Punkten noch einiges anpassen, aber Strukturierung und wesentliche Inhalte konnten hiermit schon ganz brauchbar vorbereitet werden. Dies führt auf jeden Fall zu einer spürbaren Zeitersparnis. Es lassen sich beispielsweise auch sehr gut Zusammenfassungen erstellen oder eingespielte Inhalte aufbereiten. So könnte man z.B. den Gesetzesentwurf des Wachstumschancengesetzes nehmen und dann die KI bitten, auf dieser Grundlage eine Zusammenfassung der für einen Konzern wesentlichen Inhalte auf zwei DIN-A4-Seiten zu erstellen.
KI erleichtere steuerliche Governance und Wissensvermittlung
Also eine Art Zweiteilung: Einerseits wird Ihr Input in den Konzern erleichtert und andererseits nutzen Sie die KI als Informationsmanagementsystem für Ihre eigene Abteilung?
Genau. Außerhalb der Abteilung ist es unter anderem ein gutes Medium, um die steuerliche Governance und die Wissensvermittlung und damit auch Compliance zu unterstützen; innerhalb der Abteilung nutzen wir die Technologie zumindest derzeit unter anderem als Assistenzsystem zur Vorbereitung und Strukturierung von Unterlagen oder Präsentationen sowie für die Aufbereitung von Informationen.
Ihre Mitarbeiter gehen dann in eine Art Review der Vorentwürfe durch die KI?
Ja, genau. Aber das ist nur ein Kratzen an der Oberfläche und wird der Technologie nicht wirklich gerecht. Die Möglichkeiten sind weitaus vielfältiger und hier tasten wir uns ebenfalls langsam voran.
Wenn Sie von Experimenten mit der KI sprechen, können Sie schon sagen, wann das live geht?
Richtig live, in dem Sinne, dass wir Funktionen seitens der Steuerabteilung im Konzern produktiv ausrollen – davon sind wir, glaube ich, noch etwas entfernt. Hierfür bräuchte es eine noch größere nutzerunabhängige Verlässlichkeit der KI und ein größeres Vertrauen in die KI. In manchen Anwendungsbereichen sind die Ergebnisse jetzt schon beeindruckend. Allerdings möchte ich derzeit nicht meine Hand dafür ins Feuer legen, dass selbst bei einfachen Fragestellungen immer eine inhaltlich korrekte Antwort ausgegeben wird. Das hängt von sehr vielen Parametern ab, wie der Datengrundlage, dem Anlernen der KI und vor allem auch davon, wie eine Frage formuliert wird. Im steuerlichen Bereich sprechen wir immer auch von Compliance und Sicherstellung deren Einhaltung. Es wäre völlig fatal, wenn selbst bei einem eindeutigen Sachverhalt durch die Art und Weise, wie eine Frage gestellt und der Sachverhalt geschildert wird, das Ergebnis beeinflusst oder die Auskunft gar in ihr Gegenteil verkehrt wird. Es ist durchaus denkbar, dass ein steuerliches Ergebnis durch die KI korrekt ausgegeben wird, wenn die Fachkolleginnen und -kollegen der Steuerabteilung die KI entsprechend mit Informationen und Fragen ‚fütterten‘; nicht jedoch, wenn andere Kolleginnen und Kollegen im Konzern die vermeintlich selbe Frage durch die KI verarbeiten lassen.
Wenn sich die Kolleginnen und Kollegen im Konzern dann auf Basis dieser KI generierten Auskunft falsch verhalten würden, wäre das unter Umständen ein wirtschaftlich wie rechtlich erhebliches Problem. Hier ist sicher noch einiges an Luft nach oben, bevor wir diese Art der KI gerade bei steuerrelevanten Themen wirklich mit Vertrauen nutzen.
Es lassen sich auch große Unterschiede zwischen den genutzten Lösungen feststellen, also unserer internen Lösung, ChatGPT 3.5 und ChatGPT 4.0. So waren beispielsweise die Aussagen zur testweisen Fragestellung, ob eine Rücklage nach § 6b EStG auch für Parkplätze gebildet werden könne, teils gegensätzlich. Zu unserem Erstaunen war im Erstversuch die Auskunft unseres internen Systems die beste und einzig zutreffende, obwohl wir unsere interne Lösung nicht mit spezifischen Informationen anlernten. Jedoch variiert das Ergebnis teils noch von Versuch zu Versuch.
Also das berühmte Prompt Engineering zu verbessern, die Fehlerquoten und das Halluzinieren zu reduzieren, das sind derzeit die größten Herausforderungen?
Das wäre unter anderem ein Punkt, bei dem noch Verbesserungen erzielt werden müssten. Aber auch bei Verwendung absolut identischer Prompts variieren die Aussagen bei solchen Fragestellungen selbst innerhalb derselben Anwendung teils noch erheblich und nicht nur in Nuancen. Mit einfachem Knowledge-Management funktioniert dies dennoch bereits recht gut. Wenn es jedoch um komplexe Fragestellungen geht, dann sieht die Situation anders aus – etwa bei Fragestellungen zu komplexen Reihengeschäften. Um solche Fragestellungen im steuerlichen Bereich sauber und verlässlich durch den KI-Chatbot beantworten lassen zu können, fehlt es derzeit aber auch noch an der erforderlichen Datengrundlage in den KI-Anwendungen und dem fundierten „Anlernen“.
Eine solche speziell steuerlich trainierte Anwendung gibt es ja noch nicht – es gibt bisher nur Harvey mit einem Schwerpunkt auf US-Recht. Haben Sie schon einmal überlegt, ob Sie mit den deutschen steuerlichen Verlagen wie Wolters Kluwer, C. H. Beck, Otto Schmidt oder NWB (Anm. der Red.: JUVE Steuermarkt gehört zur NWB Gruppe) zusammen eine Anwendung erstellen wollen?
Ganz interessant wäre es schon, und ich glaube, es muss auch in diese Richtung gehen, wenn wir im steuerlichen Bereich taugliche und verlässliche Produkte haben wollen. Es gibt ja bereits den einen oder anderen Versuch in die Richtung der Kooperation mit Verlagen wie z.B. von Taxy.io. Die Qualität der Ergebnisse wird dabei auch künftig nicht ausschließlich der Technologie zugeschrieben werden können, sondern hängt auch von den jeweiligen fachlichen Inhalten der einbezogenen Verlage ab.
Wie sieht die Richtung in Ihren Augen aus?
Nahezu sämtliche Steuergesetze, steuerliche Richtlinien sowie Verwaltungsanweisungen und internationale Abkommen sowie große Teile der Rechtsprechung sind öffentlich zugänglich. Diese könnten bereits verlagsunabhängig einer KI als Basis zugrunde gelegt werden. Nun bräuchte es allerdings in aller Konsequenz für hochwertigere und verlässliche Ergebnisse ergänzend auch die komplette Kommentarliteratur sowie sämtliche Fachaufsätze und andere fachspezifische Inhalte der Verlage.
Ich könnte mir vorstellen, dass es hierbei einen größeren Interessenskonflikt zwischen Verlagen und Anbietern einer solchen steuerlichen KI-Lösung geben dürfte. Das Niveau beider Disziplinen, der Technologie und der verwendeten Datengrundlage, trägt entscheidend zur Qualität der erzielten Ergebnisse bei. Gibt es nun eine derart überzeugende technische Lösung, mit deren Hilfe auch komplexe steuerliche Fragestellungen bearbeitet werden könnten, würden für die Nutzer die direkten Zugriffe auf die Verlagsinhalte perspektivisch obsolet, was wiederum zumindest das derzeitige Geschäftsmodell der Verlage infrage stellen dürfte. Daher könnte es spontan betrachtet zwei Richtungen geben: Entweder bauen die steuerlichen Fachverlage selbst das technologische Know-how auf und bieten entsprechende KI-basierte Services auf deren eigenen Verlagsinhalten an, oder das Geschäftsmodell von Fachverlagen ändert sich in eine Richtung, in welcher die auf die Technologie fokussierten Anbieter KI-basierter Services Hauptkunden der Verlage werden und deren Inhalte verarbeiten. Darüber, wie attraktiv es in einer solchen Zukunft jedoch für Autoren sein wird, Fachbücher, -aufsätze und -kommentare zu verfassen, die ggf. ausschließlich als ‚Futter‘ für die KI dienen und nur noch zu einem geringen Teil unmittelbar gelesenen werden, darf spekuliert werden.
Würden Sie so eine Anwendung nutzen?
Wenn sie gut ist, auf jeden Fall. Davon sind wir aus meiner Sicht jedoch noch etwas entfernt. Aber wenn sämtliches steuerliches Wissen in Form von Gesetzen, Richtlinien, Verwaltungsanweisungen sowie der gesamten weiteren Fachliteratur sinnvoll mittels KI genutzt und dann auch komplexe Sachverhalte zutreffend beurteilt werden können, dann ist dies eine hoch spannende Sache. Das wäre nicht nur entlastend und würde die ohnehin angespannten Ressourcen in Inhouse-Steuerabteilungen schonen, es könnte in Anbetracht der Menge an verarbeiteten Quellen und Informationen auch qualitativ ein Zugewinn sein. Nicht anders wird es in puncto Ressourcen auch den Kanzleien und Steuerberatungsgesellschaften ergehen. Wichtig wäre für mich jedoch, dass eine solche Anwendung nicht reine Blackbox-Entscheidungen ausgibt. Ich müsste immer noch nachvollziehen können, unter Nutzung welcher wesentlichen Quellen ein bestimmtes Ergebnis zustande kam, um dessen Plausibilität überprüfen zu können. Schlussendlich müsste ich dieses, nach aktuellem Rechtsverständnis, ja auch selbst verantworten.
Problem bei KI Antworten, die auf den ersten Blick plausibel sind, aber es im Detail nicht sind
Was wäre Ihre Negativvision?
Ein ungünstiges Szenario wäre, wenn ein Ergebnis plausibel erscheint und nicht auffällt, dass Fehlschlüsse enthalten sind und ich mich dann bei der Umsetzung auf diese Aussage stütze. Wenn eine Aussage offensichtlicher Nonsens ist, wäre es unproblematischer; dann verwerfe ich einen solchen Output. Wenn aber auf den ersten Blick Aussagen plausibel erscheinen und nicht weiter im Detail geprüft werden bzw. geprüft werden können, dann wird es schwierig. Hier wäre es hilfreich, bei jeder Antwort bereits eine Aussage über die eingeschätzte Qualität der generierten Antwort zu erhalten, also eine Art Trefferquote. Der Fokus der Arbeit wird sich in absehbarer Zeit vermutlich verlagern, hin zu einer Überprüfung dessen, was eine gute KI an fachlichen Aussagen als ‚Assistent‘ vorbereitet hat. Zumindest bis zu einem in noch weiterer Zukunft liegenden Zeitpunkt, zu dem selbst dies nicht mehr erforderlich sein wird. Bis dahin wäre für mich die Transparenz der Quellen sowie ein Parameter für die Qualität der generierten Antwort für eine gezielte Nachprüfbarkeit und Nachvollziehbarkeit – neben der fachlichen Richtigkeit – ein entscheidender Faktor.
Es gibt Alternativen zu OpenAI, auch von deutschen Anbietern wie Aleph Alpha. Sind die auch einmal bei Ihnen aufgetreten oder ist im steuerlichen Bereich vor allem OpenAI unterwegs?
Wir denken für steuerliche Themen auch in andere Richtungen als OpenAI. Für eine konkrete Zusammenarbeit müssten wir vorher jedoch noch intern unsere Hausaufgaben machen, um eine entsprechenden Datengrundlage zu haben. Es gibt theoretisch sehr viele spannende Fälle in einem global tätigen Konzern des Maschinen- und Anlagenbaus wie Voith.
KI macht komplexe steuerliche Simulationen möglich
Sie denken an komplexe Simulationen?
Ja, unter anderem. Ein theoretisches und vielleicht etwas spielerisches Beispiel für uns als Anlagenbauer: Wie hoch ist das Risiko, dass eine ungeplante Betriebsstätte entsteht? Gerade bei Anlagenbauprojekten kann es immer wieder zu ungeplanten Zwischenfällen kommen. Hier könnten auf Basis bisheriger vergleichbarer Projekte in einem Land sowie Wetterdaten, geopolitischer Informationen mit Auswirkungen auf Lieferzeiten und damit einhergehenden Projektverzögerungen etc. Prognosen erstellt werden. Der Fantasie sind keine Grenzen gesetzt, wie man eine solche KI einsetzen könnte, auch weit über das rein Steuerliche hinaus. Aber einerseits sind die hierfür erforderlichen Daten als Grundlage nicht so leicht bereitzustellen, andererseits ist der wirtschaftliche Nutzen einer Lösung natürlich der alles entscheidende Faktor für eine Umsetzung.
Also das Unternehmens-Know-how würde durch die KI auch steuerlich noch einmal anders nutzbar gemacht? Hätte das auch Auswirkungen auf Ihre Berater?
Wenn wir eine technologische Unterstützung hätten, die allumfänglich alle wesentlichen steuerlichen Dokumente auf globaler Ebene – Doppelbesteuerungsabkommen, Kommentare etc. – korrekt verarbeiten und berücksichtigen würde, könnten wir sicherlich auch den Einsatz von Beratern stärker eingrenzen. Denn wenn sich auch länder- und fachspezifisches Spezialwissen noch besser aufbereiten ließe, würden in Kombination mit den weiteren unternehmensinternen Daten – sowohl aus dem operativen Bereich als auch aus dem Finanzwesen – die Möglichkeiten der Inhouse-Steuerabteilungen im Hinblick auf die Beurteilung komplexer grenzüberschreitender oder rein ausländischer Sachverhalte deutlich wachsen.
Effizienzgewinne durch KI auf Seiten von Beratern muss sich in Honoraren widerspiegeln
Werden Sie dann auch kritischer, was die Honorarabrechnungen von Beratern anbelangt, wenn die KI Vorentwürfe auch für Kanzleien und Beratungen erstellen kann?
Natürlich wird sich auch für Berater der Arbeitsaufwand in manchen Punkten reduzieren. Es wäre durchaus unsere Erwartungshaltung, dass, wenn sich technologische Effizienzgewinne aufseiten unserer Berater in einer Zeitersparnis auf deren Seite niederschlagen, sich dies auch in den Honoraren widerspiegelt.
Wo würden Sie in Zukunft trotz KI und interner Möglichkeiten immer weiter auf einen externen Berater setzen?
Unter anderem in besonders komplexen Fällen, wenn es um menschliches Verhandlungs- und Kommunikationsgeschick geht und wenn interne Lösungen nicht wirtschaftlich sind. Man darf auch nicht zu technologiegläubig sein. Es wird eine Entwicklung geben. Mit zunehmendem Vertrauen in die Technologie und wachsenden Möglichkeiten werden wir auch den Einsatz externer Ressourcen reduzieren können. In sehr komplexen Fällen allerdings – und das ist vermutlich der Bereich, in dem die Technologie noch den weitesten Weg vor sich hat – würde ich weiterhin auf die Zusammenarbeit mit Beratern setzen. Beispielsweise Konzernrestrukturierungen, bei denen eine Vielzahl an Ländern betroffen ist. Hier stehen auch jeweils sehr hohe Beträge ‚im Feuer‘.
Hat das Haftungsgründe und den Hintergrund des Zugriffs auf die Versicherung des Beraters?
Zumindest von meiner Seite kann ich sagen, dass es ein Irrglaube ist, dass Mandanten Berater vorwiegend zur Absicherung der finanziellen Risiken über deren Haftpflichtversicherung hinzuziehen. Die Haftungsvolumina belaufen sich selbst bei den größeren Beratungshäusern im Standard auf einen mittleren einstelligen Millionenbetrag. Ganz ehrlich: Wenn in einem mittelständischen oder größeren Konzern bei derartigen Vorgängen tatsächlich einmal etwas schiefgehen sollte, dann würde dieser Betrag im ungünstigsten Fall auch nur einen Bruchteil der Auswirkungen decken. Die Haftpflichtversicherung unserer Berater ist mit Sicherheit nicht der Grund für eine Zusammenarbeit. Unsere Berater sind für uns nicht bloße Dienstleister, sondern vertrauensvolle Kooperationspartner. Es geht darum, im Zweifel ein drittes, viertes oder fünftes Augenpaar und die jeweiligen Experten ihres Faches mit an Bord zu haben, um komplexe globale Vorgänge mit einzuschätzen. Ziel ist im Interesse aller Beteiligter immer, dass es gar nicht erst zu einem Haftungsfall kommt. Die Kompetenz und Qualität der Ergebnisse stehen immer im Vordergrund.