Essay

Die Eine-Milliarde-Dollar-Frage: Verändert das PwC-GPT-Projekt die Steuerwelt?

Autor/en
  • Götz Kümmerle

PricewaterhouseCoopers (PwC) will über eine Milliarde Dollar in die Entwicklung von GPT-Technologie stecken. Damit ändert sich alles. Die Summe hat das Volumen eines echten Gamechangers, die Technologie das Potenzial dazu und die Taktik in der Anwendung ist innovativ.  Doch das Potenzial birgt Risiken – für PwC und die gesamte Branche.

Teilen Sie unseren Beitrag
Alles wird möglich? Die Entwicklung der Technologie, von der zwar jeder Mandant schon einmal gehört hat, die aber noch niemand richtig kennt, verläuft rasant.

Zahlen sind relativ. Besonders für mich. Ich hatte fünf Punkte im Matheabitur. Wenn ich also die Zahl „eine Milliarde“ höre, dann klingt die erstmal nach viel für mich, aber wirklich einordnen kann ich die Zahl anhand der nackten Ziffern nicht. Was bedeutet es also, wenn PwC so viel Geld in diese neue Technologie investiert? Was Zahlen wirklich bedeuten, habe ich erst im Laufe meines Studiums begriffen. Aus 14 Semestern Orientalistik ist mir dazu eine Geschichte in Erinnerung geblieben: Als sich der mongolische Heerführer Dschingis Khan 1190 auf den Weg machte ein Weltreich zu erobern, war sein Siegeszug begleitet von einer Zahl: Tuman. Das war der mongolische Begriff für eine zehntausend Krieger umfassende Heerschar. Der mongolische Tuman war aber mehr als nur eine bloße Zahl: Er wirkte in Kombination mit Technik und Taktik. Der gekrümmte kurze Reiterbogen der Mongolen war der Waffentechnik der damaligen Zeit weit überlegen. Die Taktik der Mongolen setzte auf schnelle und flexible Reiterangriffe. So bedeutete der Begriff Tuman zu Beginn des 13. Jahrhunderts in China, Zentralasien, dem Nahen Osten und in Osteuropa eins: völlige Veränderung. Lange nach Ende der mongolischen Herrschaft blieb der Begriff Tuman in Gebrauch – im hyperinflationsgewöhnten Iran heute noch die Einheit, in der man die Landeswährung Rial tatsächlich rechnet.

Völlige Veränderung?

‚Tuman‘ wäre daher der richtige Begriff für das Projekt, das die Big-Four-Gesellschaft PwC nun in Angriff nimmt. Ein Projekt, das für völlige Veränderung stehen könnte. Geben wir ihm im Folgenden daher ruhig den Arbeitstitel: Das ‚Tuman‘-Projekt. Um keine Verwirrung zu stiften: Tuman ist natürlich nicht der offizielle Titel der Kampagne. Zu dick aufgetragen? Vielleicht – andererseits haben es die Big Four gerade nicht so mit Zurückhaltung bei der Beschreibung ihrer Vorhaben: mit dem Namen des zentralasiatischen Berges Everest, dem mit 8848 Metern höchsten Massiv des Himalayas, bezeichnete Ernst & Young (EY) immerhin die nun abgesagten Aufspaltungspläne in Audit auf der einen sowie Tax, Legal und Advisory auf der anderen Seite. Laut Wall Street Journal habe EY innerhalb des einen Jahres der Vorbereitung gerade einmal 91,5 Millionen Dollar in den Plan investiert, von dem die Big-Four-Gesellschaft selbst behauptet hat, er sei nichts Geringeres als „the roadmap for reshaping the profession“.

Nun will PwC mehr als das Zehnfache dieser Summe innerhalb von drei Jahren in den Umbau der kompletten Arbeitsweise der Steuer- und Rechtspraxis durch generative KI stecken. Das ‚Tuman‘-Projekt könnte daher schaffen, was das Everst-Projekt nicht vermochte, nämlich den Berufsstand umzugestalten.

Durch die exklusive Kooperation mit Harvey, dem OpenAI-Spezialanbieter für Legal-Generative-AI, geht bei PwC der ansonsten eher transaktionslastige Legal-Arm in Sachen Technologie voran. Harvey ist am Markt bislang die einzige generative KI-Anwendung, die mit juristischen Daten vortrainiert wurde. Als einzige Big-Four-Gesellschaft darf PwC die Software weltweit nutzen. Ansonsten dürfen nur Anwaltsgesellschaften wie Allen & Overy, die ebenfalls eine Kooperation mit Harvey eingegangen ist, zuschlagen. Daher wird bei PwC der Legal-Arm die Weichen stellen, die dann auch für die Steuerabteilung gelten werden.

Unternehmensberater und Grundlagenforscher

Die Mandanten wissen noch gar nicht darüber Bescheid, wie und wofür sie generative KI nutzen sollten. Daher macht das Projekt ‚Tuman‘ – und jedes ähnliche Projekt bei der Konkurrenz – nur Sinn, wenn zunächst eine generelle generative KI-Beratung auf der Agenda steht. Bei einer Technologie, von der zwar jeder Mandant schon einmal gehört hat, die aber noch niemand richtig kennt, kommt es zunächst darauf an, Grundlagenarbeit zu leisten: Wo macht der Einsatz Sinn? Wo ist er rechtlich und faktisch möglich, wo problematisch? Wo liegen die größten Effizienzsteigerungen? Es reicht nicht, nur eine Softwarelösung anzubieten und auf Verkäufe zu hoffen. PwC müsste taktisch geschickt über die Flanken gehen, nämlich über den Umweg einer technologischen und prozessualen Unternehmensberatung in Sachen generativer KI.

Als Grundsatzberater und Entwickler zugleich könnten sich PwC oder andere Gesellschaften, die mit PwC gleichziehen wollen, frühzeitig richtig aufzustellen: Bei einer generativen KI handelt es sich um einen Algorithmus, der automatisch Texte anhand von Eingaben (sogenannten Prompts) erstellen kann. Dazu greift die Technologie auf riesige vortrainierte Datenmengen zurück. Seit Monaten halten die Möglichkeiten der wohl bekanntesten generativen KI, ChatGPT, die Öffentlichkeit in Atem. Allerdings gibt es auch kritische Stimmen. Etwa zu Manipulationsmöglichkeiten oder zum Urheberschutz. Wegen datenschutzrechtlicher Bedenken hatte etwa Italien den Zugang zu ChatGPT gesperrt. Grund für zum Teil sehr ironische Bewertungen nicht nur in den sozialen Medien ist auch die Tendenz der KI zu ‚Halluzinationen‘. Das sind absolut selbstsicher geschriebene künstliche Texte, die genauso absolut sachlich falsch sind.

Andere Big Four wären mit europäischen GPT-Start-ups flexibler

PwC muss sein exklusives Nutzungsrecht bei Harvey also dringend dafür einsetzen, für die oben genannten Probleme Lösungen zu finden. Denn für GPT-Lösungen gibt es Alternativen zu Harvey: Das Heidelberger Softwareunternehmen Aleph Alpha etwa reklamiert für seine GPT-Technologie Luminous eine höhere Effizienz bei weniger notwendigen Parametern als bei den GPT-Technologien von OpenAI und Harvey – inklusive der Möglichkeit von Quellenangaben und Herkunftsnachweisen für den Inhalt generierter Texte.

Die Kooperation mit europäischen Anbietern generativer KI böte den Big-Four-Konkurrenten EY, Deloitte und KPMG also die Chance, ähnliche Anwendungen anzubieten ohne über die teure Kooperation mit den US-Amerikanern von Harvey gehen zu müssen. Das ist der momentane Schwachpunkt im ‚Tuman‘-Projekt von PwC: Die anderen Big Four könnten PwC einfach mit schlankeren und flexibleren Kooperationen mit europäischen Start-ups ausmanövrieren.

Da das Thema generative KI bei den steuerlichen und rechtlichen Fachverlagen in Deutschland bereits angekommen ist, könnten europäische GPT-Anwendungen schnell auf den neuesten Stand gebracht werden. Zumal Harvey ebenfalls noch nicht auf europäische Steuer- und Rechtsdaten trainiert ist. Die Diskussionen um die Regulierung von KI auf europäischer Ebene haben zusätzlich Impulse gesetzt. Harvey allein bringt daher PwC noch keinen Sieg. Das dringlichste Problem, das PwC lösen müsste: Was auch immer PwC seinen eigenen Harvey-Anwendungen trainiert, müsste bei PwC verbleiben und dürfte nicht Bestandteil des Kollektivwissens der Anwendung werden. Genau damit tut sich Harvey-Mutter OpenAI mit ChatGPT derzeit jedoch noch schwer.

Wenn PwC allerdings diese Hürden nimmt, dann wäre der Weg frei für spezifische Kundenanwendungen. Die Konzeption, der Aufbau und der Betrieb solcher maßgeschneiderter Corporate-KI auf GPT-4-Basis könnte das Kernstück der ‚Tuman‘-Strategie von PwC werden – oder eben konkurrierender GPT-Anwendungen der anderen Big Four mit Anbietern wie Aleph Alpha.

Corporate GPT-KI als mächtige Waffe

Kunden könnten alle bisherigen Vertragsdokumente und Übereinkommen, die ein Unternehmen jemals geschlossen hat, sämtliche Absprachen, Richtlinien und Best-Practices-Beispiele in ihre eigene generative Corporate-KI-Anwendung eintrainieren. Damit würde die unternehmensspezifische GPT-Anwendung mehr sein als nur eine gut strukturierte Bibliothek. Sie würde zu einem Skriptorium, das auf Basis des gesammelten Wissens des Unternehmens über sich selbst, Vertragsentwürfe, Deklarationen und Stellungnahmen erstellen kann und das genau in der Art und Weise, in der das Unternehmen seine Dokumente zu gestalten pflegt. Das kann bei dem einen Unternehmen forsch und aggressiv sein, zum Beispiel wenn es darum geht, bei Lieferantenverträgen die Preise zu drücken. Bei einem anderen wiederum kann es eine sehr wenig aggressive Tax-Compliance-Praxis sein, die kaum auf ambitionierte Steuervermeidung setzt. Beispielsweise, weil es sich um ein altes Hamburger Handelsunternehmen in Familienhand handelt, bei dem noch die hanseatische Maxime „Wir zahlen die Steuern, die anfallen“ gilt. Es entstünde also so etwas wie ein künstlich generiertes Destillat des Wesens, der Praxis und des Charakters eines Unternehmens, das auf Fragen antworten kann: Eine enorme Waffe, an der PwC und die anderen Big Four die Möglichkeit hätten zu bauen. In ihrer durchschlagenden Wirkung durchaus dem mongolischen Reiterbogen vergleichbar.

Langjährige Mandantenkenntnis wird obsolet

Denn wenn die gesamte Vertrags- und Deklarationspraxis eines Unternehmens in einer einzigen Anwendung steckt, dann steht dieses Wissen plötzlich jedem Befugten zur Verfügung. Jeder Berater kommt via Eingabeprompt in Sekundenschnelle auf den gleichen Stand wie der angestammte Traditionsberater, der die Vertrags- und Deklarationspraxis des Unternehmens selbst beraten hat. Damit fällt ein zentrales Argument gegen Beraterwechsel in Tax und Legal weg: die langjährige Mandantenkenntnis. Nicht nur mehr Fluktuation bei Beratern wird möglich, auch mehr Transparenz. Denn fehlerhafte oder inkonsistente bzw. widersprüchliche Beratung wird ebenso sichtbar. Wenn Berater daher noch so gerne bei Mandanten anführen: „Niemand kennt Dich so gut wie ich“, könnte in Zukunft der Mandant sagen: „Falsch. Niemand kennt mich so gut wie meine eigene generative KI-Anwendung.“

Generative KI eignet sich besonders für den Mittelstand

Aber ist diese Technologie auch etwas für den Mittelstand? Es ist vielleicht sogar die beste Technologie für den Mittelstand – weil das Trainieren, also das Einlesen von Daten, technisch niederschwellig ist. Im Unterscheid zu internationalen Konzernen bestehen in mittelständischen Unternehmen häufig verschiedene, teils nicht verbundene beziehungsweise inkonsistente Datenmanagementkonzepte. Ein Umstand, der im Mittelstand die Implementierung von Tax CMS und anderen Reportingsystemen erschwert, die auf durchgeformten und strukturierten Daten basieren. Das Training für generative KI ist dagegen deshalb so einfach, weil diese für generative KI keine Voraussetzung ist. In Texten, die für GPT-Anwendungen trainiert werden, müssen nur die in ihnen vorkommenden relevanten Wörter und Begriffe markiert werden (sogenannte Tokens). Ein Wahrscheinlichkeitsalgorithmus erledigt den Rest. Allerdings gibt es eine Kehrseite der Medaille: Eine generative KI kann ‚halluzinieren‘. Also irgendwas erzählen.

Die Anforderungen an Berufsträger sinken nicht, sie steigen

Genau darin wird dann in Zukunft die Aufgabe des Steuerberaters und Rechtsanwalts liegen: Den Dateneingabeprompt sinnvoll vorzunehmen, richtige Rückfragen an die KI zu stellen und Halluzinationen zu erkennen. Berufsträger werden nicht mehr selbst Roh- oder Erstentwürfe von Verträgen, Gutachten oder Deklarationen erstellen. Die kommen in Zukunft von der KI. Der Berufsträger wird in Zukunft reviewen, was von der KI kommt – und damit steigen die Anforderungen an den Berufsstand und sinken nicht etwa, wie manche befürchten. Aber wer bezahlt in Zukunft für Associates, Consultants oder Manager, die bisher Entwürfe erstellt haben, die jedoch zum Reviewen der KI-Ergebnisse noch nicht senior genug sind? Die Einfachformel „Stunde mal Stundensatz für alle und fertig ist die Mandantenrechnung“ wird so nicht mehr funktionieren.

Das ‚Tuman‘-Projekt hat daher gehöriges disruptives Potenzial für die Branche. Da schließt sich dann der Kreis zu meinem Exkurs in die zentralasiatische Geschichte: Kurz bevor Dschingis Khan die Möglichkeit zur Eroberung Westeuropas gehabt hätte, starb der Großkhan 1227. Sein Reich wurde unter seinen Söhnen aufgeteilt und zerfiel. Die Zahl Tuman verlor an Bedeutung – bis zu dem, was sie heute ist: eine inoffizielle Währungseinheit im Iran.

Eine möglichst große Zahl, Taktik und Technik allein sind also noch längst keine Garanten für einen langfristigen Erfolg – weder bei Khanen noch bei KI.

Die Reiterstatue Dschingis Khans, gut 50 km östlich der mongolischen Hauptstadt Ulaanbaatar.

Artikel teilen

Gerne dürfen Sie unseren Artikel auf Ihrer Website und/oder auf Social Media zitieren und mit unserem Originaltext verlinken. Der Teaser auf Ihrer Seite darf die Überschrift und den ersten Absatz des Haupttextes enthalten. Weitere Rahmenbedingungen der Nutzung unserer Inhalte auf Ihrer Website entnehmen Sie bitte den AGB.

Für die Übernahme von Artikeln in Pressespiegel erhalten Sie die erforderlichen Nutzungsrechte über die PMG Presse-Monitor GmbH, Berlin. Telefon: 030/284930 oder www.presse-monitor.de.

Lesen sie mehr zum Thema