Die in der letzten Woche der Öffentlichkeit vorgestellte KI-Anwendung birgt einiges an Potenzial. Trotz des sperrigen Namens „Otto Schmidt Answers“ könnte das Produkt als Verbindung von Verlag und Softwareschmiede den Weg in die Zukunft für steuerliche KI-Anwendungen weisen. Der Grund dafür liegt in der speziellen Softwarearchitektur, die Taxy.io verwendet.
Gängige generative KI-Anwendungen wie ChatGPT basieren auf dem Gesetz der monolithischen Menge: Je mehr Daten einer Anwendung einverleibt und trainiert werden, desto exakter und richtiger funktioniert die generative KI. Im Grunde kann man sich diese Art von KI vorstellen wie einen einzigen unendlichen Trichter. Je mehr man hineinschüttet, umso besser. Das Problem entsteht, wenn man nicht nur Gutes oder Richtiges in diesen Trichter schüttet, sondern eben auch Falsches oder Zweifelhaftes. Denn einmal Geschlucktes und Einverleibtes wird die generative KI nicht mehr los.
„Das Training von einmal antrainierten Informationen rückgängig zu machen, ist faktisch nahezu unmöglich“, beschreibt Taxy.io-Gründer und -CEO Sven Peper die Schwierigkeit. Dieses Problem des Mengenansatzes generativer KI wird dann zum echten Hindernis, wenn es um sehr spezielle Wissensbereiche geht wie das Steuerrecht und seine Unterkategorien. Liefert der Wahrscheinlichkeitsalgorithmus schon bei Themen mit Millionen Daten unter Umständen fragwürdige Ergebnisse, dann werden steuerliche Spezialfragen nach Doppelbesteuerungsabkommen oder der Berechnung von Betriebsvermögen im Erbfall bei bestimmten Unternehmensstrukturen zum russischen Roulette – und damit zum Existenzrisiko für Berater, die sich darauf verlassen wollen.
Aus Mono wird Stereo: Taxy.io trennt Anwendung und Content voneinander
Diese Schwierigkeit hemmt bisher den Durchbruch generativer KI in der Steuerbranche. Taxy.io könnte eine technische Lösung für das Problem gefunden haben: Anstatt alles steuerliche Wissen eines Verlags in einen einzigen Trichter zu stopfen und zu hoffen, dass es gut geht, setzt die Entwicklercrew um Sven Peper, Daniel Kirch und Steffen Kirchhoff auf ein anderes Konzept.
Die Aachener Tax-Tech-Ingenieure trennen Sprachmodell und Content voneinander. Aus Mono wird Stereo: Anstatt alles in einem herrscht nun Dualität. Die Anwendung wird so weit vortrainiert, dass sie sich richtig und korrekt sprachlich ausdrücken kann – aber der eigentliche Content wird davon separiert. Praktisch ein Gehirn ohne Erinnerungen, aber mit allen kognitiven und sprachlichen Fähigkeiten. Diesem Gehirn wird nicht mühsam alles beigebracht, sondern die Inhalte bleiben extern. Sie werden also nicht mehr trainiert. Stattdessen greift die Taxy.io-Anwendung nur noch im Bedarfsfall auf den jetzt externen Content zu – und ist dadurch zudem erheblich schneller und effizienter. Durch dieses dualistische Trennungsprinzip macht Taxy.io kontrollierbar, was bisher bei generativer KI nicht kontrolliert werden konnte: nämlich den Umgang mit Wissen.
Paradigmenwechsel
„Es ist ein Paradigmenwechsel“, stellt Peper fest. „ChatGPT hat ‚KI für die Steuerberatung‘ als Thema nochmals katalysiert. Faktisch und fachlich sind die Antworten von GPT-3.5 und GPT-4 aber sehr oft fachlich falsch.“ Das ändere sich nun durch den Taxy.io-Ansatz. Denn durch das Trennungsprinzip zwischen Modell und Content könne man genau festlegen, auf welchen Datenbestand zugegriffen werden dürfe und auf welchen nicht. Auch Quellenhinweise zu belastbaren Qualitätsinhalten von Steuerrechtsverlagen wie dem Verlag Dr. Otto Schmidt seien so kein Problem mehr.
Wie das aussehen kann, hat der Sparringspartner von Taxy.io, Stefan Groß, bereits auf der Tax-Operations-Konferenz von JUVE Steuermarkt und NWB-Verlag vorgestellt. Groß ist Partner bei der Münchner Steuerkanzlei Peters, Schönberger & Partner (PSP) und TAXPUNK-Gründer. Sein Anwendungsfall war die GoBD. Ergebnis: Je spezieller der Content, welcher der KI-Anwendung mit dualistischer Architektur zum analysieren und aufbereiten zugeworfen wird, desto narrensicherer wird die Bedienung durch den Nutzer.
„Mit der gleichen Herangehensweise lassen sich auch diverse Spezialbots für geschlossene Themenkomplexe bauen“, so Groß. „Beispielsweise im Bereich der Umsatzsteuer oder der GoBD“. Solche Bots habe das Team bei PSP München bereits aus der digitalen Taufe gehoben und sei dabei, den Ansatz stetig weiter zu verbessern. „Wir stellen damit einen ganz ausgewählten, hoch speziellen Content zur Verfügung, den wir dann noch mal „vektorisieren“ – also gezielt aufbereiten“, erläutert Groß. „Dadurch werden die Antworten, die dann exklusiv aus diesem Content generiert werden, extrem passgenau.“
Häufig Anwenderfehler – keine absolute Narrensicherheit
Absolut narrensicher ist aber auch dieses Prinzip nicht: „Bei falschen Antworten der KI liegt in vielen Fällen eine unzureichende Anfrage zu Grunde“, so Groß. „Wenn ich dem Sprachmodell nicht genügend Informationen darüber gebe, worum es mir genau geht, dann können die Antworten am Ende nur unvollständig sein.“ Das sei auch nicht anders als bei einem Menschen, den man nicht genügend instruiere, in dem man ihm mehrdeutige oder oberflächliche Fragen stelle. „Daher kommt gerade der Fähigkeit, wie man Prompts formuliert und verfasst – kurz Prompt Engineering – eine zentrale Bedeutung zu“, so Groß. Außerdem müsse man bedenken, wie jung die Entwicklung insgesamt noch sei. Seitdem GPT-3.5 die Weltbühne betreten habe, sei nicht einmal ein Jahr vergangen: „Wir müssen vielmehr goutieren, was in so kurzer Zeit bereits alles geht“, fordert Groß. Auch die jetzt vorgestellte Taxy.io-Anwendung stehe noch am Beginn einer neuen Ära von KI-Anwendungen im Steuerbereich. „Gerade dort, wo viel Transferwissen erforderlich ist und dazu vielleicht noch Ermessensspielräume vorherrschen, können die Antworten auch in die falsche Richtung gehen“, stellt Groß fest. Von daher sei auch im KI-Zeitalter zwingend ein Vieraugenprinzip nötig, mit dem Unterschied, dass der Mensch Texte beurteile, die nun von der Maschine stammten.
Insgesamt sieht Groß den Taxy.io-Ansatz schon sehr ausgereift: „Wenn es darum geht, eine Abhandlung oder ein Memo zu einem ausgewählten steuerlichen Thema zu verfassen oder einen Text zu exzerpieren, sind die Ergebnisse hervorragend.“ Und Tätigkeiten wie diese machten eben einen Großteil der Arbeit eines Steuerberaters aus.
Für Berater wäre KI-Lösung mit verlagsübergreifenden Inhalten gut
Allerdings hat Groß doch einen Kritikpunkt: „Für mich als Steuerberater sind bei einer ganzheitlichen KI-Lösung für den Steuerbereich nicht nur die Inhalte des Otto-Schmidt-Verlages interessant. Als Berater würde ich mir eine verlagsübergreifende Lösung wünschen, mit weiteren Inhalten etwa des C.H. Beck-Verlages oder des NWB-Verlages.“ Technisch wäre dies bei dem Trennungsansatz kein Problem in der Umsetzung. „Die Verlage sind hier allerdings noch eher protektionistisch unterwegs und versuchen erstmal nur die eigenen Inhalte zu vermarkten“, schildert ein Marktbeobachter. Eine gemeinsame KI-Anwendung, die auf die Inhalte verschiedener Steuerfachverlage zugreifen könne, sei daher noch nicht in Sicht. Stefan Groß hofft aber schon einmal darauf.