Wir bauen seit Tag eins Hallucination-Guardrails in Aidocr, in Vestrix.ai und in alle internen AI-basierten Prozesse.

Das ist weder eine nachträgliche Entscheidung noch ein Reflex auf irgendeinen unbequemen Vorfall. Es war von Anfang an klar, dass die Verlässlichkeit von AI die Grundvoraussetzung ist, bevor irgendjemand ein Produkt in einem business-kritischen Kontext einsetzt.

Was wirklich schwer ist

Bevor wir unzählige Integrationen, komplexe Workflows oder eine shiny UI gebaut haben, war unser Hauptfokus auf der Limitation von LLMs mit heterogenen oder großen Datenmengen und wie wir das Problem erst einmal angehen und lösen können.

Das ist nicht sexy. Das ist nicht das, womit man Konferenz-Bühnen füllt. Aber es ist die Voraussetzung dafür, dass eine Stadt Zürich oder ein Allreal überhaupt mit uns telefoniert.

Die AI-Bubble um Agentic AI

Exakt das ist der Punkt, der mich in der AI-Bubble rund um Agentic AI beschäftigt. Die unzähligen, täglichen, teils unwahren Narrative, die eine Welt suggerieren, in der KI-Agenten einfach „loslaufen“.

Marketing-Co-Piloten. Trading-Superbots. Multi-Step-Reasoning-Engines, die den ganzen Tag im Hintergrund arbeiten und ganze Value-Streams End-to-End übernehmen sollen. Alles schon auf dem Niveau einer generellen KI?

Denn nur die lässt den Enduser nicht bemerken, dass es von KI kommt. Agiert so unglaublich menschlich, dass kein Text den Rhythmus eines LLMs hat, sondern auch mal F-E-H-L-Ä-Ä-Ä macht. Und arbeitet fehlerfrei, prozessübergreifend, crossfunktional, aber Seite an Seite mit dem Menschen.

Ich frage mich ehrlich, ob die vielen Experten hier wirklich täglich mit diesen Modellen arbeiten oder ob sie einfach beschreiben, was sie sich wünschen.

Was wir tatsächlich tun

Wir schreiben mit den besten Modellen Code, adjustiert um unsere Guardrails. Wir bauen komplexe Datenextraktionen in Aidocr. Wir testen Signal-Logiken in Vestrix.ai. Eine unglaubliche Komplexität.

Und doch glauben wir, dass ein Baukastensystem aus LLM und Co. uns produktiv auf ein Niveau bringt, das vorher schlicht nicht erreichbar war. Vorausgesetzt, man baut es richtig.

Was der Enduser zu Recht erwartet

Für den normalen User ist das abstrakt. Dem ist es egal, wie das Modell funktioniert. Er will, dass das Ergebnis stimmt. Und das ist vollkommen legitim.

Deshalb tragen wir als Technologie-Anbieter, Educator und Berater die Verantwortung, sicherzustellen, dass AI funktioniert. Nicht, was theoretisch möglich sein kann.

Die verlässliche Agentic-Zukunft kommt. Davon bin ich überzeugt. Aber sie ist heute noch so experimentell, und wer das dem User nicht klar kommuniziert, baut für mich leider auf Sand.

Ich wünsche mir weniger Hype, mehr Hausaufgaben.

Anlass war eine Reihe von Webfetch-Halluzinationen beim Experimentieren. LinkedIn-Original auf meinem Profil.