In Folge 308 von MY DATA IS BETTER THAN YOURS (MDIBTY) spricht Jonas Rashedi mit Dr. Sebastian B. R. (Head of Data Science, sevDesk) über Applied AI. Konkret: Data-Science-Teams entstehen nicht durch Stellenanzeigen, sondern durch konkrete Business-Cases. Wer vorher nicht definiert, welches Problem das Team lösen soll, rekrutiert Frustration. Gen-AI-Cases bei sevDesk sind bewusst klein: Rechnungs-Klassifikation, Document-Parsing, Chat-Antworten.
3 Erkenntnisse aus dieser Folge
- 01
Data-Science-Teams entstehen nicht durch Stellenanzeigen, sondern durch konkrete Business-Cases. Wer vorher nicht definiert, welches Problem das Team lösen soll, rekrutiert Frustration.
- 02
Gen-AI-Cases bei sevDesk sind bewusst klein: Rechnungs-Klassifikation, Document-Parsing, Chat-Antworten. Kein Moonshot — sondern skaliert Mehrwert für Handwerker und Selbstständige.
- 03
Der größte Unterschied zwischen Hype und Produktiv liegt in der Monitoring-Disziplin. Ein LLM-Feature ohne Drift- und Kosten-Monitoring ist keine Software, sondern ein Zeitbomben-Feature.
Worum es in dieser Folge geht
Abschluss der sevDesk-Trilogie. Nach Marc (Strategie) und Michel (Warehouse) spreche ich mit Sebastian über die Anwendungsebene: Wie baut sevDesk eigentlich Data-Science-Produkte für Handwerker, Selbstständige und KMU-Kunden? Und wo zieht man die Grenze zwischen echtem Nutzen und Gen-AI-Theater?
Die Storyline
Wie das Team überhaupt entstanden ist
Sebastian beschreibt den Weg vom Ein-Personen-Analytics in Richtung eigenständiger Data-Science-Abteilung. Kernpunkt: Der Aufbau lief nicht über eine zentrale Strategie-Vision, sondern entlang konkreter Problem-Sets, die das Business sowieso lösen musste.
Wir haben nicht gesagt 'wir brauchen ein Data-Science-Team'. Wir haben gesagt: Hier ist ein konkretes Problem, hier ist der Business Case — und dann konnten wir jemanden einstellen.
Das ist ein wichtiger Unterschied zu Konzern-Setups. Der Mittelstand kann sich keine großen "Innovation-Teams ohne Auftrag" leisten. Jede Rolle muss durch einen messbaren Nutzen getragen werden.
Die echten Gen-AI-Cases
Bei sevDesk laufen Gen-AI-Features bewusst bodenständig: - Dokument-Parsing: Eingangsrechnungen automatisch klassifizieren und Felder extrahieren. - Beleg-Klassifikation: Vorgeschlagene Kategorien auf Basis der bisherigen Buchungen. - Chat-Assistenz: Antworten auf typische Steuer- und Abrechnungsfragen.
Keine "Gen-AI-Strategie". Sondern mehrere kleine, klar abgegrenzte Features, die jeweils einen erkennbaren Wert liefern.
Der Unterschied zwischen Hype und Produktiv
Sebastian sagt etwas, das mir stark hängen geblieben ist: Der Unterschied zwischen einem Prototyp und einem Produktivfeature mit LLM-Baustein ist nicht die Modellqualität. Es ist die Monitoring-Disziplin. Drift, Kosten, Halluzinationen, Edge-Cases — das sind die vier Dauerthemen. Wer die nicht aktiv monitort, hat Software ausgeliefert, die er nicht mehr kontrolliert.
Was CDOs daraus lernen können
- Beginne mit dem Problem, nicht mit dem Modell. LLM-Shopping ohne Use-Case ist teuer.
- Ein Feature mehr ist nicht automatisch besser. Weniger, klarere Features skalieren besser.
- Investiere in Monitoring ab Tag 1. Das ist kein "Nice to have", sondern Produktionsvoraussetzung.
Warum mich das besonders umtreibt
Ich sehe in Beratungsgesprächen immer noch Unternehmen, die 20 Gen-AI-Ideen parallel verfolgen und keine davon wirklich launchen. Sebastians Folge zeigt den Gegenpol: Wenige Cases, diszipliniert gebaut, messbar verbessert. Das ist kein sexy Vortrag auf einer Konferenz — das ist aber der Weg, der Umsatz bringt.