KI-Evaluation für Büro-KMU: Nicht nur Tool-Test, sondern Prozess-Audit

Viele Unternehmen verwechseln einen KI-Pilot mit einem Tool-Test. „Wir lassen GPT4 eine Woche laufen und schauen, ob es gut ist.“ Das ist nicht ausreichend. Evaluation für KMU bedeutet etwas anderes: Der Prozess muss transparenter werden, nicht nur schneller.

Ein Handwerksbetrieb testet eine neue Bohrmaschine nicht nur auf Geschwindigkeit. Er schaut, ob die Präzision stimmt, ob die Bedienung erklärbar ist, ob die Wartung passt. KI-Evaluation sollte ähnlich funktionieren. Das Tool ist nur eine Komponente. Der Test muss die Zuverlässigkeit, die Erklärbarkeit und die Korrigierbarkeit zeigen.

Die Evaluations-Checkliste für KMU

  • Konsistenz-Test: Zehn identische Eingaben geben ähnliche oder identische Ausgaben.
  • Fehler-Erkennung: Wenn die KI unsicher ist, sagt sie es explizit („Ich habe nicht genug Info“).
  • Korrektur-Schnelligkeit: Wenn ein Fehler erkannt wird, kann der Mensch ihn in Sekunden beheben.
  • Audit-Spur: Jede KI-Aktion wird protokolliert, sodass der Manager später versteht, warum welche Entscheidung vorbereitet wurde.

Diese vier Punkte sind nicht sexy, aber für ein KMU entscheidend. Ein Mitarbeiter, der jeden Output manuell kontrolliert, spart keine Zeit. Ein System, das automatisiert UND transparent ist, schafft Zeit und Sicherheit.

Ein realer Eval-Fall: Rechnungseingang

Nehmen wir eine Schreiner mit 15 Mitarbeitern. Sie erhält täglich 8–10 Kundenrechnungen. Diese werden manuell geprüft: Ist die Rechnung bereits eingegeben? Stimmt die Positionsliste? Gibt es ungewöhnliche Preise? Die Geschäftsführung überlegt, eine KI einzusetzen.

Der richtige Evaluations-Test läuft so: KI prüft fünf Tage lang parallel zur manuellen Prüfung. Danach: Stimmen die KI-Ergebnisse mit den manuellen überein? In wieviel Prozent ja, in wieviel nein? Wo war die KI schneller, wo langsamer? Wo hätte ein Mensch einen Fehler übersehen, den die KI erkannt hat?

Nach fünf Tagen hat die Schreiner nicht „die beste KI der Welt gefunden“, sondern gemessen, ob diese spezifische KI für diesen spezifischen Prozess die Zeit spart, auf die man hofft. Das ist Evaluation.

Warum Kosten-Nutzen nicht am Anfang passt

Ein KMU sagt oft: „KI kostet 30 Euro/Monat, wenn die einen Tag Arbeit spart, rechnet sich das.“ Das ist mathematisch richtig, aber praktisch naiv. Die erste KI-Implementierung ist nicht effizient. Die KI muss kalibriert werden, Fehler müssen behoben werden, der Prozess muss angepasst werden. Alles das braucht Zeit.

Die seriöse Rechnung lautet: Wir investieren zwei Wochen Evaluations-Zeit (ca. 40 Stunden). In dieser Zeit messen wir drei Metriken: Fehlerquote, Zeitersparnisse, Änderungs-Kosten. Wenn diese zeigen, dass nach Monat 2 ein Nutzen entsteht, erweitern wir.

Recherchebasis: Anthropic Claude Sonnet, EU AI Act Implementation, Digital Switzerland KMU KI.

💬 Hat Ihnen dieser Artikel geholfen?

Schreiben Sie uns, was gefehlt hat oder was Sie gerne tiefer erklärt hätten.

✉️ Feedback senden

Nächster sinnvoller Schritt

Wenn Mitarbeitende KI nutzen: Regeln und Nachweise nicht vergessen

Büro-KI hilft, wiederkehrende Büroarbeit sauberer vorzubereiten. Sobald mehrere Personen KI-Tools nutzen oder Kundendaten betroffen sein können, braucht es zusätzlich klare interne Regeln, Zuständigkeiten und eine nachvollziehbare Dokumentation.

KI-Regelmappe prüfen

Informations- und Orientierungshilfe, keine Rechtsberatung und keine Compliance-Garantie.

Nach oben scrollen