4 Slots Q2/26

KI-BERATUNG · WIEN · SEIT 2023

KI-Beratung
die rechnet, statt Hype verkauft.

Wir beraten DACH-Mittelstand zu KI: wo der Einsatz wirklich Hebel hat, welcher Tool-Stack zum Use-Case passt, wie Datenschutz und EU AI Act sauber adressiert werden — und wann ein Projekt schlicht nicht reif ist. Praxis seit der ersten GPT-Generation 2023.

Vertrauen von
Mercedes-Benz
BMW Deutschland
MINI Deutschland
Red Bull
IKEA
Allianz
A1
Sky
Electronic Arts
OBI

Was KI-Beratung im Mittelstand konkret bedeutet.

KI-Beratung umfasst die strategische und technische Begleitung beim produktiven Einsatz von Large Language Models, Machine-Learning, Agent-Architekturen und Automatisierungs-Workflows in einem Unternehmen.

Sie deckt typischerweise folgende Phasen ab:

  • Nüchterne Use-Case-Bewertung — welche Prozesse haben tatsächlich Hebel, welche sind Marketing-Hype
  • Tool- und Modell-Auswahl (US-Frontier-Models vs. EU-gehostete Open-Source-Modelle)
  • Pilot-Umsetzung mit klar definiertem Erfolgs-Kriterium
  • Integration in Bestandssysteme (ERP, CRM, Shop, Datenbanken)
  • Governance & Datenschutz-Setup (DSGVO, EU AI Act, Logging-Disziplin)
  • Schulung der Teams für nachhaltige Nutzung

Im Unterschied zu reinen „KI-Workshops" oder Tool-Lizenz-Vermittlung verantworten wir den ganzen Bogen — von der ersten Hypothese bis zur produktiven, gemonitorten Anwendung mit klarer Wirtschaftlichkeitsbetrachtung.

Was Sie von einer ernsthaften KI-Beratung erwarten dürfen.

Vier Dinge, die seriöse KI-Beratung von Hype-Workshops und Tool-Vermittlung unterscheiden — und die wir bei jedem Mandat liefern.

01

Nüchterne Use-Case-Bewertung statt KI-Hype

Wir sagen aktiv, wenn ein Use-Case mit klassischer Software, einer SQL-Abfrage oder einem schmalen Skript wirtschaftlich besser gelöst ist als mit einem LLM. Nicht jede Anfrage braucht GPT-5; manche Fragen sind nur deshalb "KI-Cases", weil das Buzzword Budget freischaltet. Sie bekommen eine ehrliche Empfehlung — auch wenn das gegen unser kurzfristiges Umsatzinteresse läuft.

02

Privacy-First-Architektur statt US-Cloud-Default

Wir bewerten für jeden Use-Case, wo ein US-Frontier-Model (OpenAI, Claude) sinnvoll ist — und wo ein EU-gehostetes Open-Source-Modell (Mistral, Llama, Qwen auf Hetzner Frankfurt oder Fly.io Frankfurt) wirtschaftlicher und datenschutzfreundlicher ist. Bei sensiblen Daten setzen wir auf On-Premise- oder dedizierte Inference-Setups. Datenflüsse, Logging-Disziplin und Modell-Wahl gehören zur Architektur, nicht in die nachträgliche Compliance-Korrektur.

03

Praxis seit 2023 — wir bauen selbst, nicht nur PowerPoint

Wir setzen LLMs seit der ersten GPT-Generation produktiv ein — in eigenen Tools, Kundenprojekten und in unseren eigenen Shop-Operationen. RAG-Pipelines, Agent-Setups mit Tool-Use, strukturierte Output-Parsing, Eval-Strategien gegen Halluzinationen, Cost-Monitoring auf Token-Ebene: Das sind Themen, die wir in echten Production-Workloads gesehen haben — nicht nur in Demos. Sie bekommen Beratung von Leuten, die danach den Code schreiben.

04

Modell- und Vendor-agnostisch — kein Lock-in

Wir empfehlen kein Tool, weil wir Provision dafür bekommen, sondern weil es zum Use-Case passt. Anwendungen werden modell-agnostisch gebaut (Abstraktion über LiteLLM, OpenRouter, oder eigene Wrapper) — wenn morgen ein besseres oder günstigeres Modell kommt, wechseln Sie ohne Re-Architecting. Lizenzen, Verträge und Daten gehören Ihnen, nicht uns.

KI-Beratung bei clickpuls — was wir konkret tun.

Use-Case-Discovery: wo KI im Mittelstand wirklich Hebel hat

Die häufigste Fehleinschätzung im Mittelstand: KI als universelles Werkzeug zu betrachten, das überall Effizienz hebt.

Hochwertige Use-Cases liegen meistens an drei Stellen:

  • Wiederkehrende Wissensarbeit mit unstrukturiertem Input — Angebotsausarbeitung, Vertragsanalyse, Lieferanten-Korrespondenz, Support-Triage
  • Datenextraktion aus Dokumenten, E-Mails, PDFs — Rechnungs-Erfassung, Lieferschein-Verarbeitung, Stammdaten-Pflege
  • Recherche- und Synthese-Aufgaben mit nachweisbarer Quellenlage — RAG über interne Dokumente, Wettbewerbsbeobachtung, Markt-Briefings

Was selten wirtschaftlich ist:

  • KI als Ersatz für gut definierte ETL-Pipelines
  • KI für Aufgaben mit hohem Halluzinations-Risiko und harter Compliance
  • KI als reine Chatbot-Spielerei ohne Anbindung an echte Daten

Unser Discovery-Format: zwei Workshop-Halbtage mit den operativen Köpfen — nicht mit dem Lenkungskreis. Wir gehen die wirklichen Tagesabläufe durch (welche Mails kommen rein, welche Excel-Tabellen werden täglich geöffnet, welche Reports werden manuell zusammengetragen) und bewerten jeden Kandidaten auf vier Dimensionen: Häufigkeit, Komplexität, Fehlertoleranz und Datenverfügbarkeit.

Output ist eine priorisierte Roadmap — typischerweise 3–5 Quick-Wins für die nächsten 8 Wochen plus 2–3 strategische Cases für 6–12 Monate, jeweils mit grobem Aufwand und Wirtschaftlichkeits-Hypothese.

LLM, RAG, Agent oder klassisches ML — die richtige Architektur pro Case

Nicht jede Aufgabe ist ein Prompt-Problem. Wir trennen vier Architektur-Klassen sauber.

Vier Architektur-Klassen:

  • Reine LLM-Aufgaben (Umformulieren, Übersetzen, Zusammenfassen) — schnell und günstig, kaum Engineering
  • RAG (Retrieval-Augmented Generation) — wenn das Modell auf interne Dokumente, Produktdaten oder Knowledge-Base zugreifen soll, ohne Halluzination. Stack: Vektordatenbank (pgvector, Qdrant), Embedding-Modell (OpenAI, BGE, Cohere), Hybrid-Retrieval (BM25 + semantisch), Re-Ranking, klare Quellen-Attribution
  • Agent-Setups mit Tool-Use — wenn das Modell mehrstufige Aktionen ausführen soll (Daten abfragen, Mails schreiben, ERP-Buchungen anstoßen). Hier kommt es auf Tool-Definition, Eval-Schleifen und Guardrails an
  • Klassisches ML (Forecasting, Klassifikation, Anomaly-Detection) — wenn die Aufgabe strukturierte Inputs und reproduzierbare Outputs hat, ist ein gradient-boosted Tree oft besser, schneller und günstiger als ein LLM

Wir wählen die Architektur nicht nach Tool-Trend, sondern nach Aufgabe. Häufiger Fehler im Markt: Agentic-Frameworks (LangChain, LangGraph, CrewAI) für Aufgaben einsetzen, die mit zwei API-Calls und einer If-Bedingung lösbar wären — das Ergebnis sind brüchige Systeme mit hohen Token-Kosten. Wir bauen so wenig Komplexität wie nötig.

Tool- und Modell-Stack: was wir wann empfehlen

Frontier-Modelle (US-Cloud) — OpenAI GPT-5, Anthropic Claude Opus 4.7, Google Gemini 2.5 — empfehlen wir, wenn die Aufgabe maximale Reasoning-Tiefe braucht, der Datenflug rechtlich tragbar ist (DPA, EU-Region falls verfügbar, Consent-Klarheit), und das Token-Budget passt.

EU-/Open-Source-Modelle — Mistral Large/Codestral (französisches Hosting), Llama 3.3 / Llama 4 auf eigener Infrastruktur, Qwen2.5 für mehrsprachige Workloads — empfehlen wir, wenn Datenresidenz hart gefordert ist, das Token-Volumen wirtschaftlich gegen Self-Hosting spricht (typischerweise ab ein paar Mio Tokens/Monat), oder wenn Modell-Stabilität über Jahre wichtiger ist als Frontier-Reasoning.

Stack-Komponenten je nach Use-Case:

  • Embeddings und Re-Ranking: OpenAI text-embedding-3, BGE-M3, Cohere Rerank — je nach Sprache und Domäne
  • Vektor-Storage: pgvector in Postgres (für die meisten Use-Cases ausreichend, kein extra System), Qdrant (wenn echte Hybrid-Search und große Korpora nötig), oder Elasticsearch (wenn Sie es eh schon betreiben)
  • Agent-Orchestrierung: nativer Tool-Use der Modelle (OpenAI Function Calling, Anthropic Tool Use) als Default, LangGraph nur wenn die Komplexität es wirklich rechtfertigt

Hosting unserer Inference-Container und Vektor-DBs läuft auf Hetzner Frankfurt oder Fly.io Frankfurt — Datenverarbeitung im EU-Raum.

Datenschutz, EU AI Act und Governance — sauber technisch umgesetzt

Wir setzen die technischen Voraussetzungen für DSGVO-konformen und EU-AI-Act-kompatiblen KI-Betrieb sauber um — die rechtsverbindliche Bewertung gehört aber explizit zu Ihrem Anwalt oder DSB.

Was wir technisch umsetzen:

  • EU-Hosting der Anwendungen und Vektor-DBs (Hetzner, Fly.io, Frankfurt)
  • Logging-Disziplin — welche Inputs/Outputs werden für Eval gespeichert, welche nicht
  • Datenklassifikation vor dem Modell-Call — PII-Maskierung, Secrets-Filter
  • Auftragsverarbeitungsverträge mit allen Modell-Anbietern
  • Klare Trennung zwischen Trainings- und Inferenz-Daten — kein Training auf Kundendaten ohne explizites Opt-in

Zum EU AI Act: Seit Februar 2025 sind die Verbote für „inakzeptable" Systeme in Kraft, ab August 2025 die Pflichten für General-Purpose-AI-Modelle, ab August 2026 die Hauptpflichten für Hochrisiko-Systeme.

Im Mittelstand ist die häufigste praktische Frage: Welche unserer KI-Anwendungen fallen in Hochrisiko-Kategorien?

  • Hochrisiko (typisch): HR-Screening, Bonitäts-Scoring, biometrische Identifikation, Bildung
  • Minimal risk (typisch): interne Produktivitäts-Tools, Marketing-Texte, Übersetzung

Wir liefern eine pragmatische Klassifikation Ihrer Use-Cases plus die technischen Bausteine für die Pflichten (Risiko-Management, Logging, Transparenz-Hinweise, menschliche Aufsicht). Den finalen Compliance-Stempel setzt Ihr DSB oder Anwalt — wir liefern die technische Vorlage.

Integration in Bestandssysteme — KI ist kein Insel-Tool

Eine KI-Anwendung erzeugt erst dann Hebel, wenn sie an die echten Datenflüsse angeschlossen ist.

Bestandssysteme, mit denen wir LLM-gestützte Workflows integrieren:

  • ERP / Buchhaltung: SAP Business One, Microsoft Dynamics, BMD, DATEV
  • CRM: Salesforce, HubSpot, Pipedrive
  • E-Commerce: Shopify, WooCommerce
  • Productivity / Collaboration: M365 (Outlook, Teams, SharePoint), Google Workspace, Atlassian (Jira, Confluence)

Verbunden über REST, GraphQL, Webhooks oder native Konnektoren.

Typisches Architekturmuster: ein schmaler Integrations-Service (Node.js auf Fly.io, Python auf Hetzner) als Vermittler zwischen Bestandssystem und Modell-API, mit Idempotenz, Retry-Logik und sauberem Error-Tracking via Sentry.

Bei sensitiven Workflows: Approval-Schritt mit Mensch-im-Loop, bevor das Modell schreibend in ein System greift — wir verkaufen Ihnen kein „Agent macht alles autonom"-Märchen.

Was uns unterscheidet — Praxis aus eigenen Operations

Wir haben über die Jahre selbst zahlreiche Shops und digitale Produkte aufgebaut und betrieben — Dropshipping-Modelle, eigenes Lager mit Produktentwicklung, eigene Marken mit Sortimentsaufbau und Marketing.

Seit 2023 setzen wir KI in unseren eigenen Operations produktiv ein:

  • Produkttext-Generierung mit Markenstimmen-Konsistenz
  • Lieferanten-Mail-Triage
  • Kundensupport-Vorab-Klassifikation
  • Wettbewerbs-Briefings via RAG über öffentliche Quellen
  • Intern dokumentierte SOP-Suche

Diese Erfahrung — was tatsächlich in einem operativ laufenden Mittelstands-Setup hält und was am Friction der Realität scheitert — fließt in jede Beratung ein.

Unser Team verbindet drei Disziplinen:

  • Software- und KI-Engineering
  • E-Commerce-Strategie und Plattform-Know-how
  • Brand- und Marketing-Praxis

Sie reden direkt mit den Seniors, die danach das System bauen, die Eval-Pipeline aufsetzen und die Kosten-Reports schreiben — nicht mit drei Layern Account-Management, das KI-Beratung „verkauft" und dann an Junior-Implementer weitergibt.

Und wir sagen aktiv Nein, wenn ein Use-Case nicht reif ist (zu wenig Trainingsdaten, zu hohes Halluzinations-Risiko, kein klares Erfolgsmaß) — auch wenn das ein Mandat kostet.

WANN BRAUCHEN SIE DAS?

Wann brauchen Sie KI-Beratung?

Vier typische Situationen, in denen DACH-Mittelstand und Konzern-Abteilungen den Schritt von eigener Tool-Erkundung zu strukturierter KI-Beratung machen.

01 / TRIGGER

Strategie-Klarheit vor dem nächsten Budgetzyklus

Sie haben für 2026 ein „KI-Budget" reserviert — aber keine belastbare Roadmap, welche Use-Cases priorisiert werden, was die Wirtschaftlichkeit ist und welche Fähigkeiten intern aufgebaut werden müssen. Wir liefern eine nüchterne Bewertung statt KI-Hype-PowerPoint.

02 / TRIGGER

Erste Pilotprojekte sind aus dem Sandkasten nie rausgekommen

Ihr Team hat ChatGPT-Plus-Lizenzen, ein paar Custom-GPTs und Microsoft Copilot — aber nichts ist produktiv im Kerngeschäft angekommen. Typisch: Datenflüsse fehlen, Eval-Disziplin fehlt, Halluzinationen werden nicht gemonitort, Kosten sind intransparent. Wir bringen Pilots in eine produktionsreife Architektur.

03 / TRIGGER

Datenschutz oder Compliance blockiert weitere Roll-outs

Ihre Rechtsabteilung oder Ihr DSB hat bei den ersten KI-Tools auf die Bremse getreten — und ohne klare technische Architektur kommt nichts mehr durch. Wir liefern technische Bausteine für DSGVO-konformen Betrieb, EU-Hosting-Setups, Datenflussklassifikation und Vorbereitung auf EU-AI-Act-Pflichten — als Vorlage für die rechtliche Bewertung durch Ihren Anwalt oder DSB.

04 / TRIGGER

Operatives Skalieren konkreter Use-Cases

Sie haben 1–2 erfolgreiche KI-Anwendungen in einem Bereich, möchten sie aber stabil auf andere Abteilungen, Sprachen oder Märkte ausrollen — inklusive Monitoring, Cost-Controlling, Modell-Wechsel-Strategie und Schulung der Power-User. Hier verlassen Sie das „nice demo"-Stadium und brauchen Engineering-Disziplin.

Klingt nach Ihrem Projekt?

30–45 Minuten Erstgespräch — kostenlos und unverbindlich. Wir prüfen Ihren Use-Case, schätzen Aufwand & Risiken und liefern eine ehrliche Empfehlung — auch wenn sie heißt: macht woanders mehr Sinn.

KI intern aufbauen oder mit clickpuls beraten lassen?

Eine ehrliche Gegenüberstellung der zwei häufigsten Pfade im Mittelstand — wir empfehlen je nach Volumen und strategischer Tiefe auch den Inhouse-Aufbau.

Kriterium / Criterion
Inhouse KI-Lead (1 Senior + 1 Engineer)
KI-Beratung · clickpuls
Monatliche Vollkosten (DACH-Markt)
€ 16–22k (Gehälter + Tools + Recruiting)
ab € 1.700/Monat (Beratungs-Retainer)
Time-to-Productive für ersten Use-Case
6–12 Monate (Recruiting + Onboarding)
4–8 Wochen ab Discovery-Workshop
Verfügbare Skill-Tiefe
1–2 Profile, Wissens-Cluster-Risiko
LLM-Engineering, RAG, Agents, Eval, Integration, Hosting
Vendor- und Modell-Updates verfolgen
Muss nebenbei passieren
Teil unseres Tagesgeschäfts
Compliance- und EU-AI-Act-Vorbereitung
Erfordert externe Rechts- und DSB-Beratung extra
Technische Vorlagen liefern wir; rechtliche Prüfung durch Ihren Anwalt/DSB
Wann lohnt sich der Inhouse-Pfad
Ab strategischer KI-Eigenfertigung mit > 5 parallelen Workstreams
Vom Pilot bis zum Skalieren mehrerer Use-Cases
UNSER PROZESS

So läuft KI-Beratung mit clickpuls.

Vier Phasen vom Discovery-Workshop bis zum produktiv laufenden Use-Case mit klarer Wirtschaftlichkeit — transparent, planbar, ohne KI-Mystery.

01

Discovery & Use-Case-Mapping

2–4 Wochen. Zwei Workshop-Halbtage mit den operativen Köpfen, Datenflusserhebung, Use-Case-Bewertung auf vier Dimensionen (Häufigkeit, Komplexität, Fehlertoleranz, Datenverfügbarkeit). Output: priorisierte Roadmap mit 3–5 Quick-Wins und 2–3 strategischen Cases, jeweils mit Aufwandsschätzung und Wirtschaftlichkeits-Hypothese. Discovery ist eine eigenständige, kostenpflichtige Leistung — Festpreis vorab.

02

Pilot-Implementation des ersten Use-Cases

4–8 Wochen. Architektur-Entscheidung (LLM, RAG, Agent, klassisches ML), Tool- und Modell-Wahl, Pilot-Bau mit Eval-Pipeline (Evals gegen Halluzinationen, Cost-Monitoring auf Token-Ebene), Anbindung an mindestens ein Bestandssystem, Mensch-im-Loop-Approval wo nötig. Festpreis-Angebot nach Discovery.

03

Skalierung, Monitoring und Schulung

4–12 Wochen. Roll-out auf weitere Abteilungen/Sprachen/Märkte, Monitoring-Dashboards (Sentry, Better Stack, eigene Eval-Reports), Cost-Controlling, Schulung der Power-User, Dokumentation der Workflows. Bei Bedarf Begleit-Retainer für Weiterentwicklung und Modell-Updates in mehreren Paketgrößen.

04

Governance, EU AI Act und Roadmap-Update

Quartalsweise Review: Use-Case-Klassifikation gegen EU-AI-Act-Risikostufen, Logging- und Datenfluss-Audit, Vorlage für Ihren DSB / Anwalt zur rechtsverbindlichen Bewertung, Modell-Stack-Update (neue Frontier-Modelle, neue Open-Source-Optionen), Roadmap-Update für nächstes Quartal. Schriftlicher Bericht inklusive.

ECKDATEN

Eckdaten unserer KI-Beratung.

Realistische Zahlen aus aktiven KI-Beratungen im DACH-Mittelstand — keine Hype-Metriken, keine Marketing-Versprechen.

Discovery-Workshop
2 × Halbtag + Roadmap

Festpreis-Discovery mit Use-Case-Mapping, priorisierter Roadmap und Wirtschaftlichkeits-Hypothese pro Case. Konkretes Angebot nach kostenlosem 30–45-Minuten-Erstgespräch.

Begleit-Retainer (optional)
ab € 1.700/Monat

Monatliches Stundenkontingent in mehreren Paketgrößen für Weiterentwicklung, Modell-Updates, Eval-Pflege und Skalierung neuer Use-Cases. Nicht-genutzte Stunden rollen einen Monat über.

Reaktionszeiten (Standard)
werktags innerhalb 24 h

Standard-Reaktion auf jede Anfrage werktags innerhalb 24 Stunden. Schnellere SLAs (z. B. 4h-Reaktion in CET-Geschäftszeiten oder 24/7 On-Call) sind als vertragliches Add-on möglich, kein automatischer Default.

Hosting / Datenresidenz
EU (Hetzner, Fly.io)

Inferenz-Container, Vektor-DBs und Integrations-Services laufen in Frankfurt — Datenverarbeitung im EU-Raum als technische Voraussetzung für DSGVO-konformen Betrieb.

Bereit für ein Erstgespräch?

30–45 Minuten per Call, unverbindlich. Schreiben Sie uns kurz, worum es geht — wir melden uns innerhalb eines Werktags mit konkreten nächsten Schritten und einer realistischen Aufwandsschätzung.

DACH-KONTEXT

KI-Beratung für AT, DE und CH.

DACH-Mittelstand hat bei KI eine andere Ausgangslage als US-Tech-Companies — und wir kennen diese Realität, weil die meisten unserer Kunden in Wien, Salzburg, Linz, München, Hamburg, Berlin, Düsseldorf, Zürich oder Bern sitzen.

Die zentralen DACH-Spezifika:

  • Höherer Datenschutz-Anspruch mit EU-AI-Act-Pflichten in mehreren Stufen ab 2025
  • Klare Erwartung an Datenresidenz im EU-Raum — keine Lust auf US-Cloud-Erstaufträge mit unklaren Datenflüssen
  • Gewachsene Bestandssysteme (SAP, DATEV, BMD, Dynamics) statt grüner Wiese
  • Regulierte Branchen mit zusätzlichen Sektor-Anforderungen (Finanz, Health, Public Sector)

Förderlandschaft, in der wir Anträge praxisnah begleiten:

  • Österreich: FFG (Innovationsschecks, Basisprogramme), aws (Digitalisierungs-Förderungen), Wirtschaftsagentur Wien — Discovery- und Pilot-Phasen sind in mehreren Programmen förderfähig
  • Deutschland: „Digital Jetzt" (BMWK) und ZIM (Zentrales Innovationsprogramm Mittelstand)
  • Schweiz: Innosuisse-Programme für angewandte KI-Forschung

Unsere Inferenz-Container, Vektor-DBs und Integrations-Services laufen auf Hetzner Frankfurt oder Fly.io Frankfurt — Datenverarbeitung im EU-Raum. Bei besonders sensiblen Workloads richten wir On-Premise-Inferenz auf Kunden-Infrastruktur ein (Llama, Mistral, Qwen mit vLLM oder Ollama).

Wir setzen technisch um, die rechtsverbindliche DSGVO-/FADP-/EU-AI-Act-Bewertung erfolgt durch Ihre Anwälte oder DSB — wir verantworten die technische Architektur und liefern die dafür nötigen Vorlagen sauber dokumentiert. Beratung kommt aus Wien, Termine vor Ort in DACH sind im Begleit-Retainer ab dem größeren Paket inklusive.

HÄUFIGE FRAGEN

Häufige Fragen zur KI-Beratung.

Was kostet KI-Beratung bei clickpuls?

Wir starten typischerweise mit einem Festpreis-Discovery-Workshop (2 Halbtage + Roadmap). Aufwand und Preis hängen von Unternehmensgröße und Anzahl der zu prüfenden Use-Cases ab und werden nach kostenlosem Erstgespräch konkret angeboten.

Modell-Übersicht:

  • Discovery-Workshop: Festpreis nach Erstgespräch
  • Pilot-Implementations: separate Festpreis-Projekte
  • Begleit-Retainer: monatlich ab € 1.700 netto, mit klar definiertem Stundenkontingent in mehreren Paketgrößen

Mini-Pakete bieten wir nicht an, weil sie weder für saubere Eval-Pflege noch für sinnvolle Quartals-Reviews ausreichen. Sie bekommen ein konkretes Festpreis- bzw. Retainer-Angebot nach dem Erstgespräch — verbindlich und vergleichbar.

Welche Tools und Modelle setzt ihr ein?

Modell- und Tool-agnostisch — wir wählen pro Use-Case.

  • Frontier-Modelle: OpenAI GPT-5, Anthropic Claude Opus 4.7, Google Gemini 2.5 — wenn maximale Reasoning-Tiefe gefragt ist und der Datenflug rechtlich tragbar ist
  • EU-/Open-Source-Modelle: Mistral, Llama, Qwen — wenn Datenresidenz hart gefordert ist oder das Volumen Self-Hosting wirtschaftlich macht
  • Embeddings: OpenAI text-embedding-3, BGE-M3, Cohere
  • Vektor-DBs: pgvector in Postgres, Qdrant, Elasticsearch
  • Agent-Orchestrierung: nativer Tool-Use der Modelle als Default, LangGraph nur wenn die Komplexität es rechtfertigt

Wir bauen modell-agnostisch (Abstraktion via LiteLLM oder eigene Wrapper) — kein Vendor-Lock-in.

Ist KI-Beratung bei euch DSGVO- und EU-AI-Act-konform?

Wir setzen die technischen Voraussetzungen sauber um — eine pauschale „konform"-Garantie ist eine rechtliche Bewertung, die wir als Beratungs- und Engineering-Team nicht abgeben.

Was wir technisch liefern:

  • EU-Hosting der Anwendungen und Vektor-DBs (Hetzner, Fly.io, Frankfurt)
  • Logging-Disziplin und PII-Maskierung vor dem Modell-Call
  • Auftragsverarbeitungsverträge mit allen Modell-Anbietern
  • Klare Trennung Training/Inferenz
  • Klassifikation Ihrer Use-Cases gegen die EU-AI-Act-Risikostufen plus die technischen Bausteine für die jeweiligen Pflichten

Die rechtsverbindliche Bewertung muss separat durch Ihren Anwalt oder Datenschutzbeauftragten erfolgen — wir liefern die technische Vorlage. Das gilt analog für FADP (Schweiz) und sektorspezifische Vorgaben (BSI-Grundschutz, BaFin-MaRisk, etc.).

Wann macht ein Frontier-Modell Sinn, wann ein Open-Source-Modell?

Wir entscheiden pro Use-Case auf Basis von Anforderung, Volumen und Compliance — nicht nach Tool-Religion.

  • Frontier (OpenAI, Anthropic, Google) — wenn die Aufgabe maximale Reasoning-Tiefe braucht (komplexe Analyse, mehrstufiges Planen, Code-Generierung), das Token-Volumen überschaubar bleibt (typisch < 5–10 Mio Tokens/Monat) und der Datenflug rechtlich tragbar ist
  • Open-Source (Mistral, Llama, Qwen) — wenn Datenresidenz hart gefordert ist (Health, Finance, Public Sector), das Volumen Self-Hosting wirtschaftlich macht oder Modell-Stabilität über Jahre wichtiger ist als Frontier-Reasoning

Mischformen sind häufig: Frontier-Modell für die schweren Reasoning-Schritte, Open-Source für hohe-Volumen-Routineaufgaben wie Klassifikation oder Summarisierung.

Wie geht ihr mit Halluzinationen und Qualitätssicherung um?

Drei Verteidigungslinien — produktive KI-Systeme brauchen klare Guardrails:

  • Architektur-Wahl — bei faktenkritischen Aufgaben grundsätzlich RAG mit Quellen-Attribution statt freier LLM-Antwort
  • Eval-Pipeline mit Test-Set — vor jedem Release läuft die neue Modell-Version oder der neue Prompt gegen einen Eval-Datensatz mit erwartetem Output, automatisch gescort
  • Mensch-im-Loop bei sensitiven Aktionen — bevor das System schreibend in ein Bestandssystem greift (ERP-Buchung, ausgehende Mail, Vertragstext), wird die Aktion zur Freigabe vorgelegt

Wir verkaufen Ihnen kein „Agent macht alles autonom"-Märchen.

Wie lange dauert es, bis ein Use-Case produktiv ist?

Realistische Time-to-Productive je Komplexität:

  • Erster, klar abgegrenzter Use-Case: 4–8 Wochen ab Discovery-Workshop bis zum produktiven Pilot mit Eval-Pipeline und Mensch-im-Loop-Approval
  • Komplexere Cases mit tiefer ERP-Integration oder mehrsprachigem Roll-out: 8–16 Wochen
  • Voll skalierte Mehr-Use-Case-Programme über mehrere Abteilungen: 6–12 Monate, in mehreren Wellen ausgerollt

Wir liefern realistische Schätzungen nach Discovery — keine 2-Wochen-Hype-Versprechen.

Bietet ihr auch Schulungen und Workshops für unsere Teams?

Ja — als eigenständige Festpreis-Workshops (typisch Halbtag oder Tag) für Power-User, Fach-Teams oder Führungskräfte.

Inhalte je nach Zielgruppe:

  • Fach-Teams: Prompt-Disziplin und Eval-Denken
  • Führungskräfte: Architektur-Entscheidungen und Wirtschaftlichkeit
  • Engineering-Teams: Tool-Stack und Integration

Workshops sind kein Verkaufs-Vehikel für anschließende Beratung — Sie können einen Workshop buchen und damit fertig sein. Auf Wunsch werden Workshops in eine breitere Beratungs- oder Implementierungs-Begleitung integriert.

Was passiert, wenn ein neues Frontier-Modell rauskommt?

Modell-Wechsel ist eine Konfigurationsänderung mit Eval-Lauf, kein Re-Architecting — Anwendungen werden bei uns modell-agnostisch gebaut (Abstraktion via LiteLLM, OpenRouter oder eigene Wrapper).

Im Begleit-Retainer prüfen wir neue Frontier-Releases (GPT-5.x, Claude 5, Gemini-Updates, Mistral-Releases) auf relevante Verbesserungen für Ihre Use-Cases und schlagen Wechsel vor, wenn Qualität, Geschwindigkeit oder Kosten signifikant besser werden. Sie sitzen nicht auf einem in zwei Jahren veralteten Modell fest.

Was, wenn unser Use-Case nach eurer Bewertung nicht reif ist?

Dann sagen wir das offen — und zeigen, was vorher passieren muss.

Typische Vor-Bedingungen:

  • Datenkonsolidierung
  • Klares Erfolgsmaß definieren
  • Kleinere klassische Automatisierung als Vorstufe

Wir verkaufen Ihnen keinen Pilot, der absehbar scheitert. Manchmal ist die ehrliche Empfehlung: „in 6 Monaten nochmal sprechen, wenn folgende Voraussetzungen erfüllt sind". Das Discovery-Investment ist trotzdem wertvoll, weil Sie eine klare Roadmap und priorisierte Use-Case-Liste in der Hand haben — nutzbar für interne Kommunikation und Budget-Planung.

Verwandte Leistungen.

Alle Leistungen

Klingt nach einem Match?

Jetzt unverbindlich anfragen
Jetzt anfragen