Case Brouwerij Vandaag: klantenservice-tickets van 80/dag naar 22

Brouwerij Vandaag had 80 supporttickets per dag op hun Shopify webshop. Twee mensen werkten 's avonds door, klanten wachtten 36 uur op antwoord. We hebben een AI-triagelaag gebouwd die 4 categorieën auto-afhandelt. Reactietijd van 36 uur naar 2 uur, 72% minder handmatige tickets, CSAT van 7,4 naar 8,9.

80 → 22 handmatige tickets/dag. Reactietijd 36u → 2u. CSAT +1,5 punt. Sprint terugverdiend in 6 weken.

Het probleem: ambachtelijke schaalpijn

Brouwerij Vandaag (ambachtelijk speciaalbier, Noord-Holland) zat in een goed probleem: webshop liep harder dan verwacht. 80 tickets per dag in piekmaanden (Sinterklaas, kerst, vaderdag). Twee customer-service-mensen, beide parttime, eindigden hun dag met 40 ongelezen tickets in de inbox.

Klanten wachtten gemiddeld 36 uur op een eerste reactie. Voor een €45-bestelling met cadeau-deadline is dat te lang. Refund-verzoeken stapelden op, recensies daalden, herhaalaankopen liepen terug.

De drie founders wilden niet meer mensen aannemen voor een seizoenspiek. Logisch — vast personeel voor 3 maanden piek per jaar is dure verzekering.

Aanpak: AI-triage, vier categorieën

We hebben de inkomende mailbox op support@brouwerijvandaag.nl onderschept met een n8n-flow. Elke nieuwe mail door GPT classificeren in vier categorieën:

Order-status (ca 41% van tickets): "Waar is mijn pakketje?" — auto-respons met track-and-trace en geschatte aankomst. Volledig automatisch.
Retour (12%): klant geeft retourreden. AI genereert retour-instructies en label, mens reviewt voor verzending. Half-automatisch.
Product-info (29%): "Welk bier past bij Indiaas eten?" — AI antwoordt op basis van product-database en eerdere klant-gesprekken. Volledig automatisch.
Klacht (18%): scherpe toon, refund-verzoek, kapot pakket. Direct escaleren naar mens. Geen auto-actie.

Elk auto-antwoord heeft een handtekening: "Beantwoord met hulp van onze AI-assistent. Niet correct? Reply, dan kijkt een mens mee." Transparant en veilig.

Sprint: €4.900, 4 weken bouw + 2 weken fine-tuning. Payback 6 weken op basis van bespaarde uren alleen, exclusief omzeteffect uit hogere CSAT.

De prompt-engineering: nuance per categorie

De classifier-prompt is strak: "Geef exact één van: ORDER, RETOUR, INFO, KLACHT. Bij twijfel: KLACHT (escalatie is veilig, valse positives kosten alleen tijd, valse negatives kosten klant)." Bij twijfel altijd richting menselijke check.

Per categorie een eigen response-prompt. Voor ORDER: "Antwoord max 60 woorden. Begin met track-and-trace. Sluit af met 'Thuis blijft het bier goed tot [houdbaarheidsdatum]'. Onderteken met 'Team Brouwerij Vandaag'." Korte, vriendelijke, on-brand.

Voor INFO is het complexer. We hebben de hele product-catalog (47 bieren, smaakprofielen, food pairings) in de prompt-context geladen. AI antwoordt op basis daarvan. Als de vraag buiten de scope valt: "Ik weet het niet zeker. Een collega kijkt mee binnen 4 uur." Geen gokwerk.

"De eerste week was eng. We controleerden elk auto-antwoord. Tegen week 3 zaten we te giechelen — 'die had ik beter geantwoord dan zelf'."Marketing-lead Brouwerij Vandaag

Resultaat na 12 weken

Metric	Voor	Na	Delta
Handmatige tickets/dag	80	22	-72%
Reactietijd (gem.)	36u	2u	-94%
CSAT-score	7,4	8,9	+1,5pt
Avond-uren CS-team	14u/wk	0u/wk	-100%
Refund-rate	3,8%	2,1%	-1,7pp

De refund-daling is interessant: snellere reactie = minder geëscaleerde klachten. Pakketje is wel binnengekomen, of klant heeft alternatief gehoord, voordat hij refund eist.

De nuance: 8% moest worden gecorrigeerd

In maand 1 moest 8% van de auto-antwoorden door een mens worden gecorrigeerd. Voornaamste foutpatronen: AI noemde een bier dat tijdelijk uit voorraad was, of beloofde leverdatum die niet klopte met PostNL-realiteit. Allebei voorzienbaar.

We hebben de fine-tunes in week 3-4 gedaan: voorraad-data live in de prompt, PostNL-tracking als bron-of-truth voor leverdata. Tegen maand 2 was de correctie-rate gezakt naar 2%. Daarna stabiel.

Dit is een belangrijke verwachting voor elke klantenservice-AI: 6-10% correctie in week 1 is normaal. Onder 5% in week 2 is doel. Permanent onder 3% is realistisch na fine-tuning.

Drie lessen uit dit project

Bij twijfel escaleren. Een agent die te vaak escaleert spaart je nog steeds 60% werk. Een agent die te vaak gokt verliest klanten. Asymmetrisch risico.
Live data in de prompt. Voorraad, leverdatums, openingstijden — alles wat verandert moet je niet hardcoden in de prompt. Nieuwe API-calls per ticket.
Transparantie wint. "Beantwoord met AI-assistent" verlaagt CSAT niet. Klanten waarderen snelle reactie meer dan menselijk-versus-AI.

Werkt dit voor jouw webshop?

Webshops met 30+ tickets per dag zijn typisch business case. Onder 30 ticket/dag is een goed FAQ + macro-templates in Gorgias of Helpscout vaak voldoende. Wij zien wekelijks Quickscans van Shopify-shops in food, fashion en specialty retail. Patroon is herkenbaar, oplossing schaalbaar.

Doe een gratis AI Quickscan →

Case Brouwerij Vandaag: klantenservice-tickets van 80/dag naar 22

Het probleem: ambachtelijke schaalpijn

Aanpak: AI-triage, vier categorieën

De prompt-engineering: nuance per categorie

Resultaat na 12 weken

De nuance: 8% moest worden gecorrigeerd

Drie lessen uit dit project

Werkt dit voor jouw webshop?

Verder lezen

Case Renko Klimaat: van 48u/week aan offertes naar 16u

Case De Klerk: orderintake van fax en mail naar één dashboard

Case Fysiotherapie Hoorn: no-shows van 14% naar 4%

Klaar om jouw cijfers te zien?