Brouwerij Vandaag had 80 supporttickets per dag op hun Shopify webshop. Twee mensen werkten 's avonds door, klanten wachtten 36 uur op antwoord. We hebben een AI-triagelaag gebouwd die 4 categorieën auto-afhandelt. Reactietijd van 36 uur naar 2 uur, 72% minder handmatige tickets, CSAT van 7,4 naar 8,9.
Het probleem: ambachtelijke schaalpijn
Brouwerij Vandaag (ambachtelijk speciaalbier, Noord-Holland) zat in een goed probleem: webshop liep harder dan verwacht. 80 tickets per dag in piekmaanden (Sinterklaas, kerst, vaderdag). Twee customer-service-mensen, beide parttime, eindigden hun dag met 40 ongelezen tickets in de inbox.
Klanten wachtten gemiddeld 36 uur op een eerste reactie. Voor een €45-bestelling met cadeau-deadline is dat te lang. Refund-verzoeken stapelden op, recensies daalden, herhaalaankopen liepen terug.
De drie founders wilden niet meer mensen aannemen voor een seizoenspiek. Logisch — vast personeel voor 3 maanden piek per jaar is dure verzekering.
Aanpak: AI-triage, vier categorieën
We hebben de inkomende mailbox op support@brouwerijvandaag.nl onderschept met een n8n-flow. Elke nieuwe mail door GPT classificeren in vier categorieën:
- Order-status (ca 41% van tickets): "Waar is mijn pakketje?" — auto-respons met track-and-trace en geschatte aankomst. Volledig automatisch.
- Retour (12%): klant geeft retourreden. AI genereert retour-instructies en label, mens reviewt voor verzending. Half-automatisch.
- Product-info (29%): "Welk bier past bij Indiaas eten?" — AI antwoordt op basis van product-database en eerdere klant-gesprekken. Volledig automatisch.
- Klacht (18%): scherpe toon, refund-verzoek, kapot pakket. Direct escaleren naar mens. Geen auto-actie.
Elk auto-antwoord heeft een handtekening: "Beantwoord met hulp van onze AI-assistent. Niet correct? Reply, dan kijkt een mens mee." Transparant en veilig.
De prompt-engineering: nuance per categorie
De classifier-prompt is strak: "Geef exact één van: ORDER, RETOUR, INFO, KLACHT. Bij twijfel: KLACHT (escalatie is veilig, valse positives kosten alleen tijd, valse negatives kosten klant)." Bij twijfel altijd richting menselijke check.
Per categorie een eigen response-prompt. Voor ORDER: "Antwoord max 60 woorden. Begin met track-and-trace. Sluit af met 'Thuis blijft het bier goed tot [houdbaarheidsdatum]'. Onderteken met 'Team Brouwerij Vandaag'." Korte, vriendelijke, on-brand.
Voor INFO is het complexer. We hebben de hele product-catalog (47 bieren, smaakprofielen, food pairings) in de prompt-context geladen. AI antwoordt op basis daarvan. Als de vraag buiten de scope valt: "Ik weet het niet zeker. Een collega kijkt mee binnen 4 uur." Geen gokwerk.
"De eerste week was eng. We controleerden elk auto-antwoord. Tegen week 3 zaten we te giechelen — 'die had ik beter geantwoord dan zelf'."Marketing-lead Brouwerij Vandaag
Resultaat na 12 weken
| Metric | Voor | Na | Delta |
|---|---|---|---|
| Handmatige tickets/dag | 80 | 22 | -72% |
| Reactietijd (gem.) | 36u | 2u | -94% |
| CSAT-score | 7,4 | 8,9 | +1,5pt |
| Avond-uren CS-team | 14u/wk | 0u/wk | -100% |
| Refund-rate | 3,8% | 2,1% | -1,7pp |
De refund-daling is interessant: snellere reactie = minder geëscaleerde klachten. Pakketje is wel binnengekomen, of klant heeft alternatief gehoord, voordat hij refund eist.
De nuance: 8% moest worden gecorrigeerd
In maand 1 moest 8% van de auto-antwoorden door een mens worden gecorrigeerd. Voornaamste foutpatronen: AI noemde een bier dat tijdelijk uit voorraad was, of beloofde leverdatum die niet klopte met PostNL-realiteit. Allebei voorzienbaar.
We hebben de fine-tunes in week 3-4 gedaan: voorraad-data live in de prompt, PostNL-tracking als bron-of-truth voor leverdata. Tegen maand 2 was de correctie-rate gezakt naar 2%. Daarna stabiel.
Dit is een belangrijke verwachting voor elke klantenservice-AI: 6-10% correctie in week 1 is normaal. Onder 5% in week 2 is doel. Permanent onder 3% is realistisch na fine-tuning.
Drie lessen uit dit project
- Bij twijfel escaleren. Een agent die te vaak escaleert spaart je nog steeds 60% werk. Een agent die te vaak gokt verliest klanten. Asymmetrisch risico.
- Live data in de prompt. Voorraad, leverdatums, openingstijden — alles wat verandert moet je niet hardcoden in de prompt. Nieuwe API-calls per ticket.
- Transparantie wint. "Beantwoord met AI-assistent" verlaagt CSAT niet. Klanten waarderen snelle reactie meer dan menselijk-versus-AI.
Werkt dit voor jouw webshop?
Webshops met 30+ tickets per dag zijn typisch business case. Onder 30 ticket/dag is een goed FAQ + macro-templates in Gorgias of Helpscout vaak voldoende. Wij zien wekelijks Quickscans van Shopify-shops in food, fashion en specialty retail. Patroon is herkenbaar, oplossing schaalbaar.