Ga naar inhoud

RAG Design Canvas

Gebruik dit canvas om de architectuur van een Retrieval-Augmented Generation (RAG)-systeem te ontwerpen en te documenteren. Vul het in samen met de Tech Lead, Data Scientist en Context Builder.

Wanneer dit canvas invullen?

Verplicht wanneer het AI-systeem toegang krijgt tot meer dan één kennisbron (documenten, databases, API's). Zie ook de Context Builder-rol en AI Architectuur.


Download dit sjabloon

Download als Markdown — Open in je editor of AI-assistent en vul de velden in.

A. Use Case & Trigger

Veld Invullen
Gebruikersvraag Wat stelt de eindgebruiker typisch?
Trigger Wanneer wordt RAG geactiveerd? (altijd / bij lage confidence / bij specifieke trefwoorden)
Wat mag het model NIET doen? Harde Grenzen voor het retrieval-pad (bijv. nooit medisch advies geven)
Verwacht responsformaat Tekst / Tabel / JSON / Geciteerd antwoord met bronnen

B. Documentinventaris

Kennisbron Bestandsformaat Omvang (geschat) Updatefrequentie Eigenaar
[Bijv. Productcatalogus] PDF / DOCX / CSV [aantal documenten / MB] Dagelijks / Wekelijks / Statisch [naam]

Context pollution risico: Is er kans dat irrelevante bronnen de modelrespons degraderen? ☐ Ja → zie sectie G · ☐ Nee


C. Chunking Strategie

Parameter Keuze Motivatie
Split-methode ☐ Vaste grootte · ☐ Sectiegebaseerd · ☐ Alinea · ☐ Semantisch
Chunk-grootte (tokens) [bijv. 512 tokens]
Overlap (tokens) [bijv. 64 tokens]
Metadata per chunk ☐ Brontitel · ☐ Paginanummer · ☐ Datum · ☐ Auteur

Richtlijn

Gebruik sectiegebaseerde chunking bij gestructureerde documenten (rapporten, handleidingen). Gebruik vaste grootte + overlap bij doorlopende tekst. Grotere chunks geven meer context maar hogere kosten per retrieval.


D. Embedding Model

Parameter Keuze
Model [bijv. text-embedding-3-small (OpenAI) / embed-multilingual-v3 (Cohere)]
Dimensies [bijv. 1536]
Provider [bijv. OpenAI / Cohere / Hugging Face / lokaal]
Meertalig? ☐ Ja (NL + EN) · ☐ Nee
Kosten per 1M tokens [bijv. €0,02]

E. Vectorstore

Parameter Keuze
Technologie ☐ Pinecone · ☐ Weaviate · ☐ pgvector · ☐ Chroma · ☐ Qdrant · ☐ Anders: ____
Hostingmodel ☐ Cloud (managed) · ☐ Self-hosted · ☐ In-memory (dev/test)
Indexeringsstrategie ☐ Flat · ☐ HNSW · ☐ IVF
Geschatte vectorcount [bijv. 50.000 chunks]
Back-up & herstel ☐ Dagelijks · ☐ Wekelijks · ☐ n.v.t.

F. Retriever Parameters

Parameter Waarde Motivatie
Top-K [bijv. 5] Hoeveel chunks worden meegegeven aan de LLM?
Similariteitsdrempel [bijv. ≥ 0,75] Minimum cosine similarity voor opname in context
Re-ranking? ☐ Ja (model: ____) · ☐ Nee Cross-encoder re-ranking verhoogt precisie
Hybride zoeken? ☐ Ja (keyword + vector) · ☐ Nee
Max context (tokens) [bijv. 4096] Totale contextlimiet voor retrieval-output

G. Context Kwaliteit & CDL

De Context Builder beheert de Context Development Lifecycle (CDL): welke informatie is actueel, wat is verouderd?

Check Status
Is er een proces voor het verwijderen van verouderde documenten? ☐ Ja · ☐ Nee → actie vereist
Worden irrelevante chunks gefilterd vóór LLM-aanroep? ☐ Ja · ☐ Nee
Is de maximale contextgrootte bepaald (context pollution preventie)? ☐ Ja · ☐ Nee
Worden bronvermeldingen in het antwoord opgenomen? ☐ Ja · ☐ Nee
Is de Context Builder-rol toegewezen? ☐ Ja, naam: ____ · ☐ Nee — geautomatiseerd

H. Kwaliteitsmetrieken

Metriek Definitie Doelwaarde Meting
Precision@K % relevante chunks in de top-K resultaten ≥ 80% Offline evaluatie op Golden Set
Recall@K % relevante chunks teruggevonden ≥ 70% Offline evaluatie op Golden Set
Faithfulness Antwoord gebaseerd op opgehaalde context (geen hallucinatie) ≥ 90% RAGAS of handmatige beoordeling
Answer Relevance Antwoord relevant voor de gestelde vraag ≥ 85% RAGAS of handmatige beoordeling
Latency (p95) (95e percentiel — 95% van alle verzoeken is sneller dan deze waarde) Retrieval + generatie tijd \< 3 seconden Productie monitoring

I. Kosteninschatting

Kostenpost Eenheid Geschat volume/maand Eenheidsprijs Maandkosten (€)
Embedding (initieel) per 1M tokens [eenmalig]
Embedding (updates) per 1M tokens/maand
Vectorstore opslag per GB/maand
LLM-inferentie (retrieval) per 1M tokens
Totaal (maand)

Zie ook: Kostenoptimalisatie en GAINS™ framework voor ROI-koppeling.


J. Goedkeuring

Rol Naam Datum Handtekening
Tech Lead
Data Scientist
Context Builder
Guardian

Gerelateerde modules: