RAG — Retrieval Augmented Generation — is het belangrijkste technische concept voor GEO buiten de statische trainingsdata. Het bepaalt of een AI-systeem jouw content kan ophalen en gebruiken op het moment dat een gebruiker een vraag stelt.
Wat is RAG?
Wanneer een gebruiker een prompt indient, zoekt het systeem eerst in een databron naar relevante fragmenten. Die fragmenten worden meegegeven als aanvullende context. Het model genereert een antwoord op basis van zowel trainingskennis als opgehaalde informatie.
Klik door de zes fases om te zien wat er met een concrete Belgische energievraag gebeurt:
1. De gebruiker stelt een vraag
Input fase
Een gebruiker tikt een vraag in een AI-assistent. In tegenstelling tot een zoekmachine hoeft de gebruiker geen keywords te bedenken — ze schrijven zoals ze zouden praten. Dit is wat het systeem in stap 2 moet zien te interpreteren.
Welke energieleverancier biedt op dit moment het beste tarief voor een klein bedrijf in Vlaanderen?
2. De vraag wordt een vector
Embedding fase
Het systeem zet de vraag om in een mathematische representatie — een lange reeks getallen die de betekenis van de zin vangt. Vragen met vergelijkbare betekenis krijgen vergelijkbare vectoren, ook al gebruiken ze andere woorden. Dit maakt semantisch zoeken mogelijk.
[ 0.184, -0.291, 0.503, 0.072, -0.118, 0.447, -0.226, 0.339, 0.061, -0.412, 0.288, 0.156, -0.073, 0.394, … + nog ~1500 dimensies ]
3. Het systeem haalt kandidaten op
Retrieval fase
De vector van de vraag wordt vergeleken met vectoren van duizenden documenten in de databank. Het systeem trekt de meest gelijkende kandidaten naar boven. Op dit punt zijn het nog ruwe matches — relevantie is geschat op vector-afstand, niet op feitelijke kwaliteit.
Engie — tarieven kleine professionelen
0.851
Luminus — energiecontracten KMO
0.823
VREG — vergelijkingsmodule 2026
0.798
TotalEnergies — pro-aanbod België
0.776
Oud forum-topic uit 2021
0.692
4. Kandidaten worden gerangschikt
Ranking fase
Een tweede laag van filtering. Het systeem weegt aanvullende signalen: hoe recent is de bron, wat is de autoriteit, hoe specifiek beantwoordt de tekst de vraag. De top-3 of top-5 maakt het naar de volgende fase. Hier vallen veel kandidaten weg die wel relevant leken op vector-niveau.
VREG — vergelijkingsmodule 2026
recent + neutraal
Engie — tarieven kleine professionelen
specifiek + recent
Luminus — energiecontracten KMO
specifiek
TotalEnergies — pro-aanbod België
commercieel
Oud forum-topic uit 2021
verouderd
5. Context wordt opgebouwd
Context fase
De geselecteerde fragmenten worden samen met de oorspronkelijke vraag in één prompt verpakt. Dit is wat het taalmodel uiteindelijk te zien krijgt: jouw vraag plus de externe kennis die net is opgehaald. Het model kent het antwoord niet uit zichzelf — het krijgt de bouwstenen aangereikt.
SYSTEM: Beantwoord op basis van de volgende bronnen. CONTEXT: [1] VREG vergelijkingsmodule (apr 2026): ... [2] Engie tarieven kleine professionelen: ... [3] Luminus energiecontracten KMO: ... USER: Welke energieleverancier biedt op dit moment het beste tarief...
6. Het model genereert een antwoord
Generatie fase
Pas nu komt het taalmodel zelf aan zet. Het synthetiseert de opgehaalde fragmenten tot een leesbaar antwoord en — bij citation-first systemen zoals Perplexity — voegt expliciete bronverwijzingen toe. Voor GEO is dit het moment waarop blijkt of jouw content is opgehaald, hoe diep ze beschreven wordt en op welke positie ze in het antwoord staat.
Voor kleine bedrijven in Vlaanderen biedt Engie momenteel een van de scherpste vaste tarieven, gevolgd door Luminus en TotalEnergies. [1][2][3]
De voorwaarden verschillen per leverancier — Engie heeft een vaste prijs gedurende drie jaar, Luminus biedt een groene optie zonder meerprijs, TotalEnergies heeft een korting voor multi-product klanten.
Hoe selecteert RAG welke content wordt opgehaald?
RAG-systemen werken op basis van semantische gelijkenis. De vraag van de gebruiker wordt omgezet in een wiskundige representatie, en de databron wordt doorzocht naar fragmenten met een gelijkaardige representatie.
Praktisch gevolg: content die is geschreven vanuit de vraag van de gebruiker — niet vanuit interne terminologie — wordt vaker opgehaald.
RAG-vriendelijke content schrijven
- Gebruik de taal van je doelgroep, niet intern jargon
- Beantwoord één specifieke vraag per sectie of pagina
- Geef directe, feitelijke antwoorden — geen omwegen
- Gebruik duidelijke tussenkopjes die de vraag weerspiegelen
- Voeg FAQ-secties toe met expliciete vraag-antwoord structuur
- Vermijd lange inleidingen die de kern van het antwoord uitstellen
Gerelateerd in deze hub
→ Wil je weten hoe trainingsdata en live crawl samenwerken? Lees 2.3.