2.2 RAG uitgelegd

RAG — Retrieval Augmented Generation — is het belangrijkste technische concept voor GEO buiten de statische trainingsdata. Het bepaalt of een AI-systeem jouw content kan ophalen en gebruiken op het moment dat een gebruiker een vraag stelt.

Wat is RAG?

Wanneer een gebruiker een prompt indient, zoekt het systeem eerst in een databron naar relevante fragmenten. Die fragmenten worden meegegeven als aanvullende context. Het model genereert een antwoord op basis van zowel trainingskennis als opgehaalde informatie.

Klik door de zes fases om te zien wat er met een concrete Belgische energievraag gebeurt:

1. De gebruiker stelt een vraag

Input fase

Een gebruiker tikt een vraag in een AI-assistent. In tegenstelling tot een zoekmachine hoeft de gebruiker geen keywords te bedenken — ze schrijven zoals ze zouden praten. Dit is wat het systeem in stap 2 moet zien te interpreteren.

Welke energieleverancier biedt op dit moment het beste tarief voor een klein bedrijf in Vlaanderen?

2. De vraag wordt een vector

Embedding fase

Het systeem zet de vraag om in een mathematische representatie — een lange reeks getallen die de betekenis van de zin vangt. Vragen met vergelijkbare betekenis krijgen vergelijkbare vectoren, ook al gebruiken ze andere woorden. Dit maakt semantisch zoeken mogelijk.

[ 0.184, -0.291, 0.503, 0.072, -0.118, 0.447, -0.226, 0.339, 0.061, -0.412, 0.288, 0.156, -0.073, 0.394, … + nog ~1500 dimensies ]

3. Het systeem haalt kandidaten op

Retrieval fase

De vector van de vraag wordt vergeleken met vectoren van duizenden documenten in de databank. Het systeem trekt de meest gelijkende kandidaten naar boven. Op dit punt zijn het nog ruwe matches — relevantie is geschat op vector-afstand, niet op feitelijke kwaliteit.

Engie — tarieven kleine professionelen

0.851

Luminus — energiecontracten KMO

0.823

VREG — vergelijkingsmodule 2026

0.798

TotalEnergies — pro-aanbod België

0.776

Oud forum-topic uit 2021

0.692

4. Kandidaten worden gerangschikt

Ranking fase

Een tweede laag van filtering. Het systeem weegt aanvullende signalen: hoe recent is de bron, wat is de autoriteit, hoe specifiek beantwoordt de tekst de vraag. De top-3 of top-5 maakt het naar de volgende fase. Hier vallen veel kandidaten weg die wel relevant leken op vector-niveau.

VREG — vergelijkingsmodule 2026

recent + neutraal

Engie — tarieven kleine professionelen

specifiek + recent

Luminus — energiecontracten KMO

specifiek

TotalEnergies — pro-aanbod België

commercieel

Oud forum-topic uit 2021

verouderd

5. Context wordt opgebouwd

Context fase

De geselecteerde fragmenten worden samen met de oorspronkelijke vraag in één prompt verpakt. Dit is wat het taalmodel uiteindelijk te zien krijgt: jouw vraag plus de externe kennis die net is opgehaald. Het model kent het antwoord niet uit zichzelf — het krijgt de bouwstenen aangereikt.

SYSTEM: Beantwoord op basis van de volgende bronnen.

CONTEXT:
[1] VREG vergelijkingsmodule (apr 2026): ...
[2] Engie tarieven kleine professionelen: ...
[3] Luminus energiecontracten KMO: ...

USER: Welke energieleverancier biedt op dit moment het beste tarief...

6. Het model genereert een antwoord

Generatie fase

Pas nu komt het taalmodel zelf aan zet. Het synthetiseert de opgehaalde fragmenten tot een leesbaar antwoord en — bij citation-first systemen zoals Perplexity — voegt expliciete bronverwijzingen toe. Voor GEO is dit het moment waarop blijkt of jouw content is opgehaald, hoe diep ze beschreven wordt en op welke positie ze in het antwoord staat.

Voor kleine bedrijven in Vlaanderen biedt Engie momenteel een van de scherpste vaste tarieven, gevolgd door Luminus en TotalEnergies. [1][2][3]

De voorwaarden verschillen per leverancier — Engie heeft een vaste prijs gedurende drie jaar, Luminus biedt een groene optie zonder meerprijs, TotalEnergies heeft een korting voor multi-product klanten.

Hoe selecteert RAG welke content wordt opgehaald?

RAG-systemen werken op basis van semantische gelijkenis. De vraag van de gebruiker wordt omgezet in een wiskundige representatie, en de databron wordt doorzocht naar fragmenten met een gelijkaardige representatie.

Praktisch gevolg: content die is geschreven vanuit de vraag van de gebruiker — niet vanuit interne terminologie — wordt vaker opgehaald.

RAG-vriendelijke content schrijven

  • Gebruik de taal van je doelgroep, niet intern jargon
  • Beantwoord één specifieke vraag per sectie of pagina
  • Geef directe, feitelijke antwoorden — geen omwegen
  • Gebruik duidelijke tussenkopjes die de vraag weerspiegelen
  • Voeg FAQ-secties toe met expliciete vraag-antwoord structuur
  • Vermijd lange inleidingen die de kern van het antwoord uitstellen

Gerelateerd in deze hub