AI-crawler user agents: complete lijst 2026

AI-crawler user agents: de complete lijst voor 2026

Welke AI-crawlers bezoeken uw website zonder dat u het weet?

Uw website krijgt dagelijks bezoek van bots die u niet ziet in Google Analytics. GPTBot, ClaudeBot, PerplexityBot en Google-Extended crawlen uw pagina's om AI-modellen te trainen en antwoorden te genereren. Het verschil met traditionele zoekmachine-crawlers? Deze bots bepalen of uw merk straks wel of niet wordt genoemd in AI-antwoorden.

Zonder inzicht in welke AI-crawlers actief zijn, verliest u de controle over uw AI-zichtbaarheid.

In dit referentie-artikel vindt u de complete lijst van alle relevante AI-crawler user agents voor 2026, inclusief hun functie en hoe u ze beheert via uw robots.txt en llms.txt.

De complete lijst van AI-crawler user agents voor 2026

Onderstaande tabel bevat alle bekende AI-crawler user agents die momenteel actief websites crawlen. Gebruik deze lijst als referentie bij het configureren van uw technische GEO-setup.

User Agent	Eigenaar	Primaire functie	Actief sinds
GPTBot	OpenAI	Training en real-time antwoorden ChatGPT	2023
OAI-SearchBot	OpenAI	ChatGPT Search resultaten	2024
ChatGPT-User	OpenAI	Real-time browsing door ChatGPT	2023
ClaudeBot	Anthropic	Training Claude-modellen	2023
PerplexityBot	Perplexity AI	Real-time zoekresultaten Perplexity	2023
Google-Extended	Google	Training Gemini en AI Overviews	2023
Googlebot	Google	Indexering en AI Overviews	2004
Bytespider	ByteDance	Training AI-modellen (TikTok)	2022
CCBot	Common Crawl	Open dataset voor AI-training	2011
Applebot-Extended	Apple	Apple Intelligence features	2024
Meta-ExternalAgent	Meta	Training Meta AI-modellen	2024
Amazonbot	Amazon	Alexa en Amazon AI-diensten	2022
cohere-ai	Cohere	Training enterprise AI-modellen	2024

Deze lijst is een momentopname. Nieuwe crawlers verschijnen regelmatig. Wilt u automatisch checken welke bots uw site kunnen bereiken? De GrowthScope Quickscan valideert dit binnen 2 tot 5 minuten, zonder account of API-keys.

Wat doet elke AI-crawler precies?

Niet alle AI-crawlers zijn gelijk. Het onderscheid zit in het verschil tussen training en retrieval.

Training-crawlers

GPTBot, ClaudeBot, Bytespider en CCBot verzamelen content om AI-modellen te trainen. Uw teksten worden verwerkt in het kennisbestand van het model. Blokkeren betekent dat uw content niet in toekomstige modelversies terechtkomt, maar heeft geen direct effect op huidige antwoorden.

Retrieval-crawlers

OAI-SearchBot, ChatGPT-User en PerplexityBot halen real-time informatie op om actuele antwoorden te genereren. Als u deze crawlers blokkeert, verdwijnt uw merk direct uit de zoekresultaten van deze platformen. Dit is het meest impactvolle onderscheid voor uw AI-zichtbaarheid.

Hybride crawlers

Google-Extended en Googlebot opereren op het snijvlak. Googlebot is essentieel voor reguliere indexering en voedt tegelijk de AI Overviews. Google-Extended is specifiek voor Gemini-training. Blokkeer nooit Googlebot, tenzij u ook uit de reguliere zoekresultaten wilt verdwijnen.

Hoe configureert u uw robots.txt voor AI-crawlers?

De robots.txt is uw eerste verdedigingslinie. Hieronder vindt u een referentie-configuratie die u direct kunt implementeren.

Voorbeeld: alle AI-crawlers toestaan (aanbevolen voor maximale zichtbaarheid)

User-agent: GPTBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: OAI-SearchBot
Allow: /

Voorbeeld: training-crawlers blokkeren, retrieval toestaan

User-agent: GPTBot
Disallow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: ClaudeBot
Disallow: /

User-agent: PerplexityBot
Allow: /

Wees bewust: een robots.txt-fout kan uw volledige AI-aanwezigheid uitschakelen. De GrowthScope audit valideert uw configuratie automatisch en genereert een llms.txt template als aanvulling op uw robots.txt.

Waarom llms.txt een aanvulling is op robots.txt

De robots.txt vertelt crawlers wat ze mogen en niet mogen. Het llms.txt-bestand gaat een stap verder. Het vertelt AI-modellen wat uw organisatie doet, welke pagina's de meeste waarde bevatten en hoe uw merk correct wordt beschreven.

Beschouw het als volgt:

robots.txt regelt toegang (ja of nee)
llms.txt regelt context (wie bent u, wat biedt u aan)

Beide bestanden samen vormen de technische basis van uw Generative Engine Optimization.

Zonder llms.txt mist de AI-crawler de context om uw merk correct te citeren in antwoorden.

Veelgemaakte fouten bij het beheren van AI-crawlers

De volgende configuratiefouten zien we regelmatig in GrowthScope-audits:

Wildcard blokkade: Een Disallow: / voor alle user agents blokkeert ook AI-crawlers, waardoor uw merk volledig onzichtbaar wordt voor AI-engines.
Google-Extended verwarren met Googlebot: Het blokkeren van Googlebot verwijdert u uit alle Google-resultaten, niet alleen uit AI Overviews.
Retrieval-bots blokkeren: GPTBot blokkeren terwijl OAI-SearchBot en ChatGPT-User niet expliciet worden toegestaan. Resultaat: geen real-time zichtbaarheid in ChatGPT.
Geen monitoring: AI-crawlers worden regelmatig bijgewerkt of hernoemd. Zonder periodieke validatie raakt uw configuratie verouderd.

Wilt u deze fouten voorkomen? Neem contact op voor een persoonlijke toelichting, of start direct een scan op growthscope.io.

Volgende stap: valideer uw AI-crawler configuratie

U heeft nu de complete referentielijst van AI-crawler user agents voor 2026. De vraag is niet of deze bots uw site bezoeken. De vraag is of ze de juiste content vinden en uw merk correct citeren.

Start uw GrowthScope audit en ontvang binnen 10 minuten een volledig rapport met uw GEO Readiness Score, robots.txt-validatie en een kant-en-klaar llms.txt template.

AI-crawler user agents: de complete lijst voor 2026

AI-crawler user agents: de complete lijst voor 2026

Welke AI-crawlers bezoeken uw website zonder dat u het weet?

De complete lijst van AI-crawler user agents voor 2026