AI-content SEO-penalty: wat Google daadwerkelijk bestraft

Samenvatting: Google heeft nooit een ‘AI-penalty’ uitgerold. De core- en spam-updates van maart 2024 pakken grootschalig contentmisbruik en niet-helpend materiaal aan, ongeacht de productiemethode. Het risico zit dus niet in het gebruik van AI voor een blogconcept, maar in het zonder oordeel publiceren op grote schaal. Los dat beoordelingsprobleem op en de AI-vraag verdwijnt grotendeels.

Ik beheer een AI-contentpipeline als product. Het is onderdeel van SEOJuice, levert concepten aan onze eigen blog en heeft de afgelopen twee jaar zowel echt goede artikelen als stukken opgeleverd die nooit gepubliceerd hadden mogen worden. Als een klant me vraagt: “krijgen we straf van Google omdat we AI gebruiken?”, geef ik geen ontwijkend antwoord. Ik vertel wat we zien wanneer angst voor een AI-penalty tot een site-audit leidt: de pagina’s die geraakt worden zijn dun, repetitief en massaal geproduceerd; ze zouden ook geraakt zijn als een mens elk woord had getypt.

Dit is een herschreven versie. De eerdere editie verzon een “Helpful-Content-update van maart 2025” en een Google-term “AI-assisted keyword noise”. Die bestaan niet. Ik zet het recht, want het hele punt van schrijven over penalties is juistheid.

Er is geen ‘AI-penalty’ — er is een beleid tegen misbruik van geschaalde content

Laten we de mythe eerst slopen, want hij blijft muteren. Er was geen aparte ‘AI-penalty’ en geen “Helpful-Content-update van maart 2025”. Wat wél gebeurde: in maart 2024 integreerde Google het Helpful-Content-systeem in het core-algoritme en kwamen er nieuwe spambeleidsregels bij. De relevante heet scaled content abuse.

Zo definieert Google het, letterlijk vanaf hun spambeleid-pagina:

Scaled content abuse is when many pages are generated for the primary purpose of manipulating search rankings and not helping users. This abusive practice is typically focused on creating large amounts of unoriginal content that provides little to no value to users, no matter how it's created.

Lees die laatste clausule twee keer: no matter how it's created. Het beleid maakt niet uit of een robot, een freelancer of jij om 2 uur ’s nachts de pagina schreef. Het gaat om schaal plus geen waarde. Toen Google de update van maart 2024 aankondigde, zeiden ze het expliciet: “We versterken ons beleid rond de praktijk om op schaal content te produceren om rankings te beïnvloeden — of dat nu met automatisering, mensen of een mix gebeurt.”

Timeline correcting the AI penalty myth: March 2024 core update with Helpful Content folded in and the scaled content abuse spam policy, versus the fabricated March 2025 update that never happened. — De werkelijke tijdlijn: er was geen “Helpful-Content-update van maart 2025”. Helpful Content is opgenomen in de core-update van maart 2024, samen met het spambeleid tegen scaled-content-abuse.

Dan de data, want “geloof me” is geen argument. Ahrefs onderzocht circa 600 000 pagina’s over 100 000 zoekwoorden en mat hoeveel AI-gegenereerde content elke rankingpagina bevatte versus haar positie. Hun conclusie: “We berekenden de correlatie tussen AI-contentpercentage en rankingpositie over de hele dataset. De correlatie was 0,011, effectief nul.” (Ahrefs is concurrent, dus ik noem ze maar link niet. Het getal staat.)

Chart of Ahrefs 600,000-page study showing a near-zero 0.011 correlation between a page's AI-content percentage and its Google ranking position. — Bij ~600 000 pagina’s was de correlatie tussen het AI-contentpercentage en de rankingpositie 0,011 — statistisch verwaarloosbaar. Bron: Ahrefs-studie.

Nul correlatie. Als AI-gebruik een rankingfactor was (positief of negatief), stond daar geen 0,011. Een tweede studie wijst dezelfde kant op: Rankability analyseerde de top 487 Google-resultaten met Originality.ai en vond dat 83% ‘origineel’ scoorde (niet-AI). Klein staal, één detector, dus indicatief maar niet definitief. Toch zijn beide conclusies consistent: auteurschap is niet doorslaggevend. Inzet en originaliteit wel.

(Wees eerlijk: correlatiestudies zien Googles eigen classifier niet, en ik ook niet. Ze tonen wel dat het simpele verhaal “AI-content krijgt straf” sneuvelt bij een grote dataset. Dat is genoeg om de mythe te begraven.)

Wat Google wél en niet afstraft

Als het niet om het hulpmiddel gaat, waar dan om? Het verschil ligt tussen content die iets toevoegt en content die alleen maar pagina’s toevoegt. Ik denk er het liefst in patronen: gedragingen die richting scaled-content-abuse glijden versus de verantwoorde versie van dezelfde workflow.

Penalty-valkuil	Hoe het eruitziet	Verantwoorde workflow
Massale auto-generatie	Een bureau zet ’s nachts 800 bijna identieke “[dienst] in [stad]”-pagina’s live voor lokale long-tail	Publiceer alleen de steden die je echt bedient, met echte lokale details per pagina, op een tempo dat je kunt verdedigen
Geen information gain	Een AI-concept herhaalt de top 3 SERP-resultaten zonder data, voorbeelden of standpunt toe te voegen	Elke post biedt iets dat de SERP nog niet heeft: je data, je test, je mening
Eentonigheid op schaal	50 blogposts met dezelfde intro, overgangen en slot; alleen de zoekwoorden verschillen	Pasje de structuur aan het betoog aan; een AI-concept is een startpunt, niet het eindproduct
Gefabriceerde autoriteit	Verzonnen statistieken, nepquotes, “onderzoek toont aan” zonder onderzoek (precies de fout van de oude versie van dit artikel)	Citeer bij naam, verifieer quotes, markeer schattingen als schatting
Doorway-achtige schaal	Duizenden dunne pagina’s die naar één conversiepunt leiden, zonder zelfstandige waarde	Elke pagina verdient zijn indexplek op eigen merites

De linkerkolom is wat sites uit de index kegelde na maart 2024. Search Engine Journal volgde 49 345 domeinen; 837 verdwenen volledig uit Google en 100% daarvan toonde AI-sporen, 50% bestond voor 90–100% uit AI-posts. Dat klinkt als een AI-penalty tot je goed leest: dit waren geen sites die hier en daar AI-concepten gebruikten. Het waren vrijwel volledig geautomatiseerde contentfarms. Schaal plus geen waarde. AI was het middel; misbruik de schaal.

(Die statistiek is detector-gebaseerd en correlatief, dus ik neem ’m niet blind over. Maar de vorm is duidelijk. De gedeïndexeerde sites waren niet “sites die AI gebruikten”. Ze waren vrijwel niks anders dán AI, op volume, zonder iets te melden.)

Daarom blijf ik terugkomen op content-refresh-strategie als men mij vraagt naar AI-risico. Een bestaande post bijwerken en verdiepen — information gain toevoegen aan een bestaande URL — is bijna het perfecte omgekeerde van scaled abuse. Je concentreert waarde in plaats van die te verdunnen over duizend dunne pagina’s.

Hoe “AI-gevulde blogcontent” écht misgaat

Dit stuk kan een enquête of correlatiestudie niet schrijven, want die draaien geen pipeline. Wij wel. Twee mensen bouwen SEOJuice en publiceren AI-assisted artikelen op ons eigen domein, inclusief dit stuk, dat meerdere menselijke rondes zag voor je het leest. Toen we eerder dit jaar van .io naar .com migreerden, inspecteerden we elke pagina, en juist die content-ops-blik levert de echte lessen.

De meest voorkomende manier waarop een AI-concept richting penalty gaat, is geen information gain. Het model leest de top van de SERP en maakt een competent synthese. Competent. Synthese. Van wat al rankt. Google kan alles in dat concept al vinden. Het is stiekem erger dan spam, want het oogt prima. Bij een scan valt niets op. Het heeft alleen geen bestaansrecht. We vangen ze als het concept geen cijfer, voorbeeld of stelling bevat waar iemand het oneens mee kan zijn.

En nu het punt dat externe studies niet zien omdat het uit onze blog komt. Tijdens de migratie keken we naar posts die stilletjes waren weggezakt. Het patroon verraste me. De verliezers waren niet disproportioneel de AI-assisted drafts. Het waren de stukken die we overhaast zonder echte eindredactie hadden gepubliceerd, AI of niet. Ook een paar volledig handgeschreven, maar gehaast, vielen in die bak. Geen strak experiment, klein staal, maar het strookt exact met de Ahrefs-correlatie: het gereedschap was niet de variabele. De redactieslag wel.

De tweede fout is eentonigheid. Eén AI-artikel is prima. Twintig AI-artikelen in exact dezelfde vorm gaan rijmen: drie-zins alinea’s, “ten eerste, ten tweede, tot slot”, een keurig einde. Individueel oké. Als corpus leest het als gegenereerd, en zo’n corpus is precies het signaal waarop scaled-content-abuse is gebouwd. Oplossing: een mens besluit dat twee van die twintig niet gepubliceerd worden. Een betere prompt redt het niet.

(Eerlijk: dit stoort me nog steeds. Eentonigheid is het lastigst te automatiseren, omdat elk stuk op zichzelf aanvaardbaar lijkt. Je ziet het pas na tien op een rij, en het model leest nooit tien op een rij.)

De derde is fabricatie, direct voorbeeld: dit artikel. De eerdere versie verzon een complete Google-update en jargon, en niemand checkte de bron. Dat is de variant die de meeste reputatieschade doet; één verzonnen statistiek vergiftigt al het omliggende vertrouwen. Onze pipeline heeft links naar niet-bestaande pagina’s verbeeld en “onderzoeken” aangehaald die parafrases van parafrases bleken. We verifiëren nu elke quote bij de primaire bron voor publicatie, daarom staat elk extern cijfer hier bij naam.

Hoe gebruiken we AI zonder dat te veroorzaken? Door het concept als goedkoop te zien en het oordeel als duur. We zetten AI in voor een snelle, gestructureerde eerste versie; daarna voegt een mens het leeswaardige toe — en, minstens zo belangrijk, schrapt de concepten die dat niet hebben. Meer daarover in AI gebruiken zonder je merkstem te verliezen. De korte versie: de tool schrijft, de mens beslist.

Nog een observatie, minder zeker. De AI-concepten die onze review overleven, mikken vaak op een heel specifieke zoekintentie in plaats van een breed keyword. “Beantwoord deze vraag voor deze lezer” geeft ruggengraat; “schrijf over [onderwerp]” levert synthese. Ik denk (al kan ik het niet zuiver aantonen) dat semantische SEO en zoekintentie stroomopwaarts zitten van het hele kwaliteitsprobleem. Als de intentie klopt, is de information-gainvraag half beantwoord.

De pre-publish-checklist die wij echt gebruiken

Dit is de operationele laag. Voor een AI-assisted concept live gaat, passeert het deze poorten. Geen detecteren van AI; ze garanderen dat de pagina haar plek verdient, het enige dat scaled-content-abuse meet.

Poort	Controle	Waarom het telt
1. Information gain	Voegt dit data, voorbeeld of standpunt toe dat de SERP mist?	“Little to no value” is letterlijk de definitie van scaled abuse. Geen gain = geen index-reden.
2. Fact-check	Elke statistiek naar primaire bron; elke quote woordelijk geverifieerd	Fabricatie breekt vertrouwen bij lezer én algoritme. AI hallucineert overtuigend.
3. Dedup-scan	Kannibaliseert dit een bestaande post of herhaalt het eigen corpus?	Onorigineel tegenover jezelf is nog steeds onorigineel. Update de oude pagina.
4. Externe citations	Bij naam genoemde bronnen, gelinkt waar toegestaan	Toont dat de content in de werkelijkheid is verankerd, niet verzonnen.
5. Interne-linkgezondheid	Elke interne link werkt; geen verzonnen slugs	AI verzint plausibele URL’s. Kapotte links tonen dat niemand checkte.
6. Originaliteit / toon	Klinkt het als een persoon met een standpunt, niet als synthese?	Eentonigheid in een corpus is het signaal dat scaled abuse wil vangen.
7. E-E-A-T-fundering	Eerstehands ervaring of benoemde expertise zichtbaar in de tekst	Ervaring is het moeilijkst te faken en het makkelijkst te belonen.
8. Menselijke read-through	Een persoon leest alles en kan publicatie verdedigen	De publicatiebeslissing is de poort waar AI niet doorheen kan.

Poort 7 verdient een aparte zin. E-E-A-T gaat erom dat de pagina laat zien dat iemand met echte kennis het schreef of nalas. Het is geen meta-tag die je achteraf plakt. Reële, verifieerbare feiten citeren en claims onderbouwen is het grootste deel; ik ga dieper in op de mechaniek in knowledge-based trust and facts.

(Eerlijk over de grenzen: deze checklist werkt voor een tweekoppig team dat enkele artikelen per week publiceert. Ik weet niet hoe soepel het schaalt bij een bureau dat elke maand honderden klantpagina’s uitrolt, waar poort 8 — de menselijke read-through — als eerste breekt.)

Beheer je content over veel klantsites? Doe dan niet alsof je elke pagina leest; dat doe je niet. Automatiseer poorten 1–5 (information gain, fact-check, dedup, citations, interne links) op elk concept, en steek poorten 6–8 steekproefsgewijs: pak willekeurig 15–20% van de wekelijkse output per klant, plus elke pagina op een money keyword, en lees die goed. De automatische poorten vangen mechanische fouten op volume; de menselijke steekproef pakt eentonigheid en ontbrekend oordeel vóór een heel klantcorpus gaat rijmen. De pagina die je uit de index kegelt, is zelden degene die je nakeek.

SEOJuice content-quality audit flagging a low-information-gain blog page with thin content and missing citations. — Een content-kwaliteitsaudit in SEOJuice markeert een dunne, low-information-gain pagina: precies het type post dat richting scaled-content-abuse glijdt. Bron: SEOJuice.

Wil je deze checklist niet handmatig draaien, dan doen onze content-kwaliteits- en audittools dat: ze halen de dunne, dubbele en ongefundeerde pagina’s boven water zodat een mens kan besluiten wat te fixen of te schrappen. Voer je site door een gratis SEO-audit om te zien welke pagina’s deze poorten niet halen. (Het is dezelfde scan die we op onze eigen blog draaien vóór publicatie.)

Veelgestelde vragen

Kan ik ChatGPT gebruiken voor blogposts als ik ze daarna bewerk?

Ja. Er is geen verbod op AI-assisted drafting; Googles beleid richt zich op grootschalige, waardeloze content “ongeacht hoe die is gemaakt”. Bewerken is cruciaal omdat je daar information gain, nauwkeurigheid en perspectief toevoegt die de pagina index-waardig maken. Het gaat niet om het verbergen van de AI. Een zwaar bewerkt AI-concept en een licht bewerkt concept worden op dezelfde manier beoordeeld: naar wat ze de lezer bieden.

Bestraft Google AI-content direct?

Nee. In de Ahrefs-studie van ~600 000 pagina’s was de correlatie tussen AI-percentage en ranking 0,011, praktisch nul. Google straft scaled content abuse en onbehulpzame content, niet het auteurschap. De sites die na maart 2024 gedeïndexeerd werden, waren vrijwel volledig geautomatiseerde contentfarms, niet sites die hier en daar een AI-concept gebruikten.

Hoeveel AI-geschreven pagina’s zijn “te veel” om tegelijk te publiceren?

Er is geen officieel aantal. Volume zonder waarde triggert het risico. Honderd echt nuttige, onderscheidende pagina’s zijn prima; tien dunne, inwisselbare zijn het probleem. Kun je niet eerlijk zeggen dat elke pagina iets toevoegt wat de SERP mist, dan ben je de grens al over, welk aantal dan ook.

Beschermen interne links of schema AI-content tegen penalties?

Nee. Interne links en structured data helpen vindbaarheid en presentatie, maar maken dunne content niet waardevol. Het is hygiëne, geen schild. Een goed gelinkte pagina zonder information gain blijft een lege kamer met nette leidingen.

Wat is hier het verschil tussen een handmatige en een algoritmische actie?

Een algoritmische actie (zoals een core- of spam-update) wijzigt rankings automatisch en herstelt automatisch zodra de onderliggende content verbetert en Google die opnieuw verwerkt. Een handmatige actie is een menselijke reviewer die je site markeert; dit zie je in Search Console en vergt een verzoek tot heroverweging nadat je het probleem oplost. De meeste AI-contentproblemen zijn algoritmisch: rankings zakken stilletjes weg en de remedie is verbeteren of snoeien, niet in beroep gaan.

Gerelateerd lezen:

Our powerful suite of automation tools for SEO

Learn, discover, and get inspired by our content