Join our community of websites already using SEOJuice to automate the boring SEO work.
See what our customers say and learn about sustainable SEO that drives long-term growth.
Explore the blog →TL;DR: AI-detectors zijn te rumoerig om “verslaan” als doel te nemen — Sadasivan et al. (2023) toonden dat recursief parafraseren elke geteste detectorklasse ineen laat storten (sommige tot 15–25 % nauwkeurigheid) en OpenAI trok in juli 2023 zijn eigen classifier terug. Wat telt is dat het concept leest alsof jij het schreef. AI-teksten vertonen een handvol vaste mechanische signalen: overmatig gebruik van em-dashes, antitheseketens, uniforme haakjes, voorzichtige openers, lineaire structuur en vage voornaamwoord-overgangen. Elk heeft een deterministische oplossing. Daarna scheiden de echte oordelen (claims checken, generieke voorbeelden vervangen door specifieke, citaten schrappen die je niet kunt herleiden) een bewerkt concept van zomaar wéér een AI-concept. Reken dertig minuten per stuk voor de volledige ronde.
Ik bewerk twee à drie AI-concepten per week: mijn eigen teksten die ik door een model haal voor compressie, concepten van een freelancer voor akkoord, en af en toe een stuk dat ik in een model begon en met de hand afmaakte. De detectorvraag kwam twee keer langs vorige maand. Beide keren was het antwoord hetzelfde: negeer de detector, bewerk de tekst.
Die vraag klinkt luider dan nodig omdat de tools zekerheid verkopen die ze niet hebben. Een paper van de University of Maryland (2023) stressteste de beste classifiers na een recursieve parafrase-ronde. De dalingen waren fors. De retrieval-detector zakte van 100 % naar 25 % nauwkeurigheid. DetectGPT’s AUROC ging van 82 % naar 18 %. Watermark-detectors, zogenaamd de robuuste variant, vielen van 99 % true-positive naar 15 % na vijf rondes. Het patroon: een dun laagje parafraseren breekt ze allemaal.

OpenAI trok zijn AI Text Classifier in juli 2023 terug wegens “lage nauwkeurigheid” — het hulpprogramma ving maar 26 % AI-tekst en bestempelde 9 % menselijke tekst onterecht als AI. Liang et al. (Stanford, 2023) rapporteerden gemiddeld 61 % vals-positieven bij niet-native Engelse TOEFL-schrijvers; een niet-native schrijver met een rasechte human draft wordt dus vaak geflagd. Dat maakt detectors niet nutteloos, maar wel tot een lawaaierige second opinion, geen optimalisatiedoel.
De herformulering is simpel: het enige signaal dat telt is of een mens na lezen zegt “dit klinkt als AI”. Los je dat op, dan zakt de detectorvraag mee. Het grootste deel is puur mechanisch op te lossen.
Na zo’n tweehonderd AI-concepten (Claude, GPT-4-familie, Gemini) door 2024 en 2026 verschijnen steeds dezelfde zes patronen in zulke dichtheid dat een lezer ze als AI herkent. Modelafwijkingen bestaan (Claude houdt meer van antithese; GPT over-hedged), maar de zes zijn model-stabiel genoeg om als één lijst te onderwijzen.

Waarom zes en niet twaalf? Elke lange lijst met “AI-tells” valt hierop terug zodra je vraagt welk patroon lezers echt opvalt versus puur stijlvoorkeuren. Staat jouw concept laag op deze zes, dan leest het al menselijk. Heeft het er vier of meer, dan redt geen enkele poetsbeurt de overige twintig stijltips.
Open deze tabel in een tweede tab tijdens het redigeren. Links staat het signaal, midden hoe het eruitziet, rechts de fix en de drempel.
| Signaal | Uiterlijk | Fix |
|---|---|---|
| Overmatig em-dash-gebruik | Vijf of meer em-dashes per 1.000 woorden, vaak drie in één alinea | Max twee per 1.000 woorden; vervang de rest door punten, komma’s of haakjes |
| Antitheseketens | “X is niet Y. Het is Z.” drie keer of meer in het stuk | Max twee per artikel; herschrijf de rest als directe bewering |
| Uniforme haakjes | Elke haakje is van hetzelfde type (alle definities, alle terzijdes, of alle bronverwijzingen) | Mix drie typen per artikel: definitie, terzijde, bron-flag |
| Voorzichtige openers | Zinnen die beginnen met “Het is het vermelden waard,” “Belangrijk,” “Opmerkelijk,” “Cruciaal” | Schrap de hedge; begin met de bewering zelf |
| Lineaire structuur | Elke alinea drie zinnen, elke sectie drie alinea’s | Breek het metrum: eenzinsalinea’s, variabele sectielengtes, af en toe een lange alinea |
| Vage voornaamwoord-overgangen | “Dit,” “Het,” of “Zij” aan het begin van een alinea zonder duidelijke referent | Vervang door de expliciete zelfstandigenaamwoordgroep |
Overmatig em-dash-gebruik is het zichtbaarst en makkelijkst te fixen. Modellen leveren vaak acht à negen em-dashes per duizend woorden, soms drie in één zin. Zoek, tel, cap op twee. Twintig seconden werk, grootste daling in “klinkt als AI”.
Antitheseketens: een zin zet een ontkenning op en claimt dan het alternatief. “Het draait niet om zichtbaarheid. Het draait om autoriteit.” Modellen pakken dit omdat het goedkoop zelfvertrouwen geeft en overal in hun trainingsdata zit. Max twee per artikel, de rest herschrijven als directe claims; het stuk klinkt meteen minder opgevoerd.
De meeste redactietijd gaat verloren aan concepten die je na drie minuten had moeten weggooien. Een vier-vragen-triage bespaart de rest van de dag.

Vraag 1: staat er minstens één specifiek feit, voorbeeld of getal in? “Marketingteams moeten rond de customer journey alignen” is niet specifiek. “Teams die meer dan twee stukken per week publiceren zien decay na zes i.p.v. veertien maanden” is dat wel. Bij nul specificaties kreeg het model te weinig input; bewerken helpt niet.
Vraag 2: is de structuur bruikbaar of moet die opnieuw? Lees de H2-lijst hardop. Loopt het betoog, dan is de structuur oké en gaat het om mechanisch en oordeelwerk. Leest het als losse topic-paragrafen zonder stelling, dan helpt alinea-edit niet.
Vraag 3: zijn de feitelijke claims juist? Check één getal, één citaat en één toolnaam. Moeten er twee van de drie worden gecorrigeerd, dan wemelt het hele stuk van hallucinaties.
Vraag 4: hoeveel van de zes signalen zitten op hoge dichtheid? Twee of minder: korte mechanische pass. Vier of meer: gegenereerd met default sampling, dus meer werk.
De drie uitkomsten: specifieke voorbeelden, goede structuur, sound claims, ≤2 signalen → bewerken in plaats, 45–90 min. Structuur goed maar voorbeelden/claims zwak → herschrijven vanaf outline, 90–150 min. Generiek én structuur rommelig → weggooien en opnieuw prompten. Zo’n 15–20 % belandt in de prullenbak; die vijf minuten besparen uren.
Een voorbeeld is duidelijker dan uitleg. Dit is een alinea uit een concept over page-decay-signalen, in twee stappen.

Conceptversie: “Content decay is not a slow process. It is a steep one — and most operators miss it entirely. It's worth noting that the typical decay curve runs faster than people expect. This is why measuring it matters: without a baseline, you'll never know if a page is recovering or sliding further. Importantly, the signal lives in the trend, not the snapshot.”
Bewerkte versie: “Content-decay verloopt steiler dan de meeste operators denken. Gemiddeld daalt het aantal kliks acht tot twaalf procent per maand binnen zes maanden na de laatste update — het signaal zit in de trend, niet in de momentopname. Toen ik mijn eigen portfolio vorige kwartaal doorlichtte, hadden drie van de zeven pagina’s op de watchlist de acht-procentgrens al gepasseerd; één zat op vijftien en ik miste het omdat ik naar de snapshot keek.”
Vier veranderingen: twee van de drie em-dashes weg, antithese herschreven, vage “This is why” vervangen door de referent, en één concreet voorbeeld toegevoegd. Die laatste doet het meeste werk; zodra er échte ervaring in staat, verdwijnt het AI-gevoel.
Vier klassen edits blijven menselijk en maken een bewerkt AI-concept uniek.
Feitclaims. Modellen verzinnen cijfers oncomfortabel vaak. Check elk getal bij een primaire bron; kun je die niet noemen, schrap het.
Citaties. Nog erger: modellen verzinnen titels, auteurs en quotes. Verifieer elke referentie vóór publicatie.
Kader. Hoek en stelling zijn redactioneel, geen edit-klus. Zit dat scheef, herschrijf lead en intro.
Voorbeelden. Hoogste impact: vervang generieke cases door échte uit je werk. Eén echt voorbeeld weegt zwaarder dan vijf hedge-schraps.
Soms is het concept generiek omdat de briefing dat was. Drie keer achter elkaar “weggooien/herschrijven” betekent: het probleem zit in de briefing, niet in het model.
Het voice-stuk laat zien hoe je een stem definieert die een model kan volgen. Wie dat wil inbakken in terugkerende prompts leest daarna het stuk over agentische workflows.
Eerlijk beeld van detectors, drie categorieën.
Wat ze betrouwbaar vangen: onbewerkte modeloutput met defaults. Als je GPT/Claude/Gemini-tekst onveranderd publiceert, wordt die geflagd — logisch.
Wat ze slecht vangen: geparafraseerde output (Sadasivan: retrieval-detectors naar 25 %, watermark naar 15 %), mixen van mens+AI, en diep bewerkte concepten. Na de zes-signalen-pass verliezen de meeste detectors vertrouwen.
Wat ze fout zien: niet-native schrijvers (Liang: 61 % vals-positief), sterk gehedgde academische stijl en teksten met lage burstiness. Schrijf je formeel, dan kan je puur menselijke proza als “AI” scoren. Dat is detectorbias, geen signaal over jouw tekst. Gebruik onze detectortool als sanity-check, niet als KPI.
Operationaliseer het hele proces in vier tijdvakken.
Triage — 5 min. Beantwoord de vier vragen. Is het “weggooien”, stop en her-prompt.
Mechanische sweep — 10 min. Zoek em-dashes, cap. Grep “It is not”-antithese, cap. Zoek hedge-openers, verwijder. Zoek vage “This/It/They”, vervang. Check haakjes-uniformiteit.
Oordeelpass — 10 min. Verifieer één feit, vervang één generiek voorbeeld, check introkader; herschrijf als die zwabbert.
Sanity-check — 5 min. Lees de eerste twee alinea’s hardop. Klinken ze niet naar jou, fix de lead. Lees de laatste alinea; eindigt die op generiek vuurwerk, schrap de laatste zin.
“Is dit bewerkt?” is de impliciete vraag; die beantwoord je in dertig minuten. Herkader dat, en het werk volgt vanzelf.
Twee richtingen om verder te lezen: het AI-stuffed-blogs-stuk over de fail-mode die deze editing voorkomt, en het migratiestuk voor operators die AI grootschalig inzetten.
Zal Google content bestraffen die met AI is opgesteld? Volgens de spam-policy-update van maart 2024 niet het AI-gebruik zelf, maar content op schaal zonder redactie en zonder waarde. Bewerk het concept, voeg een specifiek voorbeeld toe en je zit ruim binnen beleid. Het black-hat-stuk schetst het bredere kader.
Zijn AI-detectors echt nauwkeurig? Nee. Sadasivan et al. (2023) toonden dat recursief parafraseren detectie laat zakken tot 15–25 %, Liang et al. (2023) vond 61 % vals-positieven bij niet-native schrijvers, en OpenAI trok zijn classifier terug omdat die maar 26 % AI-tekst herkende en 9 % menselijke tekst fout labelde. Zie detectoroutput als rumoerige second opinion.
Hoe lang duurt het bewerken van een AI-concept? Dertig tot negentig minuten voor een in-place edit, negentig tot honderdvijftig voor een structuur-rewrite. Duurt het drie uur, dan had je beter opnieuw kunnen prompten.
Wat weegt zwaarder — mechanische edits of oordelen? Het oordeel, veruit. De mechanische pass haalt tachtig procent van het AI-gevoel weg; het oordeel maakt het stuk uniek, en de specifieke-voorbeeldswap heeft de hoogste impact. De content-decay-gids is nuttige context voor de auditkant.
Wat als een klant vraagt of de content met AI is opgesteld? Wees eerlijk. De meeste klanten vinden “AI-concept, handmatig bewerkt” prima zolang de bewerking echt is. Het merkrisico is niet de AI, maar het verzwijgen ervan. De bewerking ís het deliverable.
no credit card required
No related articles found.