Wat is belangrijker, de mechanische edits of het oordeelwerk?

Het oordeelwerk, met afstand. De mechanische pass haalt circa 80 procent van het ‘klinkt als AI’ weg; het oordeel maakt het stuk uniek, en de specifieke voorbeeldruil heeft de grootste impact.

Zo bewerk je AI-concepten zodat ze klinken alsof jij ze hebt geschreven

Q: Zijn AI-detectors echt nauwkeurig?

Nee. Sadasivan et al. (2023) lieten zien dat recursief parafraseren verschillende detectorklassen tot 15–25 procent nauwkeurigheid terugbrengt, Liang et al. (2023) vond 61 procent vals-positieven bij niet-native Engelse schrijvers, en OpenAI trok in juli 2023 zijn eigen classifier terug wegens lage nauwkeurigheid. Zie detectoroutput als rumoerige second opinion, niet als optimalisatiedoel.

Q: Hoe lang duurt het bewerken van een AI-concept?

30 tot 90 minuten voor een in-place edit, 90 tot 150 voor een structuur-rewrite. Zit je drie uur in één stuk, dan was opnieuw prompten waarschijnlijk beter.

Q: Wat als een klant vraagt of de content met AI is opgesteld?

Wees eerlijk. De meeste klanten accepteren ‘AI-concept, handmatig bewerkt’ zolang de bewerking substantieel is. Het risico zit niet in de AI maar in het verhullen ervan.

TL;DR: AI-detectors zijn te rumoerig om “verslaan” als doel te nemen — Sadasivan et al. (2023) toonden dat recursief parafraseren elke geteste detectorklasse ineen laat storten (sommige tot 15–25 % nauwkeurigheid) en OpenAI trok in juli 2023 zijn eigen classifier terug. Wat telt is dat het concept leest alsof jij het schreef. AI-teksten vertonen een handvol vaste mechanische signalen: overmatig gebruik van em-dashes, antitheseketens, uniforme haakjes, voorzichtige openers, lineaire structuur en vage voornaamwoord-overgangen. Elk heeft een deterministische oplossing. Daarna scheiden de echte oordelen (claims checken, generieke voorbeelden vervangen door specifieke, citaten schrappen die je niet kunt herleiden) een bewerkt concept van zomaar wéér een AI-concept. Reken dertig minuten per stuk voor de volledige ronde.

Waarom detectie niet het juiste doel is

Ik bewerk twee à drie AI-concepten per week: mijn eigen teksten die ik door een model haal voor compressie, concepten van een freelancer voor akkoord, en af en toe een stuk dat ik in een model begon en met de hand afmaakte. De detectorvraag kwam twee keer langs vorige maand. Beide keren was het antwoord hetzelfde: negeer de detector, bewerk de tekst.

Die vraag klinkt luider dan nodig omdat de tools zekerheid verkopen die ze niet hebben. Een paper van de University of Maryland (2023) stressteste de beste classifiers na een recursieve parafrase-ronde. De dalingen waren fors. De retrieval-detector zakte van 100 % naar 25 % nauwkeurigheid. DetectGPT’s AUROC ging van 82 % naar 18 %. Watermark-detectors, zogenaamd de robuuste variant, vielen van 99 % true-positive naar 15 % na vijf rondes. Het patroon: een dun laagje parafraseren breekt ze allemaal.

Split-panel comparison of what AI detectors catch reliably versus what they get wrong, with citation counts — Wat detectors wél zien en wat ze missen. De rechterkant is de kost die de meeste redacteuren niet incalculeren.

OpenAI trok zijn AI Text Classifier in juli 2023 terug wegens “lage nauwkeurigheid” — het hulpprogramma ving maar 26 % AI-tekst en bestempelde 9 % menselijke tekst onterecht als AI. Liang et al. (Stanford, 2023) rapporteerden gemiddeld 61 % vals-positieven bij niet-native Engelse TOEFL-schrijvers; een niet-native schrijver met een rasechte human draft wordt dus vaak geflagd. Dat maakt detectors niet nutteloos, maar wel tot een lawaaierige second opinion, geen optimalisatiedoel.

De herformulering is simpel: het enige signaal dat telt is of een mens na lezen zegt “dit klinkt als AI”. Los je dat op, dan zakt de detectorvraag mee. Het grootste deel is puur mechanisch op te lossen.

De zes signalen die vrijwel alles verklaren

Na zo’n tweehonderd AI-concepten (Claude, GPT-4-familie, Gemini) door 2024 en 2026 verschijnen steeds dezelfde zes patronen in zulke dichtheid dat een lezer ze als AI herkent. Modelafwijkingen bestaan (Claude houdt meer van antithese; GPT over-hedged), maar de zes zijn model-stabiel genoeg om als één lijst te onderwijzen.

Six mechanical AI-writing tells with what each looks like in a draft and the specific edit that removes it — De zes mechanische signalen. Houd elk onder de drempel in de rechterkolom; het cumulatieve effect is groter dan één losse fix.

Waarom zes en niet twaalf? Elke lange lijst met “AI-tells” valt hierop terug zodra je vraagt welk patroon lezers echt opvalt versus puur stijlvoorkeuren. Staat jouw concept laag op deze zes, dan leest het al menselijk. Heeft het er vier of meer, dan redt geen enkele poetsbeurt de overige twintig stijltips.

De remedietabel lezen

Open deze tabel in een tweede tab tijdens het redigeren. Links staat het signaal, midden hoe het eruitziet, rechts de fix en de drempel.

Signaal	Uiterlijk	Fix
Overmatig em-dash-gebruik	Vijf of meer em-dashes per 1.000 woorden, vaak drie in één alinea	Max twee per 1.000 woorden; vervang de rest door punten, komma’s of haakjes
Antitheseketens	“X is niet Y. Het is Z.” drie keer of meer in het stuk	Max twee per artikel; herschrijf de rest als directe bewering
Uniforme haakjes	Elke haakje is van hetzelfde type (alle definities, alle terzijdes, of alle bronverwijzingen)	Mix drie typen per artikel: definitie, terzijde, bron-flag
Voorzichtige openers	Zinnen die beginnen met “Het is het vermelden waard,” “Belangrijk,” “Opmerkelijk,” “Cruciaal”	Schrap de hedge; begin met de bewering zelf
Lineaire structuur	Elke alinea drie zinnen, elke sectie drie alinea’s	Breek het metrum: eenzinsalinea’s, variabele sectielengtes, af en toe een lange alinea
Vage voornaamwoord-overgangen	“Dit,” “Het,” of “Zij” aan het begin van een alinea zonder duidelijke referent	Vervang door de expliciete zelfstandigenaamwoordgroep

Overmatig em-dash-gebruik is het zichtbaarst en makkelijkst te fixen. Modellen leveren vaak acht à negen em-dashes per duizend woorden, soms drie in één zin. Zoek, tel, cap op twee. Twintig seconden werk, grootste daling in “klinkt als AI”.

Antitheseketens: een zin zet een ontkenning op en claimt dan het alternatief. “Het draait niet om zichtbaarheid. Het draait om autoriteit.” Modellen pakken dit omdat het goedkoop zelfvertrouwen geeft en overal in hun trainingsdata zit. Max twee per artikel, de rest herschrijven als directe claims; het stuk klinkt meteen minder opgevoerd.

De triageflow: bewerken, herschrijven of weggooien

De meeste redactietijd gaat verloren aan concepten die je na drie minuten had moeten weggooien. Een vier-vragen-triage bespaart de rest van de dag.

Four-question triage flow for AI drafts ending in three terminal answers: edit, rewrite from outline, or throw out and re-prompt — Vier vragen, drie uitkomsten. “Weggooien” komt vaker voor dan redacteuren denken, en de vijf-minuten-triage spaart de volgende negentig.

Vraag 1: staat er minstens één specifiek feit, voorbeeld of getal in? “Marketingteams moeten rond de customer journey alignen” is niet specifiek. “Teams die meer dan twee stukken per week publiceren zien decay na zes i.p.v. veertien maanden” is dat wel. Bij nul specificaties kreeg het model te weinig input; bewerken helpt niet.

Vraag 2: is de structuur bruikbaar of moet die opnieuw? Lees de H2-lijst hardop. Loopt het betoog, dan is de structuur oké en gaat het om mechanisch en oordeelwerk. Leest het als losse topic-paragrafen zonder stelling, dan helpt alinea-edit niet.

Vraag 3: zijn de feitelijke claims juist? Check één getal, één citaat en één toolnaam. Moeten er twee van de drie worden gecorrigeerd, dan wemelt het hele stuk van hallucinaties.

Vraag 4: hoeveel van de zes signalen zitten op hoge dichtheid? Twee of minder: korte mechanische pass. Vier of meer: gegenereerd met default sampling, dus meer werk.

De drie uitkomsten: specifieke voorbeelden, goede structuur, sound claims, ≤2 signalen → bewerken in plaats, 45–90 min. Structuur goed maar voorbeelden/claims zwak → herschrijven vanaf outline, 90–150 min. Generiek én structuur rommelig → weggooien en opnieuw prompten. Zo’n 15–20 % belandt in de prullenbak; die vijf minuten besparen uren.

Hoe een bewerkte alinea eruitziet

Een voorbeeld is duidelijker dan uitleg. Dit is een alinea uit een concept over page-decay-signalen, in twee stappen.

A representative paragraph shown before and after edits, with mechanical changes called out by category — Voor en na. Vier gemarkeerde edits zorgen voor vrijwel het hele “klinkt menselijk”-verschil.

Conceptversie: “Content decay is not a slow process. It is a steep one — and most operators miss it entirely. It's worth noting that the typical decay curve runs faster than people expect. This is why measuring it matters: without a baseline, you'll never know if a page is recovering or sliding further. Importantly, the signal lives in the trend, not the snapshot.”

Bewerkte versie: “Content-decay verloopt steiler dan de meeste operators denken. Gemiddeld daalt het aantal kliks acht tot twaalf procent per maand binnen zes maanden na de laatste update — het signaal zit in de trend, niet in de momentopname. Toen ik mijn eigen portfolio vorige kwartaal doorlichtte, hadden drie van de zeven pagina’s op de watchlist de acht-procentgrens al gepasseerd; één zat op vijftien en ik miste het omdat ik naar de snapshot keek.”

Vier veranderingen: twee van de drie em-dashes weg, antithese herschreven, vage “This is why” vervangen door de referent, en één concreet voorbeeld toegevoegd. Die laatste doet het meeste werk; zodra er échte ervaring in staat, verdwijnt het AI-gevoel.

Oordelen die niet op een checklist passen

Vier klassen edits blijven menselijk en maken een bewerkt AI-concept uniek.

Feitclaims. Modellen verzinnen cijfers oncomfortabel vaak. Check elk getal bij een primaire bron; kun je die niet noemen, schrap het.

Citaties. Nog erger: modellen verzinnen titels, auteurs en quotes. Verifieer elke referentie vóór publicatie.

Kader. Hoek en stelling zijn redactioneel, geen edit-klus. Zit dat scheef, herschrijf lead en intro.

Voorbeelden. Hoogste impact: vervang generieke cases door échte uit je werk. Eén echt voorbeeld weegt zwaarder dan vijf hedge-schraps.

Wanneer het upstream-probleem stem is, niet editing

Soms is het concept generiek omdat de briefing dat was. Drie keer achter elkaar “weggooien/herschrijven” betekent: het probleem zit in de briefing, niet in het model.

Het voice-stuk laat zien hoe je een stem definieert die een model kan volgen. Wie dat wil inbakken in terugkerende prompts leest daarna het stuk over agentische workflows.

Detector-realiteit in drie korte alinea’s

Eerlijk beeld van detectors, drie categorieën.

Wat ze betrouwbaar vangen: onbewerkte modeloutput met defaults. Als je GPT/Claude/Gemini-tekst onveranderd publiceert, wordt die geflagd — logisch.

Wat ze slecht vangen: geparafraseerde output (Sadasivan: retrieval-detectors naar 25 %, watermark naar 15 %), mixen van mens+AI, en diep bewerkte concepten. Na de zes-signalen-pass verliezen de meeste detectors vertrouwen.

Wat ze fout zien: niet-native schrijvers (Liang: 61 % vals-positief), sterk gehedgde academische stijl en teksten met lage burstiness. Schrijf je formeel, dan kan je puur menselijke proza als “AI” scoren. Dat is detectorbias, geen signaal over jouw tekst. Gebruik onze detectortool als sanity-check, niet als KPI.

Wat ik écht doe in de dertig minuten vóór publicatie

Operationaliseer het hele proces in vier tijdvakken.

Triage — 5 min. Beantwoord de vier vragen. Is het “weggooien”, stop en her-prompt.

Mechanische sweep — 10 min. Zoek em-dashes, cap. Grep “It is not”-antithese, cap. Zoek hedge-openers, verwijder. Zoek vage “This/It/They”, vervang. Check haakjes-uniformiteit.

Oordeelpass — 10 min. Verifieer één feit, vervang één generiek voorbeeld, check introkader; herschrijf als die zwabbert.

Sanity-check — 5 min. Lees de eerste twee alinea’s hardop. Klinken ze niet naar jou, fix de lead. Lees de laatste alinea; eindigt die op generiek vuurwerk, schrap de laatste zin.

Wat de detectorvraag écht is

“Is dit bewerkt?” is de impliciete vraag; die beantwoord je in dertig minuten. Herkader dat, en het werk volgt vanzelf.

Twee richtingen om verder te lezen: het AI-stuffed-blogs-stuk over de fail-mode die deze editing voorkomt, en het migratiestuk voor operators die AI grootschalig inzetten.

FAQ

Zal Google content bestraffen die met AI is opgesteld? Volgens de spam-policy-update van maart 2024 niet het AI-gebruik zelf, maar content op schaal zonder redactie en zonder waarde. Bewerk het concept, voeg een specifiek voorbeeld toe en je zit ruim binnen beleid. Het black-hat-stuk schetst het bredere kader.

Zijn AI-detectors echt nauwkeurig? Nee. Sadasivan et al. (2023) toonden dat recursief parafraseren detectie laat zakken tot 15–25 %, Liang et al. (2023) vond 61 % vals-positieven bij niet-native schrijvers, en OpenAI trok zijn classifier terug omdat die maar 26 % AI-tekst herkende en 9 % menselijke tekst fout labelde. Zie detectoroutput als rumoerige second opinion.

Hoe lang duurt het bewerken van een AI-concept? Dertig tot negentig minuten voor een in-place edit, negentig tot honderdvijftig voor een structuur-rewrite. Duurt het drie uur, dan had je beter opnieuw kunnen prompten.

Wat weegt zwaarder — mechanische edits of oordelen? Het oordeel, veruit. De mechanische pass haalt tachtig procent van het AI-gevoel weg; het oordeel maakt het stuk uniek, en de specifieke-voorbeeldswap heeft de hoogste impact. De content-decay-gids is nuttige context voor de auditkant.

Wat als een klant vraagt of de content met AI is opgesteld? Wees eerlijk. De meeste klanten vinden “AI-concept, handmatig bewerkt” prima zolang de bewerking echt is. Het merkrisico is niet de AI, maar het verzwijgen ervan. De bewerking ís het deliverable.

Our powerful suite of automation tools for SEO

Learn, discover, and get inspired by our content

Zo redigeer je AI-concepten zodat ze lezen alsof jij ze hebt geschreven