Inmiddels tien jaar geleden leerde ik voor het eerst over “leesbaarheidstesten”. Een simpele formule die kijkt naar eigenschappen van je tekst en op basis daarvan een “score” geeft.
Enerzijds is dit ongelofelijk handig, anderzijds heb ik altijd een haat-liefde verhouding ermee gehad.
Dan schreef ik een tekst, gooide het door de formule en kreeg het resultaat “te moeilijk”. Terwijl ik voelde dat het prima te lezen was!
Op andere momenten was het lekker leesbaar volgens de formules, terwijl het mijns inziens voor geen meter liep.
Dus vandaag kijken we naar deze vragen: welke testen zijn er? Hoe nuttig zijn ze? En hoe kan je deze het beste gebruiken?
De testen
Vrijwel alle testen geven een grade level. Oftewel, vanaf welke grade zal het gemiddelde kind deze tekst begrijpen.
First grade zijn vierjarigen en je telt vanaf daar omhoog. De meeste teksten zijn veilig als ze grade 7-8 geven: leesbaar vanaf ongeveer 11-12 jaar. Sommige testen gaan niet boven grade 12, waarna je van school bent.
Dit zijn de bekendste:
- Flesch-Kincaid: bekijkt de gemiddelde lettergrepen per woord en woorden per zin. Je hebt een variant die van 0-120 gaat (hoger is beter; 70-80 is een goed getal), en eentje die een grade level geeft.
- Gunning Fog: kijkt naar hoeveel moeilijke woorden je tekst heeft, maar negeert vakspecifieke woorden. (Zoals eigennamen, vaktermen en samengestelde woorden.) Geeft een grade level.
- Dale Chall: bekijkt hoeveel moeilijke woorden je tekst heeft én het gemiddelde aantal woorden per zin.
- Coleman Liau Index: kijkt naar het aantal karakters per woord (in plaats van lettergrepen). Geeft een grade level.
- SMOG: pakt zinnen van het begin, midden en einde van je tekst en telt de hoeveelheid woorden met 3+ lettergrepen. Geeft een grade level.
- Automated Readability Index: kijkt naar karakters per woord en woorden per zin. Geeft een grade level.
- Fry Readability Graph: een grafiek. Vind willekeurige passages van 100 woorden. Op de x-as staat het gemiddelde aantal lettergrepen per woord, op de y-as het gemiddelde aantal zinnen. Kijk waar deze elkaar snijden en de grafiek geeft je grade level.
- Cloze Test: vervang één in de 5 woorden met een “blank”. Probeer vervolgens de tekst te lezen en zelf in te vullen wat er zou moeten staan. Als je meer dan 60% succesvol raadt, zit je redelijk goed.
Allemaal stoppen ze de uitgerekende getallen in een formule, maar die hoef je niet te weten.
(De SMOG neemt bijvoorbeeld een wortel van allerlei dingen. De Flesch-Kincaid vermenigvuldigt de onderdelen met vaste coëfficiënten die verschillen per taal.)
De algemene valkuil
Natuurlijk wordt leesbaarheid niet alleen bepaald door gemiddeldes in een formule stoppen.
Je zou alle zinnen uit een Harry Potter boek kunnen husselen tot een willekeurige volgorde, en de uitkomst van de testen zou exact hetzelfde zijn.
De flow of het ritme van een tekst wordt niet meegenomen, want men kijkt niet naar de context.
Slechts twee testen gebruiken het principe van “moeilijke woorden”, maar dat is een nauwe definitie waarbij ze een handmatige lijst nodig hebben.
Een principe van “moeilijke (bij)zin” of “moeilijke zinsconstructie” bestaat eigenlijk niet. Terwijl dáár veel leesproblemen vandaan komen.
Dus nee, zo’n test gaat niet alle problemen in jouw tekst aanwijzen. En het zal soms zeggen dat je werk onleesbaar is terwijl er niets aan de hand is.
Maar in het algemeen, als je dit soort dingen weet en meeneemt, zijn ze een handige hulp. Want een tekst vol langdradige zinnen zal altijd een hoge score opleveren. Een tekst waarin je elk simpel woord vervangt door een synoniem van vier lettergrepen zal alle alarmbellen laten afgaan.
Dus als een test jou een lage of hoge score geeft, probeer vooral te onderzoeken waarom. Als de reden niet belangrijk is, dan negeer je het. Als je de reden kan begrijpen, dan pas je het aan.
De taalvalkuil
Oké, je zou nu naar een online “readability tool” kunnen gaan—of zoiets kunnen aanzetten in je schrijfprogramma—en je tekst erin gooien. Bekijk de scores en pas aan waar nodig.
Maar het feit dat ze allemaal een “grade level” teruggeven is de eerste clue dat dit niet zomaar kan. Al deze testen zijn ontwikkeld in Amerika (of een ander Engelssprekend land), waardoor ze vooral gelden voor het Engels.
Het gevolg is dat zo’n formule niets anders zegt dan: “Stel dit was een Engelse tekst, dan zou een gemiddeld Engels kind van leeftijd X het waarschijnlijk kunnen lezen.”
Als je in het Engels schrijft, ben je dus een geluksvogel. Je kan alle tests gebruiken en de resultaten redelijk vertrouwen! Soortgelijke tools zijn ook geweldig als Engels je tweede taal is en je onzeker bent over zinsstructuur of grammatica.
Maar ik schrijf in het Nederlands. Dus wat doen we dan?
In eerste instantie schrok ik namelijk enorm van mijn resultaten. De teksten die ik had geschreven voor kinderverhalen scoorden véél te hoog op de testen. In mijn ogen waren ze kort en simpel, maar volgens die formules was het bijna een wetenschappelijk paper!
Totdat ik dus realiseerde dat de meeste testen niet zomaar zijn toe te passen.
Nederlands is een andere taal dan Engels, maar in het algemeen ook langer. Een gemiddelde Nederlandse vertaling van een Engels boek zal zo’n 10% langer uitvallen. (Er is een reden dat Engels een wereldtaal is geworden. Naast de overduidelijke reden dat Engeland het honderden jaren nodig vond om de hele wereld te koloniseren.)
De meeste testen worden hierdoor direct onbruikbaar. Gunning Fog en Dale Chall gebruiken een woordenlijst met “makkelijke Engelse woorden” (en de rest is automatisch moeilijk). Als je daar een Nederlandse tekst ingooit, telt hij dus alle woorden als moeilijk!
De meeste andere tests hebben één hele specifieke set coëfficiënten voor het Engels. Die is na lang onderzoek vastgesteld en nooit vertaald.
(Voor SMOG kon ik alleen een wetenschappelijk onderzoek vinden dat probeerde coëfficiënten te vinden voor het Kroatisch. Hun conclusie was dat woorden in die taal standaard een lettergreep langer waren. En dat je daarvoor moest compenseren.)
Aanbeveling 1: Flesch-Kincaid
Behalve Flesch-Kincaid. Waarschijnlijk de meest universeel toegepaste test, die past op alle soorten teksten. Die heeft getallen voor het Nederlands.
Als je die gebruikt, klopt de uitkomst veel beter. In mijn ogen past het getal bij hoe “leesbaar” ik de teksten vind.
Grade level = 206.84—77 x (# woorden / # zinnen)—0.93 x (# lettergrepen / # woorden)
Oftewel, tel je lettergrepen, woorden en zinnen. Vul ze in en je hebt je antwoord.
Natuurlijk kan je hier een script voor schrijven die het automatisch doet. Dat hebben mensen al gedaan, zoals bijvoorbeeld deze leesbaarheidsrekenmachine.
(Draak van een woord. Misschien dat ik dat zelf ook een keer aanbied op dit blog, met een kortere titel :p)
Een hoofdstuk van een kinderboek (van mijzelf) scoorde 71 bij de Engelse test. Hier scoort het 88, een getal dat in mijn ogen beter overeenkomt met het niveau.
Als je laag scoort, controleer dan dit soort dingen:
- Samengestelde zinnen die los kunnen: een komma kan prima een punt zijn. (“Ik wist niet meer wat ik moest doen, ik zag de oplossing niet meer.” => “Ik wist niet meer wat ik moest doen. Ik zag de oplossing niet meer.”)
- Zinsconstructies die indirect zijn en daardoor meer lettergrepen nodig hebben. (“Het feest werd 6 Juli gehouden.” => “Hij hield het feest 6 Juli.”)
- Zinnen vol metaforen, beeldspraak of moeilijke woorden waar een simpeler alternatief bestaat. (“Het metalen gevaarte blokkeerde de zeldzame zonnestralen die nog door de zwarte lucht durfden te reizen” => “Het blokkeerde de zeldzame zonnestralen in de zwarte lucht.”)
Aanbeveling 2: De Cloze test
Deze is taalonafhankelijk! Daarnaast is het ook een leuk spelletje om zelf te spelen of iemand anders voor te leggen.
Pak je tekst, gebruik een online hulpmiddel, en je krijgt je tekst terug met een “_____” op de plek van elk zoveelste woord.
Vervolgens lees je het en probeert de gaten in te vullen.
Deze test werkt natuurlijk beter als je een tijdje afstand hebt gehad van je tekst. (Dus je hebt een hoofdstuk geschreven en komt een paar weken later terug voor de tweede versie.)
Sommige middelen geven een woordenlijst erbij. Of dat nodig is hangt af van het soort tekst. Een hoofdstuk van twee personages in een modern café is makkelijk in te vullen. Een wetenschappelijk artikel over een specifieke biologische cyclus, of een fantasyboek met verzonnen eigenschappen, is lastiger.
Maar het blijft een simpele manier om complexiteit te controleren:
- Veel simpele, bekende, standaardwoorden zal je altijd kunnen invullen.
- Verwijzingen kan je alleen invullen als de context deze duidelijk maken.
- En lange ratelende zinnen zijn onmogelijk in te vullen, want je weet niet waar ze heen gaan of waar deze bijzin nu weer op slaat.
Boven de 60% is redelijk goed. Tussen 40% en 60% is twijfel. Daaronder moet je sowieso gaan herschrijven.
Aanbeveling 3: De Hemingway editor
Het terugkerende element in al deze tests is dat ze kijken naar lengte en frequentie. Lengte van zinnen. Lengte van woorden (in karakters of lettergrepen). Hoe vaak je moeilijke woorden gebruikt waar een simpelere volstaat.
De Hemingway editor is gratis en checkt nou precies deze dingen. Nogmaals, het is voor het Engels, dus in die taal haal je er het meeste uit.
Maar in het Nederlands kan het nog steeds prima de lengte van je zinnen controleren.
- Als je eens in de zoveel tijd een gele of rode zin hebt, hoef je je daarover geen zorgen te maken.
- Maar als ze om de paar paragrafen voorkomen (of sneller), of elkaar direct opvolgen, is het aan te raden om te herschrijven.
Het rekent tevens statistieken voor je uit. Die zou je dus zelf in één van die andere formules kunnen gooien (met knippen en plakken), zoals de Flesch-Kincaid.
(Hemingway stond natuurlijk bekend om zijn economische en functionele schrijfstijl. Veel van zijn verhalen gaan richting grade 3-4.)
Aanbeveling 4: schrijf gewoon veel
Zoals altijd kan jouw ervaring en intuïtie het beste oordelen over leesbaarheid.
Lees veel, schrijf veel, edit jezelf veel. Je zal vanzelf zinnen beter, korter en duidelijker opschrijven. Je zal vanzelf weten wanneer je langdradiger kunt zijn. Jouw gevoel zal zeggen dat iets onleesbaar is, zelfs als testen er geen probleem mee hebben.
Toen ik deze tests net ontdekte, gebruikte ik ze maandenlang alsof ze de bijbel waren. Teksten zonder enig ritme of structuur waren het gevolg. Het waren allemaal in stukjes gehakte zinnen met de meest simpele beweringen zoals “Hij lacht” en “Zij liep weg”. Inmiddels heb ik ze dus grotendeels losgelaten en negeer de uitkomst als ik denk dat ik het beter weet :p
Met welke score moet ik tevreden zijn?
Het korte en foute antwoord is: de score voor het niveau waarvoor je schrijft. Dus als jij voor tieners schrijft, wil je een grade level vanaf de brugklas. Als jij voor volwassenen schrijft, wil je het hoogste grade level.
Maar dit zijn gemiddeldes. Heel veel mensen lezen onder dat niveau. De meesten zeggen van zichzelf dat ze twee niveaus lager “comfortabel lezen”.
Het feit dat ik universitair ben opgeleid betekent zeker niet dat ik al mijn artikelen het liefst extreem academisch en formeel heb.
Ga altijd voor de zekerheid een paar niveaus lager zitten. Het aangeraden niveau voor de meeste doeleinden is grade 7-8.
Maar veel bekende schrijvers kiezen eerder 4-6, zelfs als het serieuze boeken voor volwassenen zijn. Niemand klaagt daarover en zegt: “Belachelijk! Dit boek is zó leesbaar en zó goed te begrijpen dat ik er helemaal niet goed van word!”
Dus ga sowieso niet boven je doelgroep zitten en het liefst ver daaronder.
Conclusie
Ik denk dat er een gigantische markt is voor een website die al deze dingen combineert en zoveel mogelijk toepast op alle talen. Maar voor nu zijn deze drie aanbevelingen het beste dat ik kon vinden voor het Nederlands.
Schrijf je tekst zonder je hierover zorgen te maken. Controleer deze aan het einde en pas aan totdat de score je bevalt. Besef dat de testen sterk zijn geijkt op het Engels, en dat je waarschijnlijk één of twee grades moet aftrekken voor het Nederlandse resultaat.
De testen zeggen niet dat je moet veranderen, het vraagt je om een keuze te maken of je wilt veranderen. Als Hemingway zegt dat een zin te lang is, of een woord overbodig, kan je nog steeds kiezen dat het algoritme geen gelijk heeft. Andersom weet ik zeker dat elke tekst die je erin gooit jou gaat verrassen door zinnen uit te lichten waarover jij geen tweede keer had nagedacht.
In de toekomst hoop ik dat testen worden ontwikkeld die dus verder gaan dan per woord of per zin kijken. Iets dat de context mee kan nemen. Iets dat moeilijke bijzinnen of constructies kan herkennen. Ik zou het zelf maken … als ik zou weten hoe je dat in hemelsnaam methodisch aanpakt :p
Toen ik net begon met schrijven hebben deze tests een wereld van verschil gemaakt. Ik schreef ongelofelijk lang en wollig. Door maandenlang alles tegen deze formules aan te gooien—ik had zelfs een eigen website gemaakt met een algoritme voor lettergrepen tellen—leerde ik kort, leesbaar en direct schrijven.
Ik gebruik ze nu slechts als extra controle. Want ik weet dat ik weer wollig en langdradig word als ik veel lees en schrijf, want dan verzand je in die modus. Je leest allerlei mooie metaforen, je wilt niet de zoveelste zin schrijven over karakters die zuchten of elkaar in de ogen kijken, dus je gaat allerlei vergelijkingen en beeldspraak bedenken.
Het kan nooit kwaad om dingen korter en leesbaarder te maken. Om buiten jouw eigen brein het computerbrein wat dingen te vragen, als een soort second opinion.
Althans, daarover wil ik nog wat zeggen, voor de twijfelaars.
Is kort/leesbaar schrijven nou zo cruciaal?
Ja en nee. Maar vooral ja.
Nee omdat sommige zinnen nou eenmaal beter lopen als ze langer zijn of bijzondere constructies gebruiken. Ze klinken poëtischer. Ze nemen je echt mee in een gevoel of gedachte, lezen lekkerder weg, of passen beter bij het karakter of de schrijfstijl.
Als elke zin een soort afgehakte brei van hoogstens 5-7 woorden is, leest het houterig en denkt iedereen dat het een peuterboek imiteert.
Ja om alle andere redenen. Waarom een lange zin schrijven, als het ook twee korte zinnen kunnen zijn? Waarom een moeilijk woord gebruiken als een makkelijke bestaat? Waarom hele groepen uitsluiten van jouw verhaal, puur doordat je onleesbaar schrijft?
Shakespeares stukken zijn gemiddeld grade 6. Harry Potter hangt ook in die regio, met als enige uitzondering het laatste deel dat richting die 7-8 gaat.
En de laatste jaren zijn er nauwelijks bestsellers geweest, of in het algemeen succesvolle boeken, die boven grade 5-6 waren.
Ja, de complexiteit van teksten is de afgelopen honderd jaar flink gekelderd. Je verliest iets, maar in het algemeen is versimpeling en inkorting een goede zaak. Want deze tests verhinderen je niet om moeilijke woorden te gebruiken, of eens in de zoveel tijd even je poëtische hoed op te zetten. Je moet het alleen niet onnodig vaak doen.
In mijn ogen is een verhaal zinloos als het niet wordt gelezen. (Dit is een ietwat moderne blik waarover veel oudere schrijvers van mening verschillen. Zij argumenteren dat de waarde komt uit het maakproces en het bestaan zelf, niet in hoeverre anderen er waarde aan geven.)
Maar je verhoogt de kans op lezers door het zo leesbaar en toegankelijk mogelijk te maken.
Zeker in een tijd waarin de meest geweldige series op de meest geweldige schermen één klik verwijderd zijn, zal een boek deze aandachtsstrijd moeten winnen met toegankelijkheid.
Zoals schrijvers wekenlang denken over de beste eerste zin, de beste opening, het meest pakkende eerste hoofdstuk om lezers aan te trekken … kunnen ze het beste ook nadenken over de meest leesbare tekst om die lezers vast te houden.
Analyse van dit artikel
Deze tekst heeft 203 zinnen, waarvan 28 “lastig” en 11 “erg lastig” volgens Hemingway.
De Flesch score is 69. Normaal leesbaar, ongeveer niveau van de middelbare school. (Hemingway zegt grade 8, wat dat ongeveer bevestigt.)
Volgens de andere Engelse testmethodes is deze tekst “fairly difficult to read”, “difficult to read” of “tenth grade”. Iets waarin ik me niet kan vinden, en jij hopelijk ook niet.
Sommige zinnen heb ik ingekort of veranderd op basis hiervan. Op die manier zijn een stuk of dertig “lastige” zinnen verdwenen.
Maar in de huidige tekst zie ik geen plekken meer die ik per se wil veranderen. Mocht jij wel struikelen over een zin of een paragraaf, laat het dan weten, want daar leren we van.
Andere interessante links
- https://raventools.com/blog/ultimate-list-of-online-content-readability-tests/ (geweldige overzicht van alles)
- https://www.accessibility.nl/tools/leesniveau (gemaakt voor Nederlands, mag maar 10 keer gratis gebruikt)
- https://countwordsworth.com/ (gratis en met veel statistieken, wel alleen Engels)
- https://www.grammarly.com/ (je wordt doodgegooid met advertenties hiervoor, maar dat verandert niet de nuttigheid)
- https://medium.com/honest-creative/what-writers-need-to-know-about-readability-8ed61bd7a737 (over de kelderende complexiteit van teksten)
- https://crimsondragonpublishing.com/wp-content/uploads/2017/11/Readability-Guideline.pdf (meer specifieke instructies voor taalgebruik voor specifieke leeftijden)