De Deductie van Johan de Witt (1654): basisbeginselen van automatische tekstanalyse II
Johan de Witt was een van de beroemdste ‘Nederlanders’ uit de zeventiende eeuw. Voor velen is hij nog altijd het toonbeeld van een goede politicus, die rechtvaardig, onkreukbaar, hardwerkend en zeer intelligent was . Anderen beschouwen hem als elitair en compromisloos. Hij is onder Republikeinen vooral geliefd vanwege zijn anti-Oranje houding en zijn aversie tegen erfelijk gezag. In dit hoofdstuk analyseer ik een van zijn sleutelteksten met digitale tools. Hij werd raadpensionaris van Holland in 1653, waarmee hij de machtigste man van de Republiek werd.
De Witt kreeg het bij zijn aantreden meteen zwaar, aangezien dat tijdens de Eerste Zeeoorlog met Engeland was. De Engelsen hadden de overhand en de Republiek moest buigen in de onderhandelingen. Bijkomstig probleem was dat in Engeland Lord Protector Cromwell aan de macht was gekomen, die koning Karel I had laten onthoofden. Deze Karel was door huwelijk verbonden met de Nederlandse Oranjes, aangezien zijn dochter getrouwd was geweest met de Nederlandse stadhouder Willem II. Stadhouder Willem II op zijn beurt, had tijdens zijn leven grote ruzie gehad met de vader van Johan de Witt, Jacob, en andere leden van de ‘Loevesteinse factie’. Hoewel Willem II zelf inmiddels was overleden, was zijn zoontje Willem III kort na diens overlijden geboren en zou wel eens de volwassen leeftijd kunnen bereiken. Het gevolg was dat Cromwell en de Witt dan wel in oorlog waren, maar dat ze ook allebei belang hadden bij het klein houden van de Oranjes.
Een van de eisen van Cromwell aan de Witt was dat de Oranjes nooit verheven zouden worden tot de hoogste functies in de Republiek. De Witt vond het ongetwijfeld niet zo erg om die concessie te doen, maar wist dat hij daarmee een groot deel van de Republiek over zich heen zou krijgen. Toen die concessie toch gedaan werd in de ‘akte van seclusie’, schreef De Witt een sterk staaltje retoriek om zich te verweren tegen alle beschuldigingen. De voornaamste beschuldiging was dat hij zelf met het idee van de uitsluiting was gekomen. Het verweer van De Witt is bekend geworden als de ‘Deductie van Johan de Witt’, een bijna 35.000 woorden tellend betoog.
De Deductie van Johan de Witt wordt gezien als een belangrijke ‘position paper’ waarin hij zijn ideeën over staatkunde en erfelijk gezag uit de doeken doet. In de tweede helft van 2007 kreeg ik opdracht van de Vereniging Vrienden van de Witt om een hertaling naar modern Nederlands te maken. De vereniging beoogde deze moeilijke tekst uit 1654 toegankelijk te maken voor het voortgezet onderwijs. Geen eenvoudige opgave, aangezien ook al in de tijd van De Witt een vereenvoudigde versie circuleerde, zodat 'de gewone man' kon begrijpen waar De Witt het over had. Toen ik eraan begon was de tekst nog niet gedigitaliseerd. Ik kreeg de tekst aangeleverd als fotobestanden van gotisch handschrift, gemaakt door de vereniging. De eerste stap die ik toen nam was het letterlijk transcriberen van de tekst in een Word bestand. Op basis van die tekst ben ik toen aan het ‘hertalen’ geslagen. Een bijkomend voordeel was dat ik de transcriptie van de originele tekst jaren later nog steeds digitaal had.
Vee later heb ik wat basistools losgelaten op de tekst om te kijken wat een korte digitale analyse mij kon vertellen. De eerste stap was om gewoon eens te kijken naar het aantal woorden in de tekst. Voor dergelijke exercities zijn vele programma’s gewoon online en gratis beschikbaar. Wordcounter kon mij vertellen hoeveel woorden, zinnen, en woorden per zin in de tekst staan. De tekst van De Witt bevat niet minder dan 34.453 woorden, verdeeld over 749 zinnen. Dat betekent dat hij 46 woorden per zin sprak. Sprak, aangezien hij de tekst voorlas in een vergadering van de Staten-Generaal en daar vijf uur over deed. Ter vergelijking: toen premier Mark Rutte op het Innovation Convention in Brussel van 10 maart 2014 sprak, gebruikte hij daarvoor 2.199 woorden en 16 woorden per zin.
Een belangrijker vraag is natuurlijk wat er nu in de tekst staat? De tekst in zijn geheel lezen kost veel tijd en bovendien zullen er ook dan patronen zijn die misschien niet opvallen. Een snelle, en leuke, manier om een snel beeld te krijgen van wat er in een tekst, of verzameling van teksten, staat is het genereren van wordclouds.
Wordle is een gebruiksvriendelijke tool die woordfrequenties visualiseert in een wolk. Bijkomend voordeel is dat het voor veel talen de meest frequent voorkomende woorden als ‘de’ en ‘van’ weglaat. Helaas werkt die ingebouwde functionaliteit niet voor vroegmodern Nederlands, wat best jammer is aangezien een woord als ‘ende’, maar liefst 1275 keer voorkomt. Voor een goede visualisatie moest ik daarom zelf aan de slag, door met een zelf geschreven simpel ‘script’ [1] de zeventiende eeuwse stopwoorden er uit te halen. Het resultaat was de onderstaande Wordcloud.
Mocht ik niet al geweten hebben wat er in de tekst stond, dan was in een oogopslag duidelijk geworden dat het een politieke tekst is, die handelt over Holland, Zeeland, de prins van Oranje en dat de Lord Protector er ook iets mee te maken heeft. Iets nadere bestudering suggereert zelfs dat het over de Akte van Seclusie gaat.
Wordclouds zijn goed voor de eigen oriëntatie, en vaak ook voor presentaties, maar als historicus wil je uiteindelijk toch ook gewoon een telling hebben van het aantal woorden. Er zijn veel online programma’s die woordfrequenties van teksten geven, en die ook de veel voorkomende woorden er voor jou uithalen. Een van die programma’s is writewords. Zelfs als je de stopwoorden er niet uit kan halen omdat je tekst in een ongebruikelijke of verouderde taal is geschreven, dan kan je de lijst vrij snel aflopen op interessante termen als ‘Godt’, ‘ambassadeurs’ enzovoort. De belangrijkste issues van De Witt, zoals provincies, unies en Republiek scoren duidelijk hoog in de woordfrequentie. Het is verder ook leuk om te zien dat twee ambassadeurs, Nieupoort en Beverningk even vaak (41 keer) en, bij nadere bestudering altijd samen, genoemd worden.
Moeilijker wordt het echter als ik wil kijken naar vermeldingen van interessante, moeilijk te vatten concepten als ‘algemeen belang’. De Witt formuleert dit op veel verschillende manieren, altijd in combinatie met het zeer generieke woord ‘gemeen ‘ (of een afgeleide): 'Gemeene Saecke'; 'Gemeene Beste'; 'Gemeene Welvaren'; 'ter liefde van ’t gemeen'; ''t interest vanden Staet in’t gemeyn'. Nu kan ik gaan zoeken naar plaatsen waar 'gemeen' voorkomt (22 keer), maar dan nog is er het risico dat er iets anders ‘algemeens’ bedoeld wordt. Om van die frequentie iets zinnigs te kunnen maken moet ik de tekst dus in feite al van nabij bestudeerd, gecloseread, hebben, wat gelukkig het geval was, maar een echte meerwaarde heeft de software dan niet meer. Als ik het niveau van de Deductie wil overstijgen, en als er meer teksten beschikbaar zouden zijn, dan kan ik veel interessante vragen bedenken die ik met digitale tools zou willen aanboren. Hoe godvruchtig was Johan de Witt bijvoorbeeld (of hoe godvruchtig wilde hij overkomen)? Dat is een vraag die in de historiografie naar mijn weten nooit is gesteld. In de Deductie vind ik dankzij writewords 37 keer een vermelding van God of een afgeleide. Als we dat kunnen afzetten tegen politieke teksten van andere zeventiende-eeuwers, of andere teksten van De Witt, dan zouden daar voorzichtige conclusies aan verbonden kunnen worden over het godvruchtige karakter van De Witt of juist van de Deductie.
Wordclouds, zinslengte en woordfrequenties geven al een aardig idee van het soort tekst en de inhoud, zonder dat ik meteen diep in de tekst heb hoeven duiken. Als we ervan uitgaan dat op niet al te lange termijn dit soort zeventiende eeuwse teksten goed digitaal beschikbaar worden, dan is het mogelijk om snel de inhoud te polsen en op basis daarvan te besluiten welke teksten nader te bestuderen. Dat de software niet optimaal werkt op zeventiende eeuws Nederlands is voor simpele exercities redelijk eenvoudig te ondervangen. Ook de niet-gestandaardiseerde spelling zou niet al te grote moeilijkheden moeten bieden. De historicus kan relatief eenvoudig kijken of er bepaalde dingen opvallen in de tekst om zo sneller een beeld te krijgen van wat wellicht het onderzoeken waard is. Hypothesen kunnen sneller geformuleerd worden en doodlopende paden sneller worden gesignaleerd.
==============
[1] Een script is een code in een programmeertaal