De geschiedenis van digitale geschiedenis
Digital Humanities is een tamelijk recent fenomeen, maar in de onderzoekspraktijk is ze al heel oud. Bijna zodra de eerste computers het licht zagen hebben geesteswetenschappers zich beziggehouden met de vraag of en hoe ze die ook voor de eigen doeleinden konden inzetten.[1] De man die hierbij als pionier wordt geroemd is pater Robert Busa, die in de jaren veertig van de twintigste eeuw zijn licht ging opdoen bij IBM over de mogelijkheden de teksten van de heilige Thomas van Aquino beter doorzoekbaar te maken. In die tijd was de kracht van computers echter nog zeer klein in vergelijking met nu, waardoor een ‘doorbraak’ nog decennia op zich zou laten wachten.
R.H. Fuchs schreef bijna vijftig jaar geleden een treffende reflectie op de vroege digitalisering, in een stukje over het gebruik van computers in de beeldende kunst. Een voorbeeld van buiten de wetenschap dus, maar niet minder treffend. Hij schreef het volgende, dat ik hier in zijn geheel laat volgen, omdat het ook nu nog actueel is:
“De computer is dus een technisch hulpmiddel. Hij kan programma’s uitwerken en realiseren die door hun complexiteit of omvang voor een mens praktisch niet uitvoerbaar zijn, bij voorbeeld omdat ze teveel tijd zouden vergen. [..] Een vraag daarbij is in hoeverre dit voor hem een [...] noodzakelijke stap was, en of hij van de computer iets verwacht dat niet met conventionele middelen zou kunnen worden gerealiseerd. Die vraag is mijns inziens relevant, temeer omdat het erop begint te lijken dat er, rond het gebruik van computers door kunstenaars, een soort van magie aan het ontstaan is. Binnen deze magische sfeer heeft alleen al het woord computer de connotatie van bij-de-tijd-zijn. Die connotatie is allereerst modieus en heeft met kunst weinig te maken, Als een nieuw en absoluut logisch medium lijkt echter de computer, evenals allerlei andere technologische en mechanische technieken en materialen die nu door kunstenaars gebruikt worden, wel een rol te spelen in pogingen van individuele kunstenaars om alternatieven te vinden voor subjectieve en intuïtieve artistieke processen als het 'ouderwetse' schilderen.” [2]
Overal waar ‘kunstenaar’ staat, zou je ook ‘historicus’ of ‘literatuurwetenschapper’ kunnen invullen en zonder al teveel problemen kunnen plaatsen in een stukje over digital humanities nu.
Het gebruik van computers in de geesteswetenschappen (en kunst) stamt dus uit het midden van de twintigste eeuw en ook toen dacht men al goed na over de implicaties en het nut daarvan. In de loop der decennia is de schaal waarop dit gebeurde echter veel groter geworden, hand in hand met steeds snellere computers, computers voor privégebruik sinds de jaren tachtig en de opkomst van het internet in de jaren negentig. Er kan simpelweg veel meer tegenwoordig. Toen ik begin deze eeuw mijn onderzoek deed op het Nationaal Archief, toen nog Algemeen Rijksarchief, stonden veel archieven op microfilm, die met een tamelijk onhebbelijk en onhandig apparaat moesten worden geraadpleegd. Het kleinere broertje van de microfilm waren de microfiches, die onder een net zo’n vervelend apparaat moesten worden gelegd. Om de zoveel tijd werd zo’n apparaat mishandeld door een onderzoeker die er geen raad mee wist. Nog maar iets langer dan tien jaar geleden werden er ook nieuwe archieven op microfiche gezet. Tegenwoordig is dat tamelijk ondenkbaar, of zou dat in ieder geval moeten zijn. Wat gedigitaliseerd moet worden gaat onder de scanner en de scans zet je online, al dan niet achter een ‘slot’ waarvoor je moet betalen.
In de jaren tachtig, maar in grotere mate in de jaren negentig, gingen historici werken met databases voor hun data. Oorspronkelijk vooral sociaal-economische historici, maar vervolgens ook andere historici die op wat voor manier ook hun data wilden ordenen. Microsoft Acces was een van de populairste databases voor niet-numerieke data. Sommige historici gingen ook hun werk, of in ieder geval hun database, publiceren op floppy disk, of, later, op CD-rom. Historici die zo voortvarend te werk gingen hadden goede redenen om dat te doen. In plaats van de inhoud van de hele database als bijlage op papier te printen, wat de drukkosten veel hoger zou maken, kon iedereen alles gewoon digitaal krijgen en dan ook nog eens met een druk op de knop doorzoeken.
Het nadeel van een dergelijke manier van publiceren was dat floppy disks en CD-roms snel verouderden. In het eerste decennium van de eenentwintigste eeuw werden computers in toenemende mate zonder floppy drive gemaakt. Onderzoekers begonnen massaal memory sticks te gebruiken en de floppy’s die er nog waren, werden in toenemende mate onleesbaar door schade. Ook CD-ROMS zou dat lot wachten. Buiten het feit dat sommige machines helemaal geen disk drive meer hebben tegenwoordig, is de software op de CD-ROMs verouderd, waardoor het niet altijd evident is dat ze nu nog leesbaar of bruikbaar zijn.
Voor al die oudere digitale datasets zijn er overigens wel oplossingen. Ze kunnen compatibel gemaakt worden met moderne software door een dataconversie, ze kunnen online gezet worden; ze kunnen zelfs gelinkt worden aan andere databases. Dat kost allemaal echter wel het nodige werk, en daardoor ook geld, dus uiteindelijk zullen er ongetwijfeld waardevolle gegevens definitief verloren gaan in de digitale vergeetput. Het is echter lastig om dat op betrouwbare manier te inventariseren.
De meest revolutionaire stap in dit digitaliseringsproces, en ook de uiteindelijke opmaat naar de ‘Digital Humanities’, is de opkomst van het internet in de jaren negentig en het wijdverbreide gebruik van thuiscomputers. Verbeterde thuissoftware maakten de eerste stappen naar een massale digitalisering mogelijk. Historici gingen primaire en secundaire bronnen voor het eerst ook online bekijken. Zeker voor classici, die hoe dan ook een beperkt aantal teksten tot hun beschikking hebben, was dit een uitkomst.
‘Digital humanities’ is dus bijna net zo oud als de uitvinding van de computer. In digital humanities werkt men met ‘big data’: data die te omvangrijk is om helemaal te lezen, of bestuderen. Hoe groot die data precies is kan erg verschillen per project, evenals de ‘omvang’ van de tools die je er op los kan laten. Soms is er een grote ‘server’ nodig om de algoritmes te laten lopen, maar tegenwoordig kan het steeds vaker ook op de eigen PC of laptop. Pas sinds de jaren negentig echter maakt de computer een integraal deel uit van de workflow van alle historici, en pas sinds deze eeuw is ‘digital humanities’ een vakgebied, dat niet alleen voorbehouden is aan de toch al meer kwantitatief ingestelde sociaal-economische historici.
==================================
[1] G. Zaagsma, ‘On Digital History’,. BMGN - Low Countries Historical Review 128 (4) (2013).3–29
[2] Peter Struycken, computerstructuren, 1969. R.H. Fuchs: over het gebruik van computers in beeldende kunst, 143-146, De Gids, 183:2, 1970.