De boze historicus en de blije computerwetenschapper
Als ‘digital historian’ is er een interessant verschil tussen het presenteren voor een publiek van computerwetenschappers en een publiek van historici. De computer scientists glimlachen vaak vriendelijk, knikken instemmend en zijn in het algemeen enthousiast. Historici kijken vaak moeilijk, wantrouwend en soms zelfs ronduit boos. Al wordt dat wel steeds minder. Dit is niet omdat historici vervelende mensen zijn in vergelijking met computer scientists. Er zijn echter een aantal fundamentele zaken waardoor ‘digital humanities’ vaak minder goed wordt ontvangen door historici dan door computerwetenschappers.
Veel mensen gaan geschiedenis studeren omdat ze het ‘leuk’ vinden. Er zijn echter ook veel mensen die geschiedenis leuk vinden en toch iets anders gaan studeren, zoals computerwetenschap. Er zijn absoluut gezien veel meer computerwetenschappers dan historici. Onder die vele computerwetenschappers zitten dan ook aardig wat mensen die geschiedenis zien als een ‘leuke hobby’. Dankzij ‘digital humanities’ krijgen computerwetenschappers de kans om de passie voor hun vak toe te passen op hun hobby. Natuurlijk zijn er ook genoeg computerwetenschappers die geschiedenis nutteloos en oninteressant vinden, maar die werken doorgaans niet aan digital humanities projecten.
Onder de absoluut gezien veel kleinere gemeenschap van historici zijn er weinigen die computerwetenschap zien als hobby. Zoals iedere bèta wetenschap is computerwetenschap nu eenmaal minder toegankelijk dan de alfa wetenschappen. Dat wil niet zeggen dat geschiedenis ‘makkelijker’ is dan computerwetenschap. In beide vakgebieden moet je jaren van training hebben om het op een hoog niveau te beoefenen. Het is echter voor een ‘leek’ eenvoudiger om iets te begrijpen van Napoleon en Corruptie dan van Linked Data en C++ en daardoor eenvoudiger voor de computerwetenschapper om een stapje richting geschiedenis te maken dan andersom.
Geschiedenis is overal duidelijk zichtbaar: in films, boeken, toeristische attracties. Computerwetenschap is ook overal, maar altijd ‘verborgen’ in je laptop, een touchscreen of een hogesnelheidstrein. Voor de historicus is computerwetenschap vaak het zoveelste ding om kennis van te nemen voor het eigen onderzoek. Voor de computerwetenschapper is geschiedenis een interessante niche voor het toepassen van de kennis en inzichten van het eigen vakgebied. De kans op aversie van de historicus richting de computerwetenschap is derhalve om te beginnen al een stuk groter dan andersom. Er zijn echter nog meer redenen te bedenken, die ik hieronder uiteen zal zetten.
Digital Humanities kaapt al het geld weg
In de wetenschap is het helaas vechten voor financiering. Tijdens de opmars van Digital Humanities is er relatief veel financiering voor vrijgekomen. Dus als je als hardcore traditionele historicus een prachtig onderzoeksvoorstel hebt geschreven om de geschriften van Caesarius van Heisterbach nader te bestuderen, en dat voorstel is nu al zeven keer afgewezen, en je buurman haalt achteloos een paar miljoen binnen voor het zoveelste digital humanities project, dan is er natuurlijk kans dat dat een beetje scheve ogen geeft. Daar hangt mee samen dat bijna niemand meer een onderzoeksvoorstel de deur uit durft te doen zonder daar een digitale component in te stoppen, ook als dat eigenlijk niet nodig is of nauwelijks meerwaarde heeft. Hierdoor kan het idee leven dat de opkomst van digital humanities in het algemeen, het moeilijker maakt om financiering los te krijgen voor ‘traditioneel’ onderzoek.
Ik beschik niet over harde cijfers, maar vermoed dat het wel meevalt. Natuurlijk is het niet leuk als Digital Humanities projecten jouw eigen onderzoek weg lijken te drukken, maar er moet ook rekening mee worden gehouden dat Digital Humanities deels meelift op geld van de computerwetenschappen. Aangezien het vaak om interdisciplinaire projecten gaat, kunnen voorstellen zowel bij de alfa’s als de beta’s ingediend worden, of bij speciale ‘digital humanities tracks’ (al kan je je natuurlijk afvragen waar dat geld dan vandaan komt).
Digital Humanities denkt het antwoord te hebben op alles
Wat opvalt bij kritische vragen uit het publiek is dat vaak verondersteld wordt dat Digital Humanities onderzoekers beweren iets te kunnen of te weten, wat zij helemaal niet beweerd hebben. Sterker nog, vaak hebben zij zelfs expliciet gezegd iets niet te weten of kunnen. Wat met digitaal onderzoek gedaan kan worden is beperkt omdat geschiedenis nu eenmaal geen exacte wetenschap is. Je kunt niet alles meten en humanities data is moeilijk te interpreteren. Ik heb nog nooit een digital humanist of computerwetenschapper meegemaakt die ook maar iets in de richting van alwetendheid beweerde. Deze reden om boos te zijn is daarom denk ik voornamelijk gestoeld op angst voor het onbekende, wat gelukkig steeds minder wordt.
Digital Humanities weet niets van Humanities
Dit verwijt is misschien een beetje raar, aangezien ‘Digital Humanists’ doorgaans toch goed getrainde geesteswetenschappers zijn. Het daarbij laten zou echter een beetje te makkelijk zijn, want begrijpelijk is het wel. Niet ieder digital humanities team is even braaf met het integreren van de humanities.
Een team van Google Books heeft bijvoorbeeld in 2011 het eerder genoemde artikel gepubliceerd in Science over patronen in de faam van mensen.[1] Voor zover ik kan zien heeft geen historicus aan die publicatie meegewerkt. Er zijn ook vele kritische aantekeningen te plaatsen bij de publicatie, onder meer door ondergetekende. De kritiek moet zich dan echter vooral richten op hoe het onderzoek beter gedaan had kunnen worden. Op zich zijn de auteurs al redelijk voorzichtig met hun uitspraken en laten ze gewoon de trends zien zoals die in hun dataset met hun beperkte algoritmes naar voren komen. Dus ze weten misschien te weinig van de humanities om hun gepropageerde culturonomics heel veel zeggenschap te geven, maar hun artikel prikkelt, laat de nodige trends zien en heeft vele historici aan het denken en schrijven gezet. Dus zelfs als projecten het zonder historici doen, dan betekent dat niet meteen dat de resultaten onzinnig zijn.
Digital Humanities heeft geen theorie of context
Dit verwijt is een terecht gevaar. Digital Humanities tools rukken vaak woorden uit teksten, gooien ze in een grote smeltkroes, stampen er een paar algoritmes overheen en komen met een uitkomst waar de historicus iets mee moet. Gelukkig is dit vaak slechts een deel van het proces en proberen veel digital humanists deze ‘decontekstualisering’ tegen te gaan, door bijvoorbeeld het opnemen van verwijzingen of links naar de originele bronnen. Het zou een ongelukkige wereld worden als historici nooit meer teksten of hele werken in zijn geheel lazen. Dat is en blijft een noodzakelijke stap in het onderzoeksproces om te kunnen komen tot zinnige interpretaties van wat je ziet.
Digital Humanities doet overal precies hetzelfde
Historici onderzoeken doorgaans lokale, regionale, nationale of zelfs mondiale geschiedenis. Het is op die manier vrij eenvoudig om onderwerpen te onderzoeken waar nog relatief weinig over geschreven is. Bovendien wordt de geschiedenis steeds langer, dus dat creëert als het ware vanzelf nieuw werk. Bij Digital Humanities onderzoek gaat het voor de historicus soms om het beantwoorden van vragen, maar vaak ook om het maken van een tool of om het uitwerken van een methodologie. De methodologie en de tool zijn vaak universeel, waardoor over de hele wereld digital humanists zich bezighouden met dezelfde soort vragen, zoals: Hoe leer je een computer een historische tekst te interpreteren? Waar ligt de grens van wat een machine nu kan of ooit zal kunnen? Hoe visualiseer je historische netwerken het beste?
Dus waar historici zich altijd kunnen richten op iets dat gewoon nog niet (goed genoeg) is uitgezocht, doen digital humanists dat niet altijd, en als ze dat doen is het niet altijd de hoofdzaak. Dat betekent inderdaad dat het kan lijken alsof digital humanists overal hetzelfde doen. Aan de ene kant denk ik dat dat niet zo erg is. Het is niet zo dat overal ter wereld tools worden gebouwd voor precies dezelfde soort vragen en data. Het is niet noodzakelijkerwijs erg dat overal ter wereld onderzoekers tot vergelijkbare inzichten komen over hoe je digital humanities onderzoek moet aanpakken. Wetenschap komt doorgaans vooruit met veel kleine doorbraken, of een paar grotere, die op verschillende plekken parallel gedaan worden. Zo is de boekdrukkunst door meerdere mensen ‘uitgevonden’, de evolutietheorie door meerdere personen rond dezelfde tijd geconcipieerd, en werd door meerdere personen in de tweede helft van de achttiende eeuw geëxperimenteerd met vaccinaties.
Uiteindelijk is het echter geen onterechte opmerking dat Digital Humanists zich relatief vaak bezighouden met de vraag hoe ze een vraag moeten beantwoorden, en wat minder met het daadwerkelijk beantwoorden van een vraag. Het is aan de digitale historicus van de toekomst om dat om te draaien.
Digital Humanities bevestigt alleen maar de canon
Niet alleen doet digital humanities niets bijzonders, er wordt ook nog eens niets nieuws gedaan. Waar komt dit verwijt vandaan? Het antwoord ligt in het beperkte ‘bronnenmateriaal’ dat de digital humanist tot zijn of haar beschikking heeft. Hoewel het met de digitalisering van boeken en kranten tamelijk goed gaat, zijn er nog maar weinig archieven omgetoverd tot een digitale ‘dataset’. Goede digitalisering kost veel geld en er is erg veel materiaal om te digitaliseren. Archieven moeten dus keuzes maken in wat ze digitaal beschikbaar maken. En drie keer raden wat ze dan, heel begrijpelijk, als eerste kiezen: de meest geraadpleegde stukken. Dus de stukken die toch al het meest geraadpleegd worden, worden nu nog beter beschikbaar gemaakt waardoor ze nog vele malen vaker geraadpleegd worden. Minder geraadpleegde archieven blijven minder geraadpleegd. Dit is natuurlijk geen goede zaak als je vooruitgang wilt in de historische wetenschap.
Zelfs als archiefmateriaal is gedigitaliseerd, dan is het nog niet meteen goed te lezen door een computer. De krantenbank van de Koninklijke Bibliotheek heeft meer dan twaalf miljoen Nederlandse kranten gedigitaliseerd. Dus zelfs als het niet alles is, dan is het toch op zijn minst veel, en is er ook een gebalanceerde steekproef mee te maken. Helaas laat de kwaliteit van de OCR (de optical character recognition) te wensen over, zeker als het gaat om de wat oudere kranten. De meest voorkomende fouten, zoals ‘Amsterdam’ dat veelvuldig werd gelezen als ‘Amfterdam’, zijn er inmiddels uitgehaald, maar sommige teksten blijven moeilijk te lezen voor de computer. Als je niet oppast kan je daardoor heel vertekende onderzoeksresultaten krijgen.
Er is dus een reëel gevaar van herhaling van de canon. Dat gevaar is echter te ondervangen door gedigitaliseerde bronnen niet noodzakelijkerwijs centraal te stellen binnen een onderzoek. Als historicus heb je een vraag en daar zoek je de goede bronnen bij, op zo’n manier dat je een gebalanceerd beeld van het verleden denkt te krijgen. Als die bronnen toevallig gedigitaliseerd zijn dan is dat mooi, maar zo niet dan moet er gewoon het archief of de bibliotheek in worden gedoken. Natuurlijk zullen er in de praktijk wel degelijk studenten en onderzoekers zijn die onder tijdsdruk de digitale snelweg, of uitweg, nemen. Het is zaak daar goed voor te waken. Soms is het een acceptabele keuze, soms niet.
Digital Humanities maakt tools, maar doet weinig om ze voor langere tijd te onderhouden
Een probleem voor ieder stukje technologie is dat het snel veroudert. Het gevolg daarvan is dat een tool die het vandaag in principe prima doet, over een paar jaar niet compatibel meer is met de laatste software. Tools moeten dus in principe hun ‘leven lang’ onderhouden worden door de mensen die ze gemaakt hebben. Helaas werken mensen vaak niet meer hun ‘leven lang’ op een (en dezelfde) universiteit. En zelfs als ze dat wel doen, dan is het de vraag of ze nog hun tijd kunnen of mogen besteden aan het onderhouden van tools. Sommige tools raken daardoor snel in de vergetelheid. Soms is het ook praktischer om iets geheel nieuws te bouwen, dan het oude aan te passen. Er zijn wel genoeg initiatieven om alles onder te brengen in grote infrastructuren, maar de veroudering van tools blijft een probleem waar niet zo eenvoudig een antwoord op te geven is.
Digital Humanities heeft goede datasets nodig, niet de zoveelste tool
In het verlengde van het bovenste punt: sommige onderzoekers zien graag zoveel mogelijk data zo goed mogelijk digitaal ontsloten. Natuurlijk is dat noodzakelijk, er is immers nog maar een fractie van het archiefmateriaal digitaal beschikbaar. Het een neemt echter het ander niet weg. Tools zijn nodig om op ‘slimme’ manier die datasets te bevragen. In de praktijk is het echter waar dat er relatief weinig geld is voor datasets en relatief veel voor tools. De reden is simpel: datasets vallen niet onder wetenschappelijke arbeid, zijn daardoor lastiger te financieren en zijn ook voor computerwetenschappers niet interessant, tenzij ze onderdeel maken van een wetenschappelijk project.
Digital Humanities is onderdeel van de moderne ‘meetcultuur’
De afgelopen decennia zijn universiteiten steeds meer in economische termen verstrikt geraakt. Alles moet gemeten worden: het aantal studenten, het aantal voldoendes, het aantal diploma’s, het aantal studiepunten et cetera. Opleidingen die niet ‘rendabel’ of ‘nuttig’ zijn dreigen te worden opgedoekt. Onderzoek dat niet kan ‘meten’ wordt als minderwaardig gezien. Dezelfde managers die verantwoordelijk zijn voor deze meetcultuur worden doorgaans erg blij van Digital Humanities. De humanities krijgen eindelijk een harde kern!
Het is niet vreemd dat je een ‘beetje boos’ wordt als je vakgebied opgeheven dreigt te worden als je al dertig jaar bezig bent met het ontcijferen van potscherven en daar mooie resultaten mee boekt; omdat je onderzoek niet meer van de tijd zou zijn, omdat je te weinig studenten trekt, omdat je onderzoek niet maatschappelijk relevant zou zijn, omdat je te gespecialiseerd bent, omdat je te weinig onderzoeksgeld binnenhaalt. En dan komt er ook nog zoiets als Digital Humanities, dat geprezen wordt als de nieuwe sensatie en waar relatief gezien ook nog eens bakken met geld voor wordt uitgetrokken. En waar, zoals we hierboven hebben gezien, het nodige op aan te merken valt.
Het is denk ik waar dat Digital Humanities beter gedijt dan vele andere onderzoeksstromen bij de huidige meetcultuur. Het is echter de vraag of deze liefde blijvend is. Studentenaantallen vallen tegen, en als de nieuwigheid er af is, en de resultaten wellicht tegenvallen, dan kan dat zomaar reden zijn voor een terugval van de Digital Humanities. Bovendien, als een mestkever tot bloei komt dankzij de kap van het regenwoud, dan geef je niet de mestkever er de schuld van dat alle apen uitsterven, maar degene die het regenwoud aan het kappen is.
=====================
[1] J.B. Michel, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K. Gray, William Brockman, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, and Erez Lieberman Aiden. 2011. Quantitative analysis of culture using millions of digitized books. Science, 131:176–182.