Crowdsourcing maakt zeventiende-eeuwse kranten op Delpher beter doorzoekbaar

Adriaen van Ostade Reading the News at the WeaversCottage Afbeelding: KB

Op Delpher, de website met historisch Nederlandse publicaties, is vanaf vandaag de transcriptie van 6000 Nederlandstalige kranten uit de 17e eeuw en een deel van de Tweede Wereldoorlogskranten doorzoekbaar. Vrijwilligers hebben de afgelopen vijf jaar de krantenartikelen handmatig overgetikt en daarna het resultaat nog eens gecorrigeerd. Het crowdsourcingproject is uitgevoerd als samenwerking tussen de KB, de nationale bibliotheek van Nederland, en het Meertens Instituut, onder leiding van senior-onderzoeker Nicoline van der Sijs.

De totstandkoming van deze aanwinst was een monsterklus: ruim 200 vrijwilligers hebben de afgelopen vijf jaar zo’n 6000 kranten, met maar liefst 18 miljoen woorden handmatig overgetikt. Dankzij dit monnikenwerk kunnen gebruikers van Delpher voortaan veel gemakkelijker informatie vinden over bijvoorbeeld wolven of epidemieën in de zeventiende eeuw, en over de vele gevechtshandelingen in binnen- en buitenland. Ook kunnen ze nazoeken welke producten uitgevers, makelaars en kwakzalvers in advertenties aanboden.

Geschiedenis van de krant
In Nederland worden er al vele eeuwen kranten uitgegeven. Zo verscheen de oudste Nederlandstalige krant op 14 juni 1618, de eerste concurrent zag al begin 1619 het licht. De kranten, met vers nieuws uit binnen- en buitenland, waren onmiddellijk een succes. De daaropvolgende jaren rolden nieuwe titels van de pers en de verschijningsregelmaat werd opgevoerd van wekelijks naar uiteindelijk dagelijks.

Computertechnologie en oude schriften
Al die zeventiende-eeuwse kranten stonden al geruime tijd op Delpher, tot nu toe waren ze echter niet tot nauwelijks doorzoekbaar. De computertechnologie waarmee de kranten automatisch waren gelezen, kon namelijk niet overweg met de oude schriften waarin de kranten waren gezet: het gotische schrift en later een Romeins schrift dat afwijkt van het moderne. Als gevolg hiervan werden de meeste woorden die gebruikers in de oude kranten zochten, niet gevonden en áls een woord werd gevonden, stond er meestal iets anders in het origineel.

Crowdsourcing
Mensen kunnen, anders dan de computer, wél overweg met de oude schriften en het archaïsche taalgebruik. Om de toegankelijkheid van de kranten te vergroten, hebben de KB en het Meertens Instituut daarom vijf jaar geleden een crowdsourcingproject opgezet. Op het Meertens Instituut is een speciale applicatie gebouwd, via welke vrijwilligers de tekst handmatig konden transcriberen. Uiteindelijk hebben meer dan tweehonderd vrijwilligers een steentje aan dit enorme karwei bijgedragen.