Selectie en verwerking van het materiaal

Selectiecriteria

Auteurs gebruikten heel verschillende titels voor hun geschriften – sommige mensen noemden hun tekst een kroniek, maar op de titelpagina’s heten de teksten ook wel memorieboek, ‘geschiedenisse’, ‘annotatien’, ‘annalen’ en zo voort. Bij het selecteren van het materiaal voor deze kroniekenverzameling konden we ons dus niet laten leiden door titels. Wij hebben bij de selectie op drie dingen gelet: we zochten teksten die een chronologische ordening hadden (jaar na jaar, maand na maand, dag na dag), en die focusten op ontwikkelingen in de lokale gemeenschap (ook al schrijven sommige auteurs ook over zichzelf en hun familie). Omdat wij vooral wilden weten hoe kroniekschrijvers nadachten over nieuwe dingen in hun omgeving, selecteerden we bovendien auteurs die niet alleen over het verleden schreven maar juist ook, of zelfs alleen, over hun eigen tijd. Tenslotte hebben we alle kronieken die we tegenkwamen van vrouwen opgenomen in ons corpus. Omdat vrouwelijke auteurs zeldzaam zijn, hebben we ook enkele kronieken van kloosterzusters geselecteerd mits ze ook aandacht besteedden aan de gebeurtenissen buiten het klooster.

Zoekstrategieën

We hebben bij de selectie dankbaar gebruik gemaakt van teksten die al eens werden uitgegeven – die zijn voor ons gedigitaliseerd en gepubliceerd in de Digitale Bibliotheek der Nederlandse Letteren (DBNL) mits de uitgave compleet was en van voldoende kwaliteit. De volledige editie vindt u op de website van de DBNL, in onze data op deze website vindt u uitsluitend de tekst van de kroniek zelf. Als u zoekt of bladert in deze transcripties krijgt u niet het originele handschrift te zien maar een dummy afbeelding . Maar we selecteerden ook veel kronieken die nog alleen in handschrift bestonden. Om die te vinden hebben we vooral rijksarchieven in Nederland en België bezocht, een aantal stadsarchieven en enkele universiteitsbibliotheken. We spoorden kronieken op door met name de handschriftenverzamelingen door te nemen, met zoekwoorden door de online inventarissen te gaan en door te spreken met de lokale archiefmedewerkers. Veel hebben we ook gehad aan de lijsten met egodocumenten samengesteld door Rudolf Dekker en Arianne Baggerman http://www.egodocument.net/index.html

Wegens de beperkte tijd die we hiervoor hadden was onze zoekmethode verre van uitputtend en krijgen wij nog regelmatig tips over kronieken die we niet kenden. Er moeten zich ook nog veel kronieken in privébezit bevinden. Wij hebben vooral gepoogd kronieken te verzamelen uit alle Nederlandstalige provincies van Nederland en België. Aan de kaart is te zien dat dat redelijk gelukt is hoewel de oostelijke provincies Groningen, Drente, Overijssel, Gelderland en ook Belgisch Limburg wat minder goed vertegenwoordigd zijn. Dit heeft ook te maken met de lagere urbanisatiegraad in deze regio’s. Kroniekschijven is niet uitsluitend maar wel overwegend een stedelijke activiteit.

Tabel 1: Overzicht van aantallen gedigitaliseerde kronieken in het corpus per 1 januari 2023

Scans

Archieven met goede scanfaciliteiten hebben de kronieken voor ons gescand. In veel kleinere archieven en bibliotheken zijn dergelijke faciliteiten niet beschikbaar. In die gevallen hebben we gebruik gemaakt van de zogenaamde scantent, (ontwikkeld door de TU Wenen voor Transkribus). Bij de omvangrijkere kronieken leverde dit soms wel problemen op. Soms verdwijnt tekst in de kneep van de band en de pagina’s zijn niet altijd gelijkmatig belicht en scherp gesteld. Op onze scans vindt u ook handen en vingers in beeld die de pagina’s openhouden.

Alie Lassche en Theo Dekker aan het werk met de scantent

Transcripties

De transcripties zijn gemaakt en gecontroleerd door vrijwilligers op het crowdsourcingsplatform Vele Handen in de periode zomer 2019 - eind 2021 in combinatie met de door Transkribus ontwikkelde Hand-written Text Recognition technologie (HTR). Bij het transcriberen en corrigeren van de transcripties maakten de vrijwilligers gebruik van deze handleiding hier. In het algemeen hebben we diplomatisch getranscribeerd, dat wil zeggen dat we zo dicht mogelijk bij het origineel zijn gebleven. Minimale normalisatie is doorgevoerd m.b.t. heel veel voorkomende afkortingen (uitgeschreven), interpunctie die geen doel dient (die is weggelaten), hetzelfde geldt voor in onbruik geraakte diakritische tekens zoals het streepje boven de ‘u’ (niet overgenomen). De kwaliteit van de transcripties variëren al naar gelang van de ervaring van de vrijwilligers. Wil u graag een transcriptie voor eigen gebruik verbeteren, dat kan. Neem contact met ons op.

Annotaties

Ten behoeve van het project Chronicling Novelty is een deel van de kronieken door vrijwilligers geannoteerd door labels aan de tekst toe te voegen voor de datums, de namen van personen en locaties maar ook relevante structuur-elementen zoals paginanummers, door de auteur gekopieerde tekst, drukwerk, afbeeldingen, tabellen en lijsten, en margeteksten. De handleiding die bij het annoteren is gevolgd vindt u hier.

Ten behoeve van het onderzoek van Alie Lassche naar brongebruik door auteurs is een nog kleiner deel van de kronieken ook geannoteerd op informatiebronnen. In dit project zijn de woorden gelabeld die de ‘ontvanger van de informatie’ noemen, de ‘informatiebron’ en de manier waarop die informatie is ontvangen: gelezen, gehoord, gezien of anders. De handleiding die bij het maken van deze annotaties is gevolgd vindt u hier.

Kwaliteit en de mogelijkheid tot correcties en aanvullende annotaties

Wegens de beperkte menskracht en looptijd van ons project hebben we de transcripties van meer dan 30.000 scans, inclusief annotaties, niet allemaal zelf kunnen controleren. Het meeste controlewerk is gedaan door vrijwilligers. Dit is mensenwerk. Naast de lees- en typefouten die u hier en daar zal aantreffen is de handleiding zeker niet 100% consistent gevolgd in het gebruik van hoofdletters, interpunctie enzovoort. Doordat de transcriptie met de scan kan worden vergeleken kan de gebruiker wel zelf controleren of er goed is getranscribeerd.

Voor gebruikers die een specifieke kroniek graag zouden willen verbeteren of aanvullend annoteren is er de mogelijkheid dat we hen toegang geven tot de collectie of dat we hen een kopie geven van het betreffende Transkribus document. Ook archieven geven wij graag de beschikking over de transcripties waarvan zij de originelen bewaren. Aarzel niet en neem contact met ons op als u veel errata bent tegengekomen of plannen heeft.

Toekomst

De publicatie van ons corpus via Read and Search biedt ons en anderen de mogelijkheid dit corpus verder te laten groeien. Mocht u een kroniek op het spoor zijn gekomen die past in deze collectie dan voegen wij hem heel graag toe. Heeft u scans en transcribenten dan helpen wij met onze know-how en het trainen van een computermodel voor het automatisch herkennen van het handschrift. Contact