Bitpreservering - kwaliteitscontrole bij opname
Introductie
Benoem de maatregelen die nodig zijn om de kwaliteit van digitale objecten bij opname in het digitaal archief vast te stellen.
Om wat voor type kwaliteitschecks gaat het?
Bij opname stelt een digitaal archief de kwaliteit van de digitale objecten vast. Wat krijgt het digitale archief precies in handen en voldoet het materiaal aan haar eisen? Dat kan bijvoorbeeld met de volgende kwaliteitschecks:
Viruscheck
Virussen zorgen ervoor dat de bitstream van oorspronkelijke objecten verandert. Daarom is het van belang om voorafgaand aan de opname alle binnengekomen digitale objectet te controleren of deze virusvrij zijn.
Volledigheidscheck
Hoe is de kwaliteit van de metadata? Begrijpt een organisatie de herkomst van de digitale objecten? Hoe waarborg je authenticiteit? Bewaar je bijvoorbeeld ook lege mappen als die meegeleverd worden is de zending compleet overgekomen? Hoe checkt de organisatie of dat het geval is? Zie ook aandachtsgebied Metadata van digitale objecten.
Authenticiteitscheck
Het vaststellen van authenticiteit kan op een technische en niet-technische manier. Technische maatregelen bestaan onder meer uit tools om de integriteit van de bit sequentie te controleren (fixity checks) of door controle van informatie over de herkomst. Zie de uitwerking ‘Integriteitschecks‘. Niet-technische maatregelen bestaan bijvoorbeeld uit het checken van de identiteit van de producent van het digitale object. Een combinatie van beide aanpakken is gebruikelijk.
Wat zijn de risico’s als we geen maatregelen voor kwaliteitscontrole vastleggen?
Als een digitaal archief onvoldoende kennis heeft van het materiaal dat in het digitale archief wordt opgenomen, kan ze de integriteit en betrouwbaarheid van de digitale objecten niet garanderen.
Welke vragen kunnen wij onszelf stellen?
- Hoe waarborgen wij de authenticiteit bij opname?
- Is onze organisatie van plan om voorafgaand aan de opname het digitaal materiaal op virussen te controleren?
- Is onze organisatie van plan om een proces in te richten waarbij de volledigheid van de ingestroomde objecten wordt gecheckt?
- Is onze organisatie van plan om een proces in te richten bij de opname van digitale objecten waarbij de bestandsformaten worden geïdentificeerd en gecontroleerd?
- Beschrijft ons duurzaamheidsbeleid de verschillende activiteiten bij opname en maken deze activiteiten onderdeel uit van de standaard opnameprocedure?
Hoe verwoorden andere instellingen kwaliteitscontrole bij opname?
Het Nieuwe Instituut
Ingest
Bij de ingest van de SIP vinden er een aantal controles en identificaties plaats. Dit zijn belangrijke randvoorwaarden voor goed beheer en beschikbaarstelling van digitale informatie. Het gaat daarbij om:
- Karakterisatie;
- Controles op integriteit;
- Viruscontrole en check op beveiliging;
- Check op de submission agreement.
Deze controles en identificaties worden nader uitgewerkt ten aanzien van proces en te gebruiken tools hiervoor.
Nationaal Archief
Ingest
Bij de ingest van de SIP doen wij een aantal controles en identificaties. Dit zijn belangrijke randvoorwaarden voor goed beheer en beschikbaarstelling van digitale informatie. Het gaat om deze controles en identificaties:
- karakterisatie;
- controles op integriteit;
- viruscontrole en check op beveiliging;
- check op de submission agreement.
Karakterisatie
Karakterisatie is een verzamelnaam voor deze vijf handelingen:
- 1. Identificeren van het bestandsformaat. Het bestandsformaat wordt geïdentificeerd en middels een in de metadata opgeslagen unieke verwijzer aan de Technical Registry gekoppeld.
- 2. Valideren. Gekeken wordt of het bestandsformaat is opgebouwd volgens de technische specificaties.
- 3. ‘Meten’. We onderzoeken of er technische eigenschappen zijn die duurzaam beheer in de weg zouden kunnen staan. Denk aan encryptie, compressie, enzovoort. Ook dit wordt opgeslagen in de metadata, met een PUID.
- 4. Identificeren. van embedded objecten, bijvoorbeeld afbeeldingen of grafieken in een Word-bestand. Of van objecten in containerbestanden, bijvoorbeeld e-mails met bijlagen, webpagina’s van een website. Bestandsformaten van deze objecten worden opgeslagen in de metadata, met een PUID.
- 5. Identificeren van bestandseigenschappen (properties). Properties zijn bijvoorbeeld de hoogte en breedte van een afbeelding. Of het aantal bladzijden en woorden van een tekstdocument. De waarden van deze properties worden geëxtraheerd en opgeslagen in de metadata, met een PUID.
Controles op integriteit
We doen ook deze kwaliteitscontroles op integriteit:
- Metadata integrity check. We gaan na of alle content files zijn gespecificeerd in de metadata middels de correcte (relatieve) locatie.
- Content integrity check. We gaan na of de content files zijn gespecificeerd in de metadata XML en of dit consistent gebeurt.
Deze controles zorgen ervoor dat er geen content wordt opgenomen zonder metadata. En andersom: dat er geen metadata zonder content wordt opgenomen.
Een ander integriteitscontrole is de fixity check. De checksum voor elke content file vergelijken we met de originele checksum zoals gespecificeerd in de metadata. Vóór de ingest vindt deze controle plaats na elk transport (ftp, kopiëren enzovoort). Na de ingest gebeurt deze controle periodiek.
Viruscontrole en check op beveiliging
Natuurlijk is er een viruscontrole en is de beveiliging geregeld conform de eisen van de Baseline Informatiebeveiliging Rijksdienst (BIR).
Fout bij het aanmaken van de miniatuurafbeelding: Bestand is zoek
Zie ook
Artikelen- Bitpreservering - integriteitschecks
- Bitpreservering - kopieën
- Bitpreservering - maatregelen in gevallen van dataverlies
- Bitpreservering - persistent identifiers
Specialist(en)
Deze pagina is voor het laatst bewerkt op 9 aug 2024 om 03:11.