Bitpreservering - persistent identifiers

Introductie

Unieke identificatiecodes zorgen ervoor dat vindbaarheid en de identificatie van digitale objecten gegarandeerd is.

Man met een aantal PID's (persistent identifiers)

Wat verstaan we onder een persistent identifier (PID)?

Een PID is een unieke en permanente identificatiecode van een digitaal object, die op een afgesproken plaats wordt geregistreerd. Zo kun je ervoor zorgen dat de verwijzing naar een digitaal object (een scan, audiovisueel bestand, metadatarecord, etc.) altijd blijft werken. Ook als de bewaarlocatie of het webadres van het digitale object verandert.

Een PID bestaat uit twee componenten: de identificatiecode, en een dienst die het object, zelfs als de locatie na verloop van tijd verandert, lokaliseert. In praktijk zijn dit de PID en de ‘resolver’. PID’s zijn een belangrijk instrument om de vindbaarheid en identificatie van digitale objecten te garanderen.

Verschillende soorten PID’s

Er bestaan verschillende soorten PID’s. Als je de PID-wijzer doorloopt, kom je vanzelf uit bij de PID die jouw organisatie het beste past. De PID-wijzer is ontwikkeld voor de systemen die in Nederland het meest worden gebruikt:

Bij de best-practices van de PID-wijzer kun je meer lezen over de keuzes die andere organisaties maakten bij het implementeren van PID’s. Deze website bevat ook een overzicht van andere PID-systemen.

Ontwikkel beleid

Het is van belang dat de organisatie beleid ontwikkelt met betrekking tot het toekennen van persistent identifiers in zijn collectie(s). In gevallen waarbij de ontvangen objecten al zijn voorzien van een persistent identifier moet de organisatie besluiten of er nog een eigen persistent identifier moet worden toegekend. Om risico’s te verminderen dient de persistent identifier los van het digitale object te worden opgeslagen. Leg daarnaast vast hoe om te gaan met eventuele meerdere (soorten) PID’s per object.

Wat is het risico als we geen persistent identifiers toekennen?

Het door de tijd heen kunnen vinden en identificeren van een digitaal object is essentieel voor duurzame toegang. Zonder persistent identifiers kan de toekomstige vindbaarheid en identificatie van digitale objecten niet gegarandeerd worden.

Welke vragen kunnen wij onszelf stellen?

  • Heeft onze organisatie maatregelen bepaald om aan ieder digitaal object in het digitaal archief een persistent identifier toe te kennen?
  • Heeft onze organisatie besloten welke persistent identifier methodologie het beste bij ons domein past?
  • Heeft onze organisatie besloten hoe wordt omgegaan met persistent identifiers van anderen die al aan de digitale objecten zijn toegekend?
  • Maken de toegekende persistent identifiers deel uit van de zoekfaciliteiten voor digitale objecten?
  • Hoe gaan je om met meerdere persistent identifiers per object?
  • Wat doe je als het object wijzigt, de locatie van het object wijzigt, of wanneer het object aan een ander archief wordt overgedragen?
  • Hoe informeren je je gebruikers over de aanwezigheid van en het gebruik van PID’s?

Hoe verwoorden andere instellingen persistent identifiers?

DANS

De waarborg dat elke wijziging in de gepreserveerde versie van alle onderdelen van een dataset correct wordt gedocumenteerd, is van integraal belang voor de authenticiteit van elke dataset. Het Archief maakt onderscheidt tussen twee vormen van wijziging na opname:

Nieuwe versie en daarom een nieuwe dataset: bij een wijziging in de data. Kleine wijziging: bij een wijziging in metadata, beschrijvende documenten of aanvullende bestanden. Een nieuwe versie wordt gedeponeerd als nieuwe dataset en ontvangt daarom een eigen persistent identifier. De nieuwe en de voorgaande dataset bevatten kruisverwijzingen naar elkaar in hun respectieve beschrijvende metadata. Wanneer er sprake is van een kleine wijziging, wordt deze gedocumenteerd in de administratieve metadata en wordt er geen nieuwe persistent identifier gegenereerd.

Preserveringsplan van Data Archiving and Networked Services (DANS)

Koninklijke Bibliotheek

Elk object (Archival Information Package, AIP) in het e-Depot krijgt van de KB een persistent identifier (PI) die actief wordt beheerd, zodat objecten via de PI bereikbaar blijven. In de toekomst wil de KB op elk logisch niveau van een publicatie (intellectual entity) een PI kunnen toekennen. De PI die de KB toekent is op dit moment de National Bibliography Number (NBN)4. Door de leverancier aangeleverde PI’s (zoals Digital Object Identifier, DOI) worden duurzaam opgeslagen (in het AIP).

Koninklijke Bibliotheek

Stadsarchief Rotterdam

4.3.2 Ingest

Bij de ingest van de SIP worden een aantal controles en identificaties uitgevoerd. Dit zijn belangrijke randvoorwaarden voor goed beheer en beschikbaarstelling van digitale informatie. Het gaat om deze controles en identificaties:

  • karakterisatie;
  • controles op integriteit;
  • virus controle en check op beveiliging;
  • check op de submission agreement.
Karakterisatie

Karakterisatie bestaat uit de volgende vijf handelingen:

  • Identificeren van het bestandsformaat. Het bestandsformaat wordt geïdentificeerd en door middel van een in de metadata opgeslagen PUID (Persistent Unique Identifier) aan de Technical Registry gekoppeld.
  • Valideren. Gekeken wordt of het bestandsformaat is opgebouwd volgens de technische specificaties.
  • ‘Meten’. Onderzocht wordt of er technische eigenschappen zijn die duurzaam beheer in de weg zouden kunnen staan. Denk aan encryptie, compressie, enzovoort. Ook dit wordt opgeslagen in de metadata, met een PUID.
  • Identificeren van embedded objecten, bijvoorbeeld afbeeldingen of grafieken in een Word-bestand, van objecten in containerbestanden, bijvoorbeeld e-mails met bijlagen, webpagina’s van een website. Bestandsformaten van deze objecten worden opgeslagen in de metadata, met een PUID.
  • Identificeren van bestandseigenschappen (properties). Properties zijn bijvoorbeeld de hoogte en breedte van een afbeelding. Of het aantal bladzijden en woorden van een tekstdocument. De waarden van deze properties worden geëxtraheerd en opgeslagen in de metadata, met een PUID.

Stadsarchief Rotterdam

logo van Netwerk Digigaal Erfgoed
Deze wegwijzer is ontwikkeld binnen het Netwerk Digitaal Erfgoed (NDE) en wordt beheerd door de Rijksdienst voor het Cultureel Erfgoed. De illustraties zijn gemaakt door Jørgen Stamp voor digitalbevaring.dk, tenzij anders vermeld.
Vragen, verbeteringen of opmerkingen?
U kunt op deze kennisbank reageren via het reactieformulier.

Deze pagina is voor het laatst bewerkt op 15 aug 2023 om 02:03.