Steekproef - hulpmiddel bij collectiebeheer

Introductie

Om collecties goed te kunnen beheren en begrotingen en plannen te kunnen maken, heeft de collectiebeheerder informatie over de collectie nodig in de vorm van aantallen, cijfers en percentages. Hoeveel objecten zijn er? Hoeveel objecten moeten nog gefotografeerd worden? Wat is de fysieke staat ervan? Op hoeveel objecten rust auteursrecht? En hoeveel verpakkingseenheden zijn er nodig om de collectie te verpakken? Het zijn allemaal vragen die om een statistische onderbouwing vragen.

Steekproef als hulpmiddel

Vaak zijn collecties zijn zo groot dat niet elk object bekeken of gecontroleerd kan worden. Dit maakt het voor musea lastig betrouwbare uitspraken te doen over de tijd en het geld die nodig zijn om bepaalde handelingen aan de collectie te verrichten. In zo’n geval biedt een steekproef uitkomst: met de gegevens van een deel van de collectie kun je een uitspraak doen over de gehele collectie. Een steekproef is gebonden aan regels. In dit artikel wordt uiteengezet hoe je een eenvoudige steekproef kunt trekken. Daarbij zijn de volgende begrippen van belang:

  • Populatieomvang: het aantal objecten in een te beoordelen (deel)collectie
  • Steekproefomvang: het aantal objecten dat uit een (deel)collectie wordt geselecteerd voor een steekproef
  • Aselecte steekproef: een steekproef waarbij elk object uit de populatie een even grote kans heeft om te worden gekozen.

Voorwaarden

Een eenvoudige steekproef moet aan twee belangrijke voorwaarden voldoen:

  1. De steekproef moet getrokken worden uit een homogene groep objecten die voor de steekproef relevante, vergelijkbare kenmerken bezitten. Zo kan het belangrijk zijn om groepen objecten met verschillende herkomst, die later zijn samengevoegd tot één collectie, afzonderlijk te bekijken. Een voorbeeld. De matig geregistreerde penningencollectie van een particuliere verzamelaar is in het verleden toegevoegd aan de goed geregistreerde penningencollectie van een museum. Beide delen zijn door de wijze van nummeren nog te herkennen. Zomaar een aselecte steekproef uit de totale collectie trekken heeft niet zoveel zin, omdat de grote verschillen tussen de diverse onderdelen leiden tot een steekproefuitkomst die niet goed de kenmerken van de totale populatie weerspiegelt. De populatie is niet homogeen. Het is dan beter twee aparte steekproeven te trekken.
  2. De populatieomvang moet bekend zijn.

Betrouwbaarheid en foutmarge

Omdat het bij grote populaties onmogelijk is om alle objecten te bekijken of te controleren, kun je nooit een honderd procent nauwkeurige uitspraak doen. Wél is het mogelijk de gewenste betrouwbaarheid aan te geven. In de statistiek is het gebruikelijk te werken met een betrouwbaarheid van 95% of 90%. In het eerste geval betekent dit dat de betrouwbaarheid van de steekproefuitkomst met een marge van maximaal 5% naar boven óf beneden kan afwijken van de totale populatie. In het tweede geval bedraagt de marge maximaal 10% naar boven óf beneden.

Ook de foutmarge is van belang. Die geeft de nauwkeurigheid van de steekproef aan en moet vooraf worden aangegeven. De foutmarge is het percentage waarin de gegevens van de totale populatie naar boven of beneden mogen afwijken van het steekproefresultaat.

De mate van de betrouwbaarheid en foutmarge heeft consequenties voor de steekproefomvang. Anders gezegd: hoe kleiner het gewenste percentage, hoe groter de steekproef moet zijn.

Er zijn diverse online steekproefcalculators beschikbaar waar je populatieomvang, betrouwbaarheidspercentage en foutmarge kunt invullen om de gewenste steekproefomvang te bepalen.

Als de steekproefomvang is bepaald kun je onderzoeken welk collectiedeel wél of niet voldoet aan een bepaalde eigenschap. Welk deel is bijvoorbeeld geregistreerd of verkeert in slechte conditie? Hoe dat gaat wordt hieronder geïllustreerd.

Een natuurhistorisch museum overweegt een particuliere schenking te aanvaarden van 1.915 schelpen. Of het museum de schenking aanvaardt, is afhankelijk van de kosten die de registratie van de verzameling met zich meebrengt. Het museum wil weten van hoeveel schelpen de vindplaats genoteerd is.

Er wordt gekozen voor een betrouwbaarheid van 95% en een foutmarge van 5%. De online steekproefcalculator geeft aan dat bij deze percentages en een populatieomvang van 1.915 er 321 objecten moeten worden bekeken om tot een betrouwbare uitspaak te komen. Deze 321 objecten worden aselect bepaald en bekeken. Na de steekproef blijkt dat van 234 schelpen gegevens over de herkomst aanwezig zijn. Dat is 0,72 (234/321) oftewel 72% van de steekproef.

Omdat de steekproefomvang voldoende groot is, kun je nu met 95% betrouwbaarheid beweren dat tussen de (72% - 5%) 67% en (72% + 5%) 77% van de totale populatie schelpen vergezeld gaat van de vondstgegevens. Op basis van deze percentages kan het museum een minimale en maximale begroting opstellen voor het registratieproject.

Bij eenzelfde berekening op basis van een gewenste betrouwbaarheid van 95% maar een foutmarge van 10% hoef je slechts 66 schelpen te bekijken. Daarvan gaan er bijvoorbeeld 52 vergezeld van de vondstgegevens. Dat is 0,78 (52/66) oftewel 78% van de steekproef. Echter, omdat gekozen is voor een kleinere nauwkeurigheid, kan slechts worden beweerd dat tussen de (68% - 10%) 58% en (68% + 10%) 78% van de schelpen is geregistreerd. Vertaald in een begroting wordt duidelijk dat de minimale en maximale kosten verder uit elkaar liggen dan bij een foutmarge van slechts 5%.

Willekeurig getal

Het is van belang dat de steekproefomvang aselect, dus door het toeval wordt bepaald. Spreadsheetprogramma’s zoals Excel kunnen helpen met het genereren van willekeurige getallen. Ook kun je een online ‘random number generator’ gebruiken. Om willekeurige getallen te kunnen gebruiken moeten de objecten uit een populatie gekoppeld zijn aan een nummer. Het is aan te bevelen om de objecten (in elk geval voor de duur van de steekproef) een nummer te geven. Een voorbeeld kan dit verduidelijken.

Een schelpenverzameling wordt bewaard in vier ladekasten. Elke kast heeft vijf laden die weer zijn onderverdeeld in kleine vakjes. In elk vakje ligt een schelp en al dan niet een kaartje met de vondstgegevens. De vakjes worden tijdelijk genummerd van 1 tot 1.915. Met behulp van de computer wordt een lijst van 321 willekeurige cijfers bepaald (de steekproefomvang bij een gekozen betrouwbaarheid van 95% en foutmarge van 5%). Vervolgens wordt de inhoud van de 321 vakjes bekeken.

Op vergelijkbare wijze kunnen stellingen, kasten, legborden, dozen, rekken en objecten worden genummerd.

Als de objecten uit een populatie die bekeken moet worden een opeenvolgend registratienummer hebben, is zo’n nummer ook te gebruiken als uitgangspunt voor het bepalen van de willekeurige getallen.

Met behulp van Excel zijn op de volgende manier een reeks willekeurige getallen te bepalen:

  • Klik in een leeg werkblad een willekeurige cel aan.
  • Typ in de formulebalk van Excel in: =aselect()*(1915-1)+1 en geef enter
  • Het berekent een toevalscijfer tussen de 1 en 1915. De cijfers (in dit geval 1915 en 1) bepalen waartussen het toevalscijfer wordt berekend. =aselect()*(500-27)+27 betekent bijvoorbeeld dat de computer een getal berekent tussen de 27 en 500.
  • Kopieer de formule naar het aantal cellen dat overeenkomt met de steekproefomvang.
  • Rond de cijfers af met behulp van ‘rechtermuisknop/celeigenschappen/ getal/decimalen’.

Geavanceerd

De cijfers kunnen eventueel nog oplopend worden gesorteerd. Daartoe moet je de cijferwaarden (en dus niet de formules) echter eerst met ‘bewerken/plakken speciaal/waarden’ kopiëren naar vrije cellen. Zie vervolgens: sorteren van laag naar hoog.

Zie ook

Hoort bij deze thema's

Specialist(en)

U kunt op deze kennisbank reageren via het reactieformulier.

Deze pagina is voor het laatst bewerkt op 14 mei 2022 om 02:01.