Keď vytvárame a štatistická vzorka vždy musíme byť opatrní v tom, čo robíme. Existuje mnoho rôznych spôsobov odberu vzoriek, ktoré je možné použiť. Niektoré z nich sú vhodnejšie ako iné.
To, čo si myslíme, že by bol jeden druh vzorky, sa často ukázalo ako iný typ. Toto je vidieť pri porovnaní dvoch typov náhodných vzoriek. jednoduchá náhodná vzorka a systematická náhodná vzorka sú dva rôzne typy techník odberu vzoriek. Rozdiel medzi týmito typmi vzoriek je však jemný a ľahko prehliadateľný. Budeme porovnávať systematické náhodné vzorky s jednoduchými náhodnými vzorkami.
Systematické náhodné vs. Jednoduché Náhodné
Na úvod sa pozrieme na definície dvoch typov vzoriek, ktoré nás zaujímajú. Oba tieto typy vzoriek sú náhodné a predpokladajú, že všetci v EÚ populácia je rovnako pravdepodobné, že bude členom vzorky. Ako však uvidíme, nie všetky náhodné vzorky sú rovnaké.
Rozdiel medzi týmito typmi vzoriek súvisí s druhou časťou definície jednoduchej náhodnej vzorky. Je to jednoduchá náhodná vzorka veľkosti n, každá skupina veľkostí n musí byť rovnako pravdepodobné, že sa vytvoria.
systematická náhodná vzorka spolieha sa na určitý druh výberu členov vzorky. Zatiaľ čo prvý jednotlivec môže byť vybraný náhodnou metódou, následné členy sú vybrané pomocou vopred určeného postupu. Systém, ktorý používame, sa nepovažuje za náhodný, a preto niektoré vzorky, ktoré by sa vytvorili ako jednoduchá náhodná vzorka, nemožno vytvoriť ako systematickú náhodnú vzorku.
Príklad použitia kina
Aby sme videli, prečo tomu tak nie je, pozrieme sa na príklad. Budeme predstierať, že existuje kino s 1000 kreslami, ktoré sú plné. V každej rade je 500 radov s 20 sedadlami. Populácia je tu celá skupina 1000 ľudí vo filme. Porovnáme jednoduchú náhodnú vzorku desiatich divákov so systematickou náhodnou vzorkou rovnakej veľkosti.
- Jednoduchá náhodná vzorka sa môže vytvoriť pomocou a tabuľka náhodných číslic. Po očíslovaní sedadiel 000, 001, 002 až 999 sme náhodne vybrali časť tabuľky náhodných číslic. Prvých desať odlišných troch číslicových blokov, ktoré čítame v tabuľke, sú miesta ľudí, ktorí budú tvoriť našu vzorku.
- Pokiaľ ide o systematickú náhodnú vzorku, môžeme začať náhodným výberom miesta v divadle (pravdepodobne sa to dosiahne vygenerovaním jedného náhodného čísla od 000 do 999). Po tomto náhodnom výbere vyberieme cestujúceho tohto sedadla ako prvého člena našej vzorky. Zostávajúce členy vzorky pochádzajú zo sedadiel, ktoré sú v deviatich radoch priamo za prvým sedadlom (ak dôjdeme z riadkov od naše pôvodné sedadlo bolo v zadnej časti divadla, začíname znova pred divadlom a vyberáme si sedadlá, ktoré sa zarovnajú s naším pôvodným sedlo).
Pri oboch typoch vzoriek je rovnako pravdepodobné, že sa vyberú všetci v divadle. Aj keď v oboch prípadoch získame súbor 10 náhodne vybraných ľudí, metódy odberu vzoriek sú odlišné. Pre jednoduchú náhodnú vzorku je možné mať vzorku, ktorá obsahuje dvoch ľudí, ktorí sedia vedľa seba. Avšak spôsobom, ako sme zostavili našu systematickú náhodnú vzorku, je nielen možné mať susedných sedadiel v tej istej vzorke, ale dokonca mať vzorku obsahujúcu dve osoby z tej istej vzorky riadok.
Aký je rozdiel?
Rozdiel medzi jednoduchými náhodnými vzorkami a systematickými náhodnými vzorkami sa môže zdať malý, musíme však byť opatrní. Aby sme mohli správne využívať veľa výsledkov v štatistike, musíme to predpokladať procesy použité na získanie našich údajov boli náhodné a nezávislé. Keď použijeme systematickú vzorku, aj keď sa použije náhodnosť, už nemáme nezávislosť.