Čo je to štatistický výber?

Vedci mnohokrát chcú vedieť odpovede na rozsiahle otázky. Napríklad:

  • Čo včera v noci sledovali všetci v konkrétnej krajine v televízii?
  • Kto robí voličov majú v úmysle hlasovať v nadchádzajúcich voľbách?
  • Koľko vtákov sa vracia z migrácie na určitom mieste?
  • Aké percento pracovnej sily je nezamestnaných?

Tieto druhy otázok sú obrovské v tom zmysle, že od nás vyžadujú, aby sme sledovali milióny jednotlivcov.

Štatistika zjednodušuje tieto problémy pomocou techniky nazývanej vzorkovanie. Vykonaním štatistickej vzorky je možné naše pracovné zaťaženie nesmierne znížiť. Namiesto sledovania správania miliárd alebo miliónov musíme skúmať iba tisíce alebo stovky. Ako uvidíme, toto zjednodušenie je spoplatnené.

Obyvateľstvo a sčítanie ľudu

O populácii štatistickej štúdie sa snažíme niečo zistiť. Pozostáva zo všetkých vyšetrovaných jednotlivcov. Obyvateľstvo môže byť naozaj čokoľvek. Kalifornia, caribous, počítače, autá alebo kraje by sa podľa štatistickej otázky mohli považovať za populácie. Hoci väčšina skúmaných populácií je veľká, nemusia byť nevyhnutne.

instagram viewer

Jednou zo stratégií prieskumu populácie je uskutočnenie sčítania. Pri sčítaní ľudu skúmame v našej štúdii každého člena populácie. Prvým príkladom je Americké sčítanie ľudu. Úrad pre sčítanie ľudu každých desať rokov pošle dotazník všetkým v krajine. Tí, ktorí formulár nevrátia, navštívia pracovníci sčítania

Sčítanie ľudu je spojené s ťažkosťami. Zvyčajne sú drahé z hľadiska času a zdrojov. Okrem toho je ťažké zaručiť, že sa dostane do všetkých obyvateľov. S ostatnými sčítaniami obyvateľov je ešte ťažšie uskutočniť. Ak by sme chceli študovať návyky túlavých psov v štáte New York, šťastie sa zaokrúhli nahor všetko z týchto prechodných psov.

vzorky

Keďže je zvyčajne nemožné alebo nepraktické vystopovať každého člena populácie, ďalšou dostupnou možnosťou je vzorkovanie populácie. Vzorka je akákoľvek podskupina populácie, takže jej veľkosť môže byť malá alebo veľká. Chceme, aby bola vzorka dostatočne malá, aby sa dala zvládnuť naším výpočtovým výkonom, ale dostatočne veľká, aby nám poskytla štatisticky významné výsledky.

Ak sa volebná firma snaží určiť spokojnosť voličov s Kongresom a jeho veľkosť vzorky je jedna, potom výsledky nebudú mať zmysel (ale dajú sa ľahko získať). Na druhej strane, dopyt miliónov ľudí spotrebuje príliš veľa zdrojov. Aby sa dosiahla rovnováha, prieskumy verejnej mienky tohto typu majú zvyčajne veľkosť vzoriek okolo 1000.

Náhodné vzorky

Ale mať správnu veľkosť vzorky nestačí na zabezpečenie dobrých výsledkov. Chceme vzorku, ktorá bude reprezentovať obyvateľstvo. Predpokladajme, že chceme zistiť, koľko kníh priemerný Američan číta ročne. Žiadame 2000 vysokoškolských študentov, aby sledovali, čo čítali v priebehu roka, a potom, čo uplynie rok, sa s nimi skontrolujte. Zistili sme, že priemerný počet prečítaných kníh je 12 a potom sme dospeli k záveru, že priemerný Američan číta ročne 12 kníh.

Problém s týmto scenárom je so vzorkou. Väčšina študentov vysokých škôl má 18 až 25 rokov a ich inštruktori sú povinní čítať učebnice a romány. Toto je zlé zastúpenie priemerného Američana. Dobrá vzorka bude obsahovať ľudí rôzneho veku, zo všetkých spoločenských vrstiev az rôznych oblastí krajiny. Na získanie takejto vzorky by sme ju museli zostaviť náhodne, aby každý Američan mal rovnakú pravdepodobnosť, že bude vo vzorke.

Druhy vzoriek

Zlatým štandardom štatistických experimentov je jednoduchá náhodná vzorka. V takej vzorke veľkosti n jednotlivci, každý člen populácie má rovnakú pravdepodobnosť, že bude vybraný do vzorky a každej skupiny n jednotlivci majú rovnakú pravdepodobnosť, že budú vybraní. Existuje niekoľko spôsobov, ako vzorkovať populáciu. Medzi najbežnejšie patria:

  • Náhodná vzorka
  • Jednoduchá náhodná vzorka
  • Vzorka dobrovoľnej reakcie
  • Vzorka pohodlia
  • Systematická vzorka
  • Vzorka klastra
  • Stratifikovaná vzorka

Niektoré rady

Ako sa hovorí, „Dobré začatie je hotové.“ Aby sme zaistili dobré výsledky našich štatistických štúdií a experimentov, musíme ich starostlivo naplánovať a začať. Je ľahké prísť so zlými štatistickými vzorkami. dobrý jednoduché náhodné vzorky vyžadovať nejakú prácu. Ak boli naše údaje získané náhodne a kavalierne, potom, bez ohľadu na to, ako dômyselná je naša analýza, štatistické techniky nám nedajú žiadne užitočné závery.