Vzorkovanie s náhradou alebo bez nej

click fraud protection

Štatistické výbery je možné vykonať rôznymi spôsobmi. Okrem typu metódy odberu vzoriek, ktorú používame, existuje aj iná otázka týkajúca sa toho, čo sa konkrétne deje jednotlivcovi, ktorého sme náhodne vybrali. Táto otázka, ktorá vzniká pri vzorkovaní, znie: „Po výbere jednotlivca a zaznamenaní merania atribútu, ktorý študujeme, čo robíme s týmto jedincom?“

Existujú dve možnosti:

  • Môžeme nahradiť jednotlivca späť do bazéna, z ktorého vzorkujeme.
  • Môžeme sa rozhodnúť nenahradiť jednotlivca.

Veľmi ľahko vidíme, že to vedie k dvom odlišným situáciám. Pri prvej možnosti náhrada ponecháva otvorenú možnosť, že jednotlivec je náhodne vybraný druhýkrát. Pokiaľ pracujeme bez náhrady, pri druhej možnosti nie je možné vybrať tú istú osobu dvakrát. Uvidíme, že tento rozdiel ovplyvní výpočet pravdepodobností súvisiacich s týmito vzorkami.

Vplyv na pravdepodobnosti

Ak chcete zistiť, ako zaobchádzame s náhradou, ovplyvňuje výpočet pravdepodobností, zvážte nasledujúcu otázku. Aká je pravdepodobnosť čerpania dvoch es z a štandardný balíček kariet?

instagram viewer

Táto otázka je nejednoznačná. Čo sa stane, keď vytiahneme prvú kartu? Dáme to späť do balíčka alebo ho necháme von?

Začneme výpočtom pravdepodobnosti s náhradou. K dispozícii sú štyri esá a 52 kariet celkom, takže pravdepodobnosť losovania jedného esa je 4/52. Ak túto kartu vymeníme a znova ju vytiahneme, pravdepodobnosť bude opäť 4/52. Tieto udalosti sú nezávislé, takže vynásobíme pravdepodobnosti (4/52) x (4/52) = 1/169, alebo približne 0,592%.

Teraz to porovnáme s rovnakou situáciou s výnimkou toho, že karty nevymieňame. Pravdepodobnosť vytiahnutia esa pri prvom žrebovaní je stále 4/52. Pokiaľ ide o druhú kartu, predpokladáme, že eso už bolo vypracované. Teraz musíme vypočítať podmienenú pravdepodobnosť. Inými slovami, musíme vedieť, aká je pravdepodobnosť vylosovania druhého esa, keďže prvá karta je aj eso.

Z celkového počtu 51 kariet ostávajú tri esá. Podmienená pravdepodobnosť druhého esa po nakreslení esa je 3/51. Pravdepodobnosť vytiahnutia dvoch es bez náhrady je (4/52) x (3/51) = 1/221 alebo približne 0,425%.

Priamo z vyššie uvedeného problému vidíme, že to, čo sa rozhodneme pre výmenu, má vplyv na hodnoty pravdepodobnosti. Tieto hodnoty môže výrazne zmeniť.

Veľkosti obyvateľstva

Existujú situácie, keď odber vzoriek s náhradou alebo bez nej podstatne nezmení pravdepodobnosť. Predpokladajme, že náhodne vyberáme dvoch ľudí z mesta s 50 000 obyvateľmi, z ktorých 30 000 z nich sú ženy.

Ak vzorkujeme s náhradou, pravdepodobnosť výberu ženy pri prvom výbere je daná 30000/50000 = 60%. Pravdepodobnosť ženy pri druhom výbere je stále 60%. Pravdepodobnosť, že budú obe ženy, je 0,6 x 0,6 = 0,36.

Ak vzorkujeme bez náhrady, prvá pravdepodobnosť nie je ovplyvnená. Druhá pravdepodobnosť je teraz 29999/49999 = 0,5999999998..., čo je veľmi blízko k 60%. Pravdepodobnosť, že obidve sú ženy, je 0,6 x 0,5999919998 = 0,359995.

Pravdepodobnosti sú technicky odlišné, sú však dosť blízko na to, aby boli takmer nerozoznateľné. Z tohto dôvodu, aj keď vzorkujeme bez náhrady, s výberom každého jednotlivca zaobchádzame, akoby boli nezávislí od ostatných jednotlivcov vo vzorke.

Ďalšie aplikácie

Existujú aj iné prípady, keď musíme zvážiť, či je potrebné vzorkovať s náhradou alebo bez nej. Príkladom toho je Bootstrapping. Táto štatistická technika patrí pod hlavičku techniky prevzorkovania.

Pri zavádzaní systému bootstrap začneme štatistickou vzorkou populácie. Potom použijeme počítačový softvér na výpočet vzoriek bootstrapu. Inými slovami, počítač sa nahradí náhradou z pôvodnej vzorky.

instagram story viewer