Príklad zavádzania v štatistike

Bootstrapping je výkonná štatistická technika. Je to zvlášť užitočné, keď vzorka veľkosť, s ktorou pracujeme, je malá. Za obvyklých okolností nemožno veľkosť vzoriek menšiu ako 40 vyriešiť za predpokladu, že: a normálne rozdelenie alebo a t distribúcia. Bootstrap techniky pracujú celkom dobre so vzorkami, ktoré majú menej ako 40 prvkov. Dôvodom je to, že zavádzanie systému vyžaduje prevzorkovanie. Tieto druhy techník nepredpokladajú nič o distribúcia našich údajov.

Bootstrapping sa stal populárnejším, pretože počítačové zdroje sa stali dostupnejšie. Dôvodom je skutočnosť, že na to, aby bol zavádzací systém praktický, sa musí použiť počítač. Ako to bude fungovať, uvidíme v nasledujúcom príklade bootstrappingu.

Začneme s štatistická vzorka z populácie, o ktorej nevieme nič. Naším cieľom bude 90% interval spoľahlivosti o priemere vzorky. Aj keď sa na stanovenie použili ďalšie štatistické techniky intervaly spoľahlivosti predpokladajme, že poznáme priemernú alebo štandardnú odchýlku našej populácie, bootstrapping nevyžaduje nič iné ako vzorku.

instagram viewer

Na účely nášho príkladu predpokladáme, že vzorka je 1, 2, 4, 4, 10.

Teraz preberáme vzorky s nahradením z našej vzorky a vytvoríme takzvané bootstrapové vzorky. Každá vzorka bootstrapu bude mať veľkosť päť rovnako ako naša pôvodná vzorka. Pretože náhodne vyberáme a potom nahrádzame každú hodnotu, vzorky bootstrapu sa môžu líšiť od pôvodnej vzorky a od seba navzájom.

Napríklad, do ktorých by sme sa dostali v reálnom svete, by sme to preplánovali stovkami, ak nie tisíckrát. V nasledujúcom texte uvidíme príklad 20 vzoriek bootstrapu:

Pretože na výpočet intervalu spoľahlivosti pre priemernú populáciu používame bootstrapping, teraz vypočítame priemery každej z našich vzoriek bootstrapu. Tieto prostriedky usporiadané vzostupne sú: 2, 2,4, 2,6, 2,6, 2,8, 3, 3, 3,2, 3,4, 3,6, 3,8, 4, 4, 4,2, 4,6, 5,2, 6, 6, 6,6, 7,6.

Získame z nášho zoznamu bootstrap vzorky znamená interval spoľahlivosti. Pretože chceme 90% interval spoľahlivosti, použijeme 95. a 5. percentily ako koncové body intervalov. Dôvodom je to, že rozdelíme 100% - 90% = 10% na polovicu, takže budeme mať stredných 90% všetkých prostriedkov vzoru bootstrapu.