Ako nájsť stupne slobody v štatistike

Mnoho problémov so štatistickým odvodením vyžaduje, aby sme našli počet stupne slobody. Počet stupňov voľnosti vyberie jeden rozdelenia pravdepodobnosti z nekonečne veľa. Tento krok je často prehliadaný, ale zásadný detail pri výpočteintervaly spoľahlivosti a fungovanie testy hypotéz.

Neexistuje jednotný všeobecný vzorec pre počet stupňov slobody. Existujú však osobitné vzorce používané pre každý typ postupu v inferenciálnej štatistike. Inými slovami, nastavenie, v ktorom pracujeme, bude určovať počet stupňov slobody. Nasleduje čiastočný zoznam niektorých najbežnejších inferenčných postupov spolu s počtom stupňov voľnosti, ktoré sa používajú v každej situácii.

Štandardné normálne rozdelenie

Postupy zahŕňajúce: štandardné normálne rozdelenie sú uvedené kvôli úplnosti a objasneniu niektorých mylných predstáv. Tieto postupy nevyžadujú, aby sme našli počet stupňov slobody. Dôvodom je to, že existuje jednotné štandardné rozdelenie. Tieto typy postupov zahŕňajú tie, ktoré zahŕňajú populáciu, keď už je známa smerodajná odchýlka populácie, ako aj postupy týkajúce sa pomerov obyvateľstva.

instagram viewer

Jedna vzorová procedúra T

Štatistická prax niekedy vyžaduje použitie Studentovej t-distribúcie. Pri týchto postupoch, ako sú postupy, ktoré sa zaoberajú populáciou, je priemerná odchýlka neznáma, počet stupňov voľnosti je o jeden menší ako veľkosť vzorky. Ak je teda veľkosť vzorky n, potom sú n - 1 stupeň voľnosti.

Postupy T s párovými údajmi

Mnohokrát to dáva zmysel zaobchádzať s údajmi ako so spárovanými. Párovanie sa typicky uskutočňuje kvôli spojeniu medzi prvou a druhou hodnotou v našom páre. Mnohokrát sme sa párovali pred a po meraní. Naša vzorka spárovaných údajov nie je nezávislá; rozdiel medzi každým párom je však nezávislý. Ak teda vzorka má celkom n dvojice údajových bodov (spolu 2n hodnoty) n - 1 stupeň voľnosti.

Postupy T pre dve nezávislé populácie

Pre tieto typy problémov stále používame a t-rozdelenie. Tentoraz je vzorka od každej z našich populácií. Aj keď je lepšie mať tieto dve vzorky rovnakej veľkosti, nie je to potrebné pre naše štatistické postupy. Môžeme teda mať dve vzorky veľkosti n1 a n2. Počet stupňov voľnosti je možné určiť dvoma spôsobmi. Presnejšou metódou je použitie Welchovho vzorca, výpočtovo ťažkopádneho vzorca zahŕňajúceho veľkosti vzoriek a štandardné odchýlky vzoriek. Iný prístup, označovaný ako konzervatívna aproximácia, sa môže použiť na rýchly odhad stupňov slobody. Toto je jednoducho menšie z týchto dvoch čísel n1 - 1 a n2 - 1.

Chi-Square za nezávislosť

Jedno použitie chí-kvadrát test je zistiť, či dve kategorické premenné, každá s niekoľkými úrovňami, vykazujú nezávislosť. Informácie o týchto premenných sú zaznamenané v a obojsmerný stôl s r riadky a C stĺpy. Počet stupňov voľnosti je produkt (r - 1)(C - 1).

Chi-Square Goodness of Fit

Chi-square dobrota fit začína jednou kategorickou premennou s celkovým počtom n úrovniach. Testujeme hypotézu, že táto premenná sa zhoduje s vopred určeným modelom. Počet stupňov voľnosti je o jeden nižší ako počet stupňov. Inými slovami, existujú n - 1 stupeň voľnosti.

Jeden faktor ANOVA

Jeden faktor analýza rozptylu (ANOVA) umožňuje porovnávanie medzi niekoľkými skupinami, čo vylučuje potrebu testov s niekoľkými pármi hypotéz. Pretože test vyžaduje, aby sme zmerali tak variáciu medzi niekoľkými skupinami, ako aj variáciu v každej skupine, skončili sme s dvoma stupňami voľnosti. F-štatistika, ktorý sa používa pre jeden faktor ANOVA, je zlomok. Čitateľ a menovateľ majú každý stupeň voľnosti. nechať C - počet skupín a - n je celkový počet hodnôt údajov. Počet stupňov voľnosti čitateľa je o jeden menší ako počet skupín alebo C - 1. Počet stupňov voľnosti pre menovateľa je celkový počet hodnôt údajov mínus počet skupín alebo n - C.

Je zrejmé, že musíme byť veľmi opatrní, aby sme vedeli, s ktorým inferenčným postupom pracujeme. Tieto znalosti nás informujú o správnom počte stupňov slobody používania.