Testy hypotéz alebo testy významnosti zahŕňajú výpočet čísla známeho ako p-hodnota. Toto číslo je veľmi dôležité pre ukončenie našej skúšky. Hodnoty P súvisia so štatistikou testu a poskytujú nám meranie dôkazov proti nulovej hypotéze.
Nulové a alternatívne hypotézy
Všetky testy štatistického významu sa začínajú a nulová a alternatívna hypotéza. Nulová hypotéza je vyhlásenie o neúčinnosti alebo vyhlásenie o všeobecne akceptovanom stave. Alternatívna hypotéza je to, čo sa snažíme dokázať. Pracovným predpokladom v teste hypotéz je, že nulová hypotéza je pravdivá.
Štatistika testu
Budeme predpokladať, že podmienky pre konkrétny test, s ktorým pracujeme, sú splnené. jednoduchá náhodná vzorka poskytuje nám vzorové údaje. Z týchto údajov môžeme vypočítať štatistiku testu. Štatistika testov sa veľmi líši v závislosti od toho, aké parametre sa náš test hypotéz týka. Niektoré bežné štatistické testy zahŕňajú:
- z - štatistika pre testy hypotéz o priemernej populácii, keď poznáme štandardnú odchýlku populácie.
- T - štatistika pre testy hypotéz o priemernej populácii, keď nepoznáme štandardnú odchýlku populácie.
- T - štatistika pre testy hypotéz týkajúce sa rozdielu priemerov dvoch nezávislých obyvateľov, keď nevieme smerodajnú odchýlku jednej z týchto dvoch populácií.
- z - štatistika pre testy hypotéz týkajúce sa podielu obyvateľstva.
- Chi-square - štatistika pre testy hypotéz týkajúce sa rozdielu medzi očakávaným a skutočným počtom pre kategorické údaje.
Výpočet hodnôt P
Štatistiky testov sú užitočné, ale môže byť užitočnejšie priradiť k týmto štatistikám p-hodnotu. P-hodnota je pravdepodobnosť, že ak by bola neplatná hypotéza pravdivá, pozorovali by sme štatistiku aspoň tak extrémnu, ako je tá, ktorá sa pozorovala. Na výpočet p-hodnoty používame vhodný softvér alebo štatistickú tabuľku, ktorá zodpovedá našej štatistike testu.
Napríklad by sme použili a štandardné normálne rozdelenie pri výpočte a z štatistika testu. Hodnoty z s veľkými absolútnymi hodnotami (ako sú hodnoty nad 2,5) nie sú príliš časté a dávajú malú p-hodnotu. Hodnoty z ktoré sú bližšie k nule, sú bežnejšie a dávajú oveľa väčšie p-hodnoty.
Interpretácia hodnoty P
Ako sme už uviedli, hodnota p je pravdepodobnosť. To znamená, že ide o skutočné číslo od 0 do 1. Zatiaľ čo štatistika testu je jedným zo spôsobov na meranie extrémnosti štatistiky pre konkrétnu vzorku, p-hodnoty sú ďalším spôsobom merania.
Keď získame štatistickú danú vzorku, otázka, ktorú by sme mali vždy, je: „Je táto vzorka náhodná sám so skutočnou nulovou hypotézou, alebo je neplatná hypotéza nepravdivá? “ Ak je naša p-hodnota nízka, mohlo by to znamenať jednu z dvoch veci:
- Nulová hypotéza je pravdou, ale pri získavaní pozorovanej vzorky sme mali veľké šťastie.
- Naša vzorka je spôsobená tým, že nulová hypotéza je nepravdivá.
Všeobecne platí, že čím menšia je hodnota p, tým viac dôkazov máme proti našej nulovej hypotéze.
Ako malý je dosť?
Aké malé hodnoty p potrebujeme, aby sme to dosiahli odmietnuť nulovú hypotézu? Odpoveď na túto otázku je: „Závisí to.“ Bežným pravidlom je, že p-hodnota musí byť menšia alebo rovná 0,05, ale o tejto hodnote nie je nič univerzálne.
Pred vykonaním testu hypotéz si zvyčajne vyberieme prahovú hodnotu. Ak máme akúkoľvek p-hodnotu, ktorá je menšia alebo rovná tejto prahovej hodnote, odmietneme nulovú hypotézu. Inak nedokážeme odmietnuť nulovú hypotézu. Táto prahová hodnota sa nazýva úroveň významnosti nášho testu hypotéz a je označená gréckym písmenom alfa. Nie je hodnota alfa ktorý vždy definuje štatistickú významnosť.