Program Microsoft Excel je užitočný pri vykonávaní základných výpočtov v štatistikách. Niekedy je užitočné poznať všetky funkcie, ktoré sú k dispozícii na prácu s konkrétnou témou. Tu zvážime funkcie v Exceli, ktoré súvisia s t-distribúciou študenta. Okrem priameho výpočtu pomocou t-distribúcie môže Excel tiež počítať intervaly spoľahlivosti a hrať testy hypotéz.
Funkcie týkajúce sa distribúcie T
V Exceli existuje niekoľko funkcií, ktoré pracujú priamo s distribúciou t. Pri hodnote pozdĺž t-distribúcie všetky nasledujúce funkcie vracajú časť distribúcie, ktorá je v špecifikovanom konci.
Časť v chvoste sa dá tiež interpretovať ako pravdepodobnosť. Tieto pravdepodobnosti chvosta sa môžu použiť pri p-hodnotách v testoch hypotéz.
- Funkcia T.DIST vracia ľavý koniec Studentovej t-distribúcie. Túto funkciu možno použiť aj na získanie y- hodnota pre každý bod pozdĺž krivky hustoty.
- Funkcia T.DIST.RT vracia pravý koniec Studentovej t-distribúcie.
- Funkcia T.DIST.2T vracia obidva konce Studentovej t-distribúcie.
Všetky tieto funkcie majú podobné argumenty. Tieto argumenty sú v tomto poradí:
- Hodnota X, ktorá označuje, kde pozdĺž X os sme pozdĺž rozloženia
- Počet stupne slobody.
- Funkcia T.DIST má tretí argument, ktorý nám umožňuje zvoliť si medzi kumulatívnym rozdelením (zadaním 1) alebo nie (zadaním 0). Ak zadáme 1, táto funkcia vráti p-hodnotu. Ak zadáme 0, táto funkcia vráti y- hodnota krivky hustoty pre daný X.
Inverzné funkcie
Všetky funkcie T.DIST, T.DIST.RT a T.DIST.2T zdieľajú spoločnú vlastnosť. Vidíme, ako všetky tieto funkcie začínajú hodnotou pozdĺž t-distribúcie a potom vrátime časť. Niekedy by sme chceli tento proces zvrátiť. Začneme pomerom a chceme vedieť hodnotu t, ktorá zodpovedá tomuto podielu. V tomto prípade použijeme vhodnú inverznú funkciu v vynikať.
- Funkcia T.INV vracia ľavý chvost inverzie Studentovej T-distribúcie.
- Funkcia T.INV.2T vracia dvojitý sled inverzie T-distribúcie študenta.
Pre každú z týchto funkcií existujú dva argumenty. Prvým je pravdepodobnosť alebo časť distribúcie. Druhým je počet stupňov voľnosti pre konkrétne rozdelenie, ktoré nás zaujíma.
Príklad T.INV
Uvidíme príklad funkcií T.INV a T.INV.2T. Predpokladajme, že pracujeme s distribúciou t s 12 stupňami voľnosti. Ak chceme poznať bod pozdĺž distribúcie, ktorý predstavuje 10% plochy pod krivkou naľavo od tohto bodu, zadáme = T.INV (0,1,12) do prázdnej bunky. Excel vráti hodnotu -1 356.
Ak namiesto toho použijeme funkciu T.INV.2T, zistíme, že zadaním = T.INV.2T (0,1,12) sa vráti hodnota 1,782. To znamená, že 10% plochy pod grafom distribučnej funkcie je naľavo od -1,782 a napravo od 1,782.
Vo všeobecnosti symetriou t-distribúcie pravdepodobnosť P a stupne voľnosti d máme T.INV.2T (P, d) = ABS (T.INV (P/2,d), kde ABS je absolútna hodnota funkcie v Exceli.
Intervaly spoľahlivosti
Jednou z tém inferenčnej štatistiky je odhad parametra populácie. Tento odhad má formu intervalu spoľahlivosti. Napríklad odhad priemeru populácie je priemer vzorky. Odhad má tiež rezervu chyby, ktorú Excel vypočíta. Pre túto mieru chyby musíme použiť funkciu CONFIDENCE.T.
V dokumentácii programu Excel sa uvádza, že funkcia CONFIDENCE.T vraj vracia interval spoľahlivosti pomocou Studentovej t-distribúcie. Táto funkcia vracia hranicu chyby. Argumenty pre túto funkciu sú v poradí, v akom sa musia zadať:
- Alpha - toto je úroveň významnosti. Alfa je tiež 1 - C, kde C označuje úroveň spoľahlivosti. Napríklad, ak chceme 95% istotu, potom musíme pre alfa zadať 0,05.
- Štandardná odchýlka - toto je vzorka smerodajná odchýlka z nášho súboru údajov.
- Veľkosť vzorky.
Vzorec, ktorý program Excel používa na tento výpočet, je:
M = t*s/ √n
M je tu pre okraj, T* je kritická hodnota, ktorá zodpovedá úrovni dôvery, s je smerodajná odchýlka vzorky a n je veľkosť vzorky.
Príklad intervalu spoľahlivosti
Predpokladajme, že máme jednoduchú náhodnú vzorku 16 súborov cookie a vážime ich. Zistili sme, že ich priemerná hmotnosť je 3 gramy so štandardnou odchýlkou 0,25 gramu. Aký je 90% interval spoľahlivosti pre priemernú hmotnosť všetkých súborov cookie tejto značky?
Tu jednoducho napíšeme do prázdnej bunky:
= CONFIDENCE.T (0.1,0.25,16)
Excel vráti 0,109565647. Toto je miera chyby. Odpočítame ho a tiež ho pridáme k nášmu priemeru vzorky, takže náš interval spoľahlivosti je 2,89 gramov až 3,11 gramov.
Testy významnosti
Excel tiež vykoná testy hypotéz, ktoré súvisia s t-distribúciou. Funkcia T.TEST vráti p-hodnota na niekoľko rôznych testov významnosti. Argumenty pre funkciu T.TEST sú:
- Pole 1, ktoré udáva prvý súbor údajov zo vzorky.
- Pole 2, ktoré udáva druhú skupinu vzoriek
- Chvosty, do ktorých môžeme zadať buď 1 alebo 2.
- Typ - 1 označuje párový t-test, 2 dvojtestový test s rovnakou populačnou odchýlkou a 3 dvojvýberový test s rôznymi populačnými odchýlkami.