Príklad testu dvoch vzoriek T a intervalu spoľahlivosti

V štatistikách je niekedy užitočné vypracovať príklady problémov. Tieto príklady nám môžu pomôcť pri hľadaní podobných problémov. V tomto článku prejdeme proces vykonávania inferenčných štatistík pre výsledok týkajúci sa dvoch populačných prostriedkov. Uvidíme nielen, ako vykonať a test hypotéz o rozdiele dvoch populačných prostriedkov tiež skonštruujeme a interval spoľahlivosti za tento rozdiel. Metódy, ktoré používame, sa niekedy nazývajú test dvoch vzoriek t a interval spoľahlivosti dvoch vzoriek.

Vyhlásenie problému

Predpokladajme, že si želáme otestovať matematickú spôsobilosť žiakov základných škôl. Jedna otázka, ktorú môžeme mať, je, či vyššie stupne majú vyššie priemerné skóre.

Jednoduchá náhodná vzorka 27 zrovnávačov sa podrobí matematickému testu, ich odpovede sa hodnotia a výsledky majú priemerné skóre 75 bodov a vzorka smerodajná odchýlka 3 body.

Jednoduchá náhodná vzorka z 20 piatok zrovnávačov sa podrobí rovnakému matematickému testu a ich odpovede sa ohodnotia. Priemerné skóre pre piate zrovnávače je 84 bodov so štandardnou odchýlkou ​​vzorky 5 bodov.

instagram viewer

Vzhľadom na tento scenár kladieme nasledujúce otázky:

  • Poskytujú údaje zo vzorky dôkaz, že priemerné testovacie skóre populácie všetkých piatej porovnávačky prekračuje priemerné testovacie skóre populácie všetkých tretích grejdrov?
  • Aký je 95% interval spoľahlivosti pre rozdiel v priemernom skóre testu medzi populáciami tretích porovnávačov a piatymi porovnávačmi?

Podmienky a postup

Musíme zvoliť, ktorý postup sa má použiť. Pritom sa musíme ubezpečiť a skontrolovať, či sú splnené podmienky tohto postupu. Žiadame porovnanie dvoch populačných prostriedkov. Jeden súbor metód, ktoré je možné na tento účel použiť, sú metódy pre dvojvzorkové t-postupy.

Aby sme mohli použiť tieto postupy t pre dve vzorky, musíme sa ubezpečiť, že sú splnené tieto podmienky:

  • Máme dve jednoduché náhodné vzorky z dvoch záujmových skupín.
  • Naše jednoduché náhodné vzorky netvoria viac ako 5% populácie.
  • Tieto dve vzorky sú na sebe nezávislé a medzi subjektmi neexistuje žiadna zhoda.
  • Premenná sa bežne distribuuje.
  • Priemerná aj štandardná odchýlka populácie nie sú pre obe populácie známe.

Vidíme, že väčšina z týchto podmienok je splnená. Bolo nám povedané, že máme jednoduché náhodné vzorky. Populácie, ktoré študujeme, sú veľké, pretože v týchto stupňoch sú milióny študentov.

Podmienkou, ktorú nedokážeme automaticky predpokladať, je, že výsledky testov sú zvyčajne rozdelené. Pretože máme dostatočne veľkú veľkosť vzorky, kvôli robustnosti našich t-postupov nemusíme nevyhnutne potrebovať, aby bola premenná normálne distribuovaná.

Keďže sú podmienky splnené, vykonávame niekoľko predbežných výpočtov.

Štandardná chyba

Štandardná chyba je odhad štandardnej odchýlky. Pre túto štatistiku pridáme rozptyl vzoriek a potom odoberieme druhú odmocninu. Takto sa získa vzorec:

(s1 2 / n1 + s22 / n2)1/2

Použitím vyššie uvedených hodnôt vidíme, že hodnota štandardnej chyby je

(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583

Stupne slobody

Môžeme použiť konzervatívnu aproximáciu stupne slobody. To môže podceňovať počet stupňov voľnosti, ale je oveľa ľahšie vypočítať ako použiť Welchov vzorec. Použijeme menšie z týchto dvoch veľkostí vzoriek a potom od nich odčítame jednu.

V našom príklade je menšia z týchto dvoch vzoriek 20. To znamená, že počet stupňov voľnosti je 20 - 1 = 19.

Test hypotéz

Prajeme si otestovať hypotézu, že študenti piatej triedy majú priemerné skóre testu, ktoré je vyššie ako priemerné skóre študentov tretieho stupňa. Nech μ1 je priemerné skóre populácie všetkých piatych porovnávačov. Podobne necháme μ2 je priemerné skóre populácie všetkých tretích porovnávačov.

Hypotézy sú nasledujúce:

  • H0: μ1 - μ2 = 0
  • H: μ1 - μ2 > 0

Štatistika testu je rozdiel medzi prostriedkami vzorky, ktorý sa potom vydelí štandardnou chybou. Pretože na odhad štandardnej odchýlky populácie používame štandardné odchýlky vzoriek, štatistika testu z distribúcie t.

Hodnota štatistickej skúšky je (84 - 75) / 1,2583. To je približne 7,15.

Teraz určíme, čo je p-hodnota pre tento test hypotéz. Pozrime sa na hodnotu štatistických údajov z testov a tam, kde je umiestnená na t-distribúcii s 19 stupňami voľnosti. Pre toto rozdelenie máme 4,2 x 10-7 ako naša p-hodnota. (Jeden spôsob, ako to zistiť, je použitie funkcie T.DIST.RT v Exceli.)

Pretože máme takú malú p-hodnotu, odmietame nulovú hypotézu. Záver je taký, že priemerné skóre testu pre piatej porovnávače je vyššie ako priemerné skóre testu pre tretie porovnávače.

Interval spoľahlivosti

Pretože sme zistili, že existuje rozdiel medzi priemerným skóre, určujeme interval spoľahlivosti pre rozdiel medzi týmito dvoma prostriedkami. Už máme veľa toho, čo potrebujeme. Interval spoľahlivosti rozdielu musí mať odhad aj mieru chyby.

Odhad rozdielu dvoch prostriedkov sa dá jednoducho vypočítať. Jednoducho nájdeme rozdiel prostriedkov vzorky. Tento rozdiel vo vzorke znamená odhad rozdielu v populácii.

Podľa našich údajov je rozdiel vo vzorke 84 - 75 = 9.

Počítanie chýb je trochu zložitejšie. Preto potrebujeme vynásobiť príslušnú štatistiku štandardnou chybou. Štatistiku, ktorú potrebujeme, nájdete pomocou tabuľky alebo štatistického softvéru.

Opäť s použitím konzervatívnej aproximácie máme 19 stupňov slobody. Pre 95% interval spoľahlivosti vidíme, že t* = 2.09. Mohli by sme použiť Funkcia T.INV v Excel vypočítať túto hodnotu.

Teraz sme všetko dali dokopy a zistili sme, že miera chybovosti je 2,09 x 1,2583, čo je približne 2,63. Interval spoľahlivosti je 9 ± 2,63. Interval je 6,37 až 11,63 bodov pri skúške, ktorú si vybral piaty a tretí zrovnávač.