Analýza odchýlok alebo ANOVA Stručne povedané, je štatistický test, ktorý hľadá významné rozdiely medzi nimi prostriedky o konkrétnom opatrení. Povedzme napríklad, že máte záujem o štúdium úrovne vzdelania športovcov v komunite, aby ste prieskumovali ľudí v rôznych tímoch. Začnete sa však pýtať, či je úroveň vzdelania medzi jednotlivými tímami iná. Pomocou ANOVA by ste mohli určiť, či je priemerná úroveň vzdelania medzi softvérovým tímom odlišným v porovnaní s tímom ragby a tímom Ultimate Frisbee.
Kľúčové cesty: Analýza variácie (ANOVA)
- Výskumníci vykonávajú ANOVA, ak majú záujem určiť, či sa dve skupiny v konkrétnom opatrení alebo teste významne líšia.
- Existujú štyri základné typy modelov ANOVA: jednosmerná medzi skupinami, jednosmerná opakovaná miera, dvojsmerná medzi skupinami a dvojsmerná opakovaná miera.
- Štatistické programy možno použiť na uľahčenie a zefektívnenie vykonávania ANOVA.
Modely ANOVA
Existujú štyri typy základných modelov ANOVA (hoci je možné vykonať aj komplexnejšie testy ANOVA). Nasledujú opisy a príklady každého z nich.
Jednosmerná medzi skupinami ANOVA
Jediný spôsob medzi skupinami ANOVA sa používa, keď chcete otestovať rozdiel medzi dvoma alebo viacerými skupinami. Príklad vyššie, úrovne vzdelania medzi rôznymi športovými tímami, by bol príkladom tohto typu modelu. Nazýva sa jednosmerná ANOVA, pretože existuje iba jedna premenná (druh športu, ktorá sa hrá), ktorá sa používa na rozdelenie účastníkov do rôznych skupín.
Jednosmerné opakované opatrenia ANOVA
Ak máte záujem o posúdenie jednej skupiny vo viac ako jednom časovom bode, mali by ste použiť jednosmerné opakované opatrenia ANOVA. Napríklad, ak ste chceli otestovať porozumenie predmetu študentom, mohli by ste ten istý test vykonať na začiatku kurzu, v jeho priebehu a na konci kurzu. Uskutočnenie jednosmerných opakovaných opatrení ANOVA vám umožní zistiť, či sa výsledky testov študentov významne zmenili od začiatku do konca kurzu.
Obojsmerný medzi skupinami ANOVA
Predstavte si teraz, že máte dva rôzne spôsoby, ako chcete zoskupiť svojich účastníkov (alebo, zo štatistického hľadiska, máte dva rôzne spôsoby nezávislé premenné). Predstavte si napríklad, že vás zaujíma testovanie toho, či sa skóre testu líšilo medzi študentskými atlétmi a nešportovníkmi, ako aj pre začiatočníkov verzus seniorov. V takom prípade by ste medzi skupinami ANOVA viedli obojsmerne. Z tejto ANOVA by ste mali tri účinky - dva hlavné a interakčný efekt. Hlavnými účinkami sú účinky športovania a účinok ročníka. Interakčný efekt sa zameriava na vplyv toho, ako sú športovci a ročník triedy. Každý z hlavných účinkov je jednosmerný test. Interakčný efekt sa jednoducho pýta, či sa dva hlavné účinky navzájom ovplyvňujú: napríklad, ak majú športovci študentov rozdielne skóre ako tomu bolo v prípade iných športovcov, ale to bolo iba v prípade, keď študujete prvákov, medzi triednym rokom a tým, že športovec.
Obojstranné opakované merania ANOVA
Ak sa chcete pozrieť, ako sa rôzne skupiny menia v priebehu času, môžete použiť dvojité opakované merania ANOVA. Predstavte si, že vás zaujíma, ako sa skóre testu mení v priebehu času (ako v príklade vyššie pre jednosmerné opakované merania ANOVA). Tentoraz sa však zaujímate aj o hodnotenie pohlavia. Napríklad zlepšujú muži a ženy svoje skóre v testoch rovnakou mierou alebo existujú rozdiely v pohlaví? Na odpovede na tieto typy otázok možno použiť dvojité opakované opatrenia ANOVA.
Predpoklady ANOVA
Pri analýze rozptylu existujú tieto predpoklady:
- očakávané hodnoty chýb je nula.
- Rozptyly všetkých chýb sú rovnaké.
- Chyby sú na sebe nezávislé.
- Chyby sú bežne distribuované.
Ako je ANOVA hotová
- Priemer sa vypočíta pre každú z vašich skupín. Na základe príkladu vzdelávacích a športových tímov od úvodu v prvom odseku vyššie sa priemerná úroveň vzdelania vypočíta pre každý športový tím.
- Celkový priemer sa potom vypočíta pre všetky skupiny dohromady.
- V rámci každej skupiny sa vypočíta celková odchýlka skóre jednotlivca od priemeru skupiny. Toto nám hovorí, či jednotlivci v skupine majú tendenciu mať podobné skóre alebo či existuje veľká variabilita medzi rôznymi ľuďmi v tej istej skupine. Štatistici to nazývajú v rámci skupinovej variácie.
- Ďalej sa vypočíta, koľko priemerná hodnota pre každú skupinu sa líši od celkového priemeru. Toto sa volá medzi skupinovými variáciami.
- Nakoniec sa vypočíta štatistika F, čo je pomer medzi skupinovými variáciami do v rámci skupinovej variácie.
Ak je podstatne vyššia medzi skupinovými variáciami než v rámci skupinovej variácie (inými slovami, keď je štatistika F väčšia), je pravdepodobné, že rozdiel medzi skupinami je štatisticky významný. Štatistický softvér sa môže použiť na výpočet štatistiky F a na určenie, či je alebo nie je významná.
Všetky typy ANOVA sa riadia základnými princípmi uvedenými vyššie. Avšak s rastúcim počtom skupín a interakčných efektov sa zdroje variácie stanú komplexnejšími.
Vykonávanie ANOVA
Pretože vykonávanie ANOVA ručne je časovo náročný proces, väčšina výskumníkov používa štatistické softvérové programy, keď majú záujem o vykonanie ANOVA. SPSS môžu byť použité na vykonávanie ANOVA, ako je to možné R, bezplatný softvérový program. V Exceli môžete urobiť ANOVA pomocou doplnku analýzy údajov. SAS, STATA, Minitab a ďalšie štatistické softvérové programy ktoré sú vybavené na spracovanie väčších a komplexnejších súborov údajov, sa môžu použiť aj na vykonanie ANOVA.
Referencie
Univerzita Monash. Analýza odchýlky (ANOVA). http://www.csse.monash.edu.au/~smarkham/resources/anova.htm