ANOVA (Analýza variácie)

Keď študujeme skupinu, mnohokrát skutočne porovnávame dve populácie. V závislosti na parameter z tejto skupiny nás zaujíma a za akých podmienok sa zaoberáme, existuje niekoľko techník. štatistický záver postupy, ktoré sa týkajú porovnania dvoch populácií, sa zvyčajne nemôžu uplatniť na tri alebo viac populácií. Na štúdium viac ako dvoch populácií naraz potrebujeme rôzne typy štatistických nástrojov. Analýza rozptylualebo ANOVA je technika zo štatistického zasahovania, ktorá nám umožňuje zaoberať sa niekoľkými populáciami.

Porovnanie prostriedkov

Aby sme videli, aké problémy vznikajú a prečo potrebujeme ANOVA, zvážime príklad. Predpokladajme, že sa snažíme zistiť, či Priemerný Hmotnosti zelených, červených, modrých a oranžových cukroviniek M&M sa navzájom líšia. Uvádzame priemerné hmotnosti pre každú z týchto populácií, μ1, μ2, μ3 μ4 a respektíve. Môžeme použiť vhodné test hypotéz niekoľkokrát a test C (4,2) alebo šesť rôznych nulové hypotézy:

  • H0: μ1 = μ2 skontrolovať, či sa priemerná hmotnosť populácie červených cukroviniek líši od priemernej hmotnosti populácie modrých cukroviniek.
  • instagram viewer
  • H0: μ2 = μ3 skontrolovať, či sa priemerná hmotnosť populácie modrých cukroviniek líši od priemernej hmotnosti populácie zelených cukroviniek.
  • H0: μ3 = μ4 skontrolovať, či sa priemerná hmotnosť populácie zelených cukroviniek líši od priemernej hmotnosti populácie oranžových cukroviniek.
  • H0: μ4 = μ1 skontrolovať, či sa priemerná hmotnosť populácie oranžových cukroviniek líši od priemernej hmotnosti populácie červených cukroviniek.
  • H0: μ1 = μ3 skontrolovať, či sa priemerná hmotnosť populácie červených cukroviniek líši od priemernej hmotnosti populácie zelených cukroviniek.
  • H0: μ2 = μ4 skontrolovať, či sa priemerná hmotnosť populácie modrých cukroviniek líši od priemernej hmotnosti populácie oranžových cukroviniek.

S týmto druhom analýzy existuje veľa problémov. Budeme mať šesť p-hodnoty. Aj keď môžeme každý testovať na 95% úroveň dôvery, naša dôvera v celkový proces je menšia ako táto, pretože vynásobenie pravdepodobností: 0,95 x 0,95 x 0,95 x 0,95 x 0,95 x 0,95 x je približne 0,74 alebo 74% úroveň spoľahlivosti. Tým sa zvýšila pravdepodobnosť chyby typu I.

Na zásadnejšej úrovni nemôžeme porovnávať tieto štyri parametre ako celok ich porovnaním po dvoch. Prostriedky červenej a modrej M & Ms môžu byť významné, pričom stredná hmotnosť červenej je relatívne väčšia ako stredná hmotnosť modrej. Ak však vezmeme do úvahy priemernú hmotnosť všetkých štyroch druhov cukroviniek, nemusí existovať významný rozdiel.

Analýza variantov

Na riešenie situácií, v ktorých je potrebné vykonať viacnásobné porovnania, používame ANOVA. Tento test nám umožňuje zvážiť parametre niekoľkých populácií naraz, bez toho, aby sme sa dostali k niektorým problémom, ktorým čelíme vykonávanie testov hypotéz na dvoch parametroch súčasne.

Na vykonanie ANOVA s vyššie uvedeným príkladom M&M by sme testovali nulovú hypotézu H01 = μ2 = μ3= μ4. Uvádza sa v ňom, že neexistuje žiadny rozdiel medzi strednou hmotnosťou červenej, modrej a zelenej M&S. Alternatívna hypotéza je, že existuje nejaký rozdiel medzi strednou hmotnosťou červenej, modrej, zelenej a oranžovej M & Ms. Táto hypotéza je skutočne kombináciou niekoľkých tvrdení H:

  • Priemerná hmotnosť populácie červených cukroviniek sa nerovná priemernej hmotnosti populácie modrých cukroviniek, ALEBO
  • Priemerná hmotnosť populácie modrých cukroviniek sa nerovná priemernej hmotnosti populácie zelených cukroviniek, ALEBO
  • Priemerná hmotnosť populácie zelených cukroviniek sa nerovná priemernej hmotnosti populácie oranžových cukroviniek, ALEBO
  • Priemerná hmotnosť populácie zelených cukroviniek sa nerovná priemernej hmotnosti populácie červených cukroviniek, ALEBO
  • Priemerná hmotnosť populácie modrých cukroviniek sa nerovná priemernej hmotnosti populácie oranžových cukroviniek, ALEBO
  • Priemerná hmotnosť populácie modrých cukroviniek sa nerovná priemernej hmotnosti populácie červených cukroviniek.

V tomto konkrétnom prípade by sme na získanie našej p-hodnoty použili a rozdelenia pravdepodobnosti známy ako F-distribúcie. Výpočty zahŕňajúce ANOVA F test sa môžu robiť ručne, ale zvyčajne sa počítajú pomocou štatistického softvéru.

Viacnásobné porovnania

ANOVA oddeľuje od ostatných štatistických techník tým, že sa používa na viacnásobné porovnania. Toto je bežné v celej štatistike, pretože mnohokrát chceme porovnávať viac ako iba dve skupiny. Celkový test zvyčajne naznačuje, že existuje určitý rozdiel medzi parametrami, ktoré študujeme. Potom nasledujeme tento test s nejakou inou analýzou, aby sme rozhodli, ktorý parameter sa líši.

instagram story viewer