Hlavné komponenty a analýza faktorov

Analýza hlavných komponentov (PCA) a faktorová analýza (FA) sú štatistické techniky používané na redukciu údajov alebo detekciu štruktúry. Tieto dve metódy sa použijú na jeden súbor premenných, ak sa o to výskumný pracovník zaujíma zistenie, ktoré premenné v sade tvoria koherentné podmnožiny, ktoré sú relatívne nezávislé od jednej ďalší. Premenné, ktoré spolu korelujú, ale sú do veľkej miery nezávislé od iných súborov premenných, sa kombinujú do faktorov. Tieto faktory vám umožňujú skondenzovať počet premenných vo vašej analýze kombináciou viacerých premenných do jedného faktora.

Konkrétnymi cieľmi PCA alebo FA je zhrnúť vzorce korelácia medzi pozorovanými premennými redukovať veľký počet pozorovaných premenných na menší počet faktorov, a regresná rovnica pre podkladový proces pomocou pozorovaných premenných alebo na testovanie teórie o povahe základných procesov.

príklad

Povedzme napríklad, že výskumný pracovník má záujem študovať charakteristiky postgraduálnych študentov. Výskumník zisťuje veľkú vzorku postgraduálnych študentov o osobnostných charakteristikách, ako sú napr motivácia, intelektuálne schopnosti, vedecká história, rodinná história, zdravie, fyzické vlastnosti, atď. Každá z týchto oblastí sa meria pomocou niekoľkých premenných. Premenné sa potom vkladajú do analýzy jednotlivo a študujú sa korelácie medzi nimi. Analýza odhaľuje vzorce korelácie medzi premennými, o ktorých sa predpokladá, že odrážajú základné procesy ovplyvňujúce správanie absolventov vysokých škôl. Napríklad niekoľko premenných z meraní intelektuálnych schopností sa kombinuje s niektorými premennými z meraní vedeckej histórie, aby sa vytvorila inteligencia merania faktorov. Podobne sa premenné z osobnostných opatrení môžu kombinovať s niektorými premennými z motivácie a akademiky história meria faktor, ktorý meria mieru, do akej študent preferuje samostatnú prácu - nezávislosť faktorom.

instagram viewer

Kroky analýzy hlavných komponentov a analýza faktorov

Kroky v analýze hlavných komponentov a analýze faktorov zahŕňajú:

  • Vyberte a zmerajte množinu premenných.
  • Pripravte korelačnú maticu na vykonanie buď PCA alebo FA.
  • Extrahujte skupinu faktorov z korelačnej matice.
  • Určte počet faktorov.
  • Ak je to potrebné, otočte faktory, aby sa zvýšila interpretovateľnosť.
  • Interpretujte výsledky.
  • Overte štruktúru faktorov stanovením konštrukčnej platnosti faktorov.

Rozdiel medzi analýzou hlavných komponentov a analýzou faktorov

Analýza hlavných komponentov a analýza faktorov sú podobné, pretože obidva postupy sa používajú na zjednodušenie štruktúry súboru premenných. Analýzy sa však líšia niekoľkými dôležitými spôsobmi:

  • V PCA sa zložky počítajú ako lineárne kombinácie pôvodných premenných. Vo FA sú pôvodné premenné definované ako lineárne kombinácie faktorov.
  • V prípade PCA je cieľom zodpovedať za toľko z celkovej sumy odchýlka v premenných, ako je to možné. Cieľom FA je vysvetliť kovariancie alebo korelácie medzi premennými.
  • PCA sa používa na redukciu údajov na menší počet komponentov. FA sa používa na pochopenie toho, čo je základom údajov.

Problémy s analýzou hlavných komponentov a analýzou faktorov

Jedným z problémov s PCA a FA je to, že neexistuje žiadne kritérium, podľa ktorého by bolo možné testovať riešenie. V iných štatistických technikách, ako je napríklad analýza diskriminačných funkcií, logistická regresia, analýza profilu a multivariačné analýza rozptylu, riešenie sa posudzuje podľa toho, ako dobre predpovedá členstvo v skupine. V PCA a FA neexistuje žiadne externé kritérium, napríklad členstvo v skupine, voči ktorému sa má testovať riešenie.

Druhým problémom PCA a FA je to, že po extrakcii je k dispozícii nekonečný počet rotácií, všetky vykazujú rovnaké množstvo rozptylu v pôvodných údajoch, ale s faktorom definovaným mierne odlišné. Konečný výber je na výskumnom pracovníkovi na základe posúdenia jeho interpretovateľnosti a vedeckej užitočnosti. Vedci sa často líšia názorom, ktorý výber je najlepší.

Tretím problémom je, že FA sa často používa na „záchranu“ zle koncipovaného výskumu. Ak nie je vhodný alebo použiteľný žiadny iný štatistický postup, údaje možno analyzovať aspoň faktorom. Mnohí tak nechávajú presvedčenie, že rôzne formy FA sú spojené s nedbalým výskumom.