Mnohokrát v štúdiu štatistika je dôležité prepojiť rôzne témy. Uvidíme príklad tohto, v ktorom sklon regresnej priamky priamo súvisí s korelačný koeficient. Keďže tieto pojmy zahŕňajú priamku, je prirodzené položiť si otázku: "Ako je korelačný koeficient a najmenšia štvorcová čiara príbuzní? "
Najprv sa pozrieme na niektoré súvislosti týkajúce sa oboch týchto tém.
Podrobnosti týkajúce sa korelácie
Je dôležité pamätať na podrobnosti týkajúce sa korelačného koeficientu, ktorý označuje r. Táto štatistika sa používa, keď sme spárovali kvantitatívne údaje. Z rozptylu spárované dáta, môžeme hľadať trendy v celkovej distribúcii údajov. Niektoré spárované údaje vykazujú lineárny alebo priamy obrazec. V praxi však údaje nikdy nespadajú presne po priamke.
Niekoľko ľudí sa pozerá na to isté bodový diagram párových údajov by nesúhlasilo s tým, nakoľko bolo blízko k celkovému lineárnemu trendu. Nakoniec, naše kritériá môžu byť trochu subjektívne. Rozsah, ktorý používame, by mohol ovplyvniť aj naše vnímanie údajov. Z týchto dôvodov a viac potrebujeme nejaké objektívne opatrenie, aby sme zistili, ako blízko sú naše spárované údaje lineárne. Korelačný koeficient to dosahuje za nás.
Niekoľko základných faktov o r zahŕňajú:
- Hodnota r sa pohybuje medzi akýmkoľvek skutočným číslom od -1 do 1.
- Hodnoty r blízko 0 znamená, že medzi údajmi existuje len malý alebo žiadny lineárny vzťah.
- Hodnoty r blízko 1 znamená, že medzi údajmi existuje pozitívny lineárny vzťah. To znamená, že ako X to zvyšuje y tiež sa zvyšuje.
- Hodnoty r blízko -1 znamená, že medzi údajmi existuje negatívny lineárny vzťah. To znamená, že ako X to zvyšuje y klesá.
Sklon línie najmenších štvorcov
Posledné dve položky z vyššie uvedeného zoznamu nás nasmerujú na svah s najmenšími štvorcami, ktoré sa najlepšie hodia. Pripomeňme, že sklon priamky je meranie toho, koľko jednotiek ide nahor alebo nadol pre každú jednotku, ktorú posunieme doprava. Niekedy sa to uvádza ako vzostup línie delený behom alebo zmena v y hodnoty vydelené zmenou v X hodnôt.
Rovné priamky majú spravidla svahy, ktoré sú kladné, záporné alebo nulové. Keby sme mali preskúmať naše regresné priamky s najmenším štvorcom a porovnať príslušné hodnoty r, všimli by sme si, že zakaždým, keď naše údaje majú záporný korelačný koeficient, sklon regresnej priamky je negatívny. Podobne, vždy, keď máme kladný korelačný koeficient, je sklon regresnej priamky kladný.
Z tohto pozorovania by malo byť zrejmé, že určite existuje súvislosť medzi znamienkom korelačného koeficientu a sklonom čiary najmenších štvorcov. Zostáva vysvetliť, prečo je to pravda.
Vzorec pre svah
Dôvod spojenia medzi hodnotou r a sklon čiary najmenších štvorcov súvisí so vzorcom, ktorý nám dáva sklon tejto čiary. Pre párové údaje (x, y) označujeme smerodajná odchýlka z X údaje od sX a smerodajná odchýlka y údaje od sy.
Vzorec pre svah regresnej priamky je:
- a = r (sy/ sX)
Výpočet smerodajnej odchýlky zahŕňa odčítanie kladnej odmocniny nezáporného čísla. Výsledkom je, že obe štandardné odchýlky vo vzorci pre svah musia byť nezáporné. Ak predpokladáme, že v našich údajoch existujú určité odchýlky, nebudeme môcť ignorovať možnosť, že niektorá z týchto štandardných odchýlok je nula. Znamienko korelačného koeficientu bude preto rovnaké ako znamienko sklonu regresnej priamky.