Čo je štatistika Skewness?

Niektoré distribúcie údajov, napr zvonová krivka alebo normálne rozdelenie, sú symetrické. To znamená, že pravá a ľavá časť distribúcie sú dokonalými zrkadlovými obrazmi jeden druhého. Nie každá distribúcia údajov je symetrická. Množiny údajov, ktoré nie sú symetrické, sa považujú za asymetrické. Miera toho, ako môže byť asymetrické rozdelenie, sa nazýva šikmosť.

Priemer, medián a režim sú všetky opatrenia centra súboru údajov. Správnosť údajov sa dá určiť podľa toho, ako tieto množstvá spolu súvisia.

Sklonil sa doprava

Údaje, ktoré sú zošikmené doprava, majú dlhý chvost, ktorý siaha doprava. Alternatívnym spôsobom rozprávania o súbore údajov, ktorý je zošikmený doprava, je povedať, že je pozitívne sklonený. V tejto situácii priemer a medián sú väčšie ako režim. Spravidla bude väčšina času pre údaje zošikmené doprava, priemer bude väčší ako medián. V súhrne pre množinu údajov zošikmenú doprava:

  • Vždy: znamená viac ako režim
  • Vždy: medián väčší ako režim
  • Väčšinu času znamenajú väčšie ako stredné hodnoty
instagram viewer

Sklonil sa doľava

Situácia sa obráti, keď sa zaoberáme údajmi zošikmenými doľava. Dáta, ktoré sú zošikmené vľavo, majú dlhý chvost, ktorý siaha doľava. Alternatívnym spôsobom rozprávania o súbore údajov, ktorý je zošikmený vľavo, je povedať, že je negatívne sklonený. V tejto situácii sú priemer aj medián nižšie ako režim. Spravidla bude väčšina času pre údaje zošikmené doľava, stredná hodnota bude menšia ako stredná hodnota. V súhrne pre množinu údajov zošikmenú doľava:

  • Vždy: znamená menej ako režim
  • Vždy: stredný menej ako režim
  • Väčšinu času znamenajú menej ako medián

Opatrenia bezškrabania

Jedna vec je pozrieť sa na dve sady údajov a určiť, že jedna je symetrická, zatiaľ čo druhá je asymetrická. Je to ďalší pohľad na dve sady asymetrických údajov a tvrdenie, že jeden je skreslenejší ako druhý. Môže byť veľmi subjektívne určiť, ktorá je skreslená jednoduchým pri pohľade na graf distribúcie. To je dôvod, prečo existujú spôsoby, ako numericky vypočítať mieru šikmosti.

Jedným z meraní skewness, ktorý sa nazýva Pearsonov prvý koeficient skewn, je odpočítať priemer od módu a potom tento rozdiel vydeliť smerodajná odchýlka údajov. Dôvod na rozdelenie rozdielu je taký, že máme bezrozmerné množstvo. Toto vysvetľuje, prečo údaje zošikmené doprava majú pozitívnu šikmosť. Ak je množina údajov zošikmená doprava, priemer je väčší ako režim a odčítaním režimu od priemeru sa získa kladné číslo. Podobný argument vysvetľuje, prečo údaje zošikmené doľava majú negatívnu šikmosť.

Pearsonov druhý koeficient skewness sa používa aj na meranie asymetrie súboru údajov. Pre toto množstvo odpočítame režim od mediánu, toto číslo vynásobíme tromi a potom vydelíme štandardnou odchýlkou.

Aplikácia skosených údajov

Šikmé údaje vznikajú celkom prirodzene v rôznych situáciách. Príjmy sú zošikmené doprava, pretože aj len niekoľko jednotlivcov, ktorí zarábajú milióny dolárov, môže značne ovplyvniť priemer a neexistujú žiadne negatívne príjmy. Podobne sú údaje týkajúce sa životnosti produktu, napríklad značky žiarovky, zošikmené doprava. Tu je najmenšia životnosť nulová a žiarovky s dlhotrvajúcou životnosťou dodávajú údajom pozitívny skewn.