Keď zmeráme variabilitu súboru údajov, s tým súvisia dve úzko súvisiace štatistiky: odchýlka a smerodajná odchýlka, ktoré naznačujú, ako sú rozložené hodnoty údajov, a zahŕňajú podobné kroky pri ich výpočte. Hlavným rozdielom medzi týmito dvoma štatistickými analýzami je však to, že štandardná odchýlka je druhou odmocninou rozptylu.
Aby sme pochopili rozdiely medzi týmito dvoma pozorovaniami štatistického šírenia, musíme najprv porozumieť tomu, čo každé predstavuje: Variancia predstavuje všetky údajové body v množine a vypočíta sa spriemerovaním druhej mocniny odchýlky každého priemeru, zatiaľ čo smerodajná odchýlka je mierou šírenia okolo priemeru, keď sa stredná tendencia vypočíta pomocou znamenať.
Výsledkom je, že rozptyl môže byť vyjadrený ako priemerná druhá odchýlka hodnôt od priemeru alebo [kvadrát odchýlka prostriedkov] vydelená počtom pozorovaní a smerodajná odchýlka sa môže vyjadriť ako druhá odmocnina variance.
Konštrukcia variancie
Aby sme úplne porozumeli rozdielu medzi týmito štatistikami, musíme pochopiť výpočet odchýlky. Kroky na výpočet rozptylu vzorky sú nasledujúce:
- Vypočítajte priemernú hodnotu údajov.
- Nájdite rozdiel medzi priemerom a každou z hodnôt údajov.
- Vyrovnajte tieto rozdiely.
- Sčítajte štvorcové rozdiely.
- Tento súčet vydelte menším ako celkový počet hodnôt údajov.
Dôvody každého z týchto krokov sú tieto:
- Priemer predstavuje stredný bod alebo priemerný údajov.
- Rozdiely od strednej hodnoty pomáhajú určiť odchýlky od tejto strednej hodnoty. Hodnoty údajov, ktoré sú ďaleko od priemeru, spôsobia väčšiu odchýlku ako hodnoty, ktoré sú blízko priemeru.
- Rozdiely sú na druhú mocninu, pretože ak sa rozdiely spočítajú bez toho, aby boli na druhú, bude táto suma nulová.
- sčítanie týchto štvorcových odchýlok poskytuje meranie celkovej odchýlky.
- Delenie o jednu menšiu ako je veľkosť vzorky poskytuje druh priemernej odchýlky. To neguje účinok, keď veľa dátových bodov prispieva k meraniu šírenia.
Ako je uvedené vyššie, štandardná odchýlka sa jednoducho vypočíta tak, že sa nájde druhá odmocnina tohto výsledku, ktorá poskytuje absolútnu štandardnú odchýlku bez ohľadu na celkový počet dátových hodnôt.
Odchýlka a smerodajná odchýlka
Keď vezmeme do úvahy tento rozptyl, uvedomíme si, že existuje jedna veľká nevýhoda jeho použitia. Keď postupujeme podľa krokov výpočtu rozptylu, ukazuje sa, že rozptyl sa meria v jednotkách štvorcových, pretože sme do výpočtu spočítali štvorcové rozdiely. Napríklad, ak sa naše vzorové údaje merajú v metroch, jednotky pre rozptyl by sa uvádzali v metroch štvorcových.
Aby sme štandardizovali mieru šírenia, musíme vziať druhú odmocninu rozptylu. Tým sa odstráni problém štvorcových jednotiek a poskytne sa nám miera šírenia, ktorá bude mať rovnaké jednotky ako naša pôvodná vzorka.
Existuje veľa vzorcov v matematickej štatistike, ktoré majú krajšie vyzerajúce formy, keď ich uvádzame z hľadiska rozptylu namiesto štandardnej odchýlky.