Súčet skratiek súčtu štvorcov

Výpočet a vzorka rozptyl alebo smerodajná odchýlka sa zvyčajne uvádza ako zlomok. Čitateľ tejto frakcie predstavuje súčet druhých odchýlok od priemeru. V štatistike, vzorec pre túto celkovú sumu štvorcov je

Σ (xja - X)2

Symbol x̄ sa tu vzťahuje na priemernú hodnotu vzorky a symbol Σ nám hovorí, aby sme spočítali štvorcové rozdiely (xja - x̄) pre všetkých ja.

Aj keď tento vzorec funguje pre výpočty, existuje ekvivalentný, skratkový vzorec, ktorý nevyžaduje, aby sme najprv vypočítali priemer vzorky. Tento vzorec skratky pre súčet štvorcov je

Σ (xja2) - (Σ xja)2/n

Tu je premenná n sa vzťahuje na počet údajových bodov v našej vzorke.

Príklad štandardného vzorca

Aby sme videli, ako tento skratkový vzorec funguje, zvážime príklad, ktorý sa počíta pomocou oboch vzorcov. Predpokladajme, že naša vzorka je 2, 4, 6, 8. Priemer vzorky je (2 + 4 + 6 + 8) / 4 = 20/4 = 5. Teraz vypočítame rozdiel každého údajového bodu so strednou hodnotou 5.

  • 2 – 5 = -3
  • 4 – 5 = -1
  • 6 – 5 = 1
  • 8 – 5 = 3

Teraz začíname každé z týchto čísel a spočítame ich. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.

instagram viewer

Príklad odkazu na skratku

Teraz použijeme rovnakú množinu údajov: 2, 4, 6, 8, so skratkou vzorca na určenie súčtu štvorcov. Najprv každý štvorcový údajový bod a spočítame ich: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.

Ďalším krokom je spočítanie všetkých údajov a zaokrúhlenie tohto súčtu: (2 + 4 + 6 + 8)2 = 400. Vydeľujeme to počtom dátových bodov, aby sme získali 400/4 = 100.

Toto číslo teraz odpočítame od 120. Toto nám dáva, že súčet druhých odchýliek je 20. To bolo presne to číslo, ktoré sme už našli z druhého vzorca.

Ako to funguje?

Mnoho ľudí iba prijme tento vzorec v nominálnej hodnote a nemá potuchy, prečo tento vzorec funguje. Použitím trocha algebry vidíme, prečo je tento skratkový vzorec ekvivalentný štandardnému tradičnému spôsobu výpočtu súčtu druhých odchýlok.

Aj keď v reálnom súbore údajov môžu existovať stovky, ak nie tisíce hodnôt, predpokladáme, že existujú iba tri hodnoty údajov: x1, X2, X3. To, čo tu vidíme, by sa mohlo rozšíriť na množinu údajov, ktorá má tisíce bodov.

Začneme tým, že si to všimneme (x1 + x2 + x3) = 3 x̄. Výraz Σ (xja - X)2 = (x1 - X)2 + (x2 - X)2 + (x3 - X)2.

Teraz používame fakt zo základnej algebry, že (a + b)2 = a2 + 2ab + b2. To znamená, že (x1 - X)2 = x12 -2x1 x̄ + x̄2. Robíme to pre ďalšie dve podmienky nášho zhrnutia a máme:

X12 -2x1 x̄ + x̄2 + x22 -2x2 x̄ + x̄2 + x32 -2x3 x̄ + x̄2.

Usporiadame to a máme:

X12+ x22 + x32+ 3x̄2 - 2x̄ (x1 + x2 + x3) .

Prepisom (x1 + x2 + x3) = 3x̄ vyššie uvedené sa stáva:

X12+ x22 + x32 - 3x̄2.

Teraz od 3x̄2 = (x1+ x2 + x3)2/ 3, náš vzorec sa stáva:

X12+ x22 + x32 - (X1+ x2 + x3)2/3

A to je osobitný prípad všeobecného vzorca, ktorý bol uvedený vyššie:

Σ (xja2) - (Σ xja)2/n

Je to naozaj skratka?

Môže sa to zdať, že tento vzorec nie je skutočnou skratkou. Koniec koncov, vo vyššie uvedenom príklade sa zdá, že existuje toľko výpočtov. Čiastočne to súvisí s tým, že sme sa pozerali iba na malú veľkosť vzorky.

Keď zväčšujeme veľkosť našej vzorky, vidíme, že skratkový vzorec znižuje počet výpočtov asi o polovicu. Nepotrebujeme odpočítať priemer z každého údajového bodu a výsledok potom zaokrúhliť na druhú. Tým sa výrazne zníži celkový počet operácií.