Čo je súhrn 5 čísel?

Existuje množstvo popisných štatistík. Čísla ako priemer, medián, režim, šikmosťkurtóza, smerodajná odchýlka, prvý kvartil a tretí kvartil, aby sme vymenovali aspoň niektoré, každý nám povie niečo o našich údajoch. Skôr než sa na ne pozerať deskriptívna štatistika individuálne, niekedy ich kombináciou nám pomôže získať úplný obraz. Z tohto hľadiska je zhrnutie piatich čísel vhodným spôsobom, ako skombinovať päť opisných štatistík.

Ktorých päť čísel?

Je zrejmé, že v našom zhrnutí musí byť päť čísel, ale ktoré päť? Zvolené čísla nám majú pomôcť spoznať centrum našich údajov a zistiť, ako sú rozmiestnené údajové body. Z tohto hľadiska pozostáva zhrnutie piatich čísel z týchto údajov:

  • Minimum - to je najmenšia hodnota v našom súbore údajov.
  • Prvý kvartil - toto číslo sa označuje Q1 a 25% našich údajov klesne pod prvý kvartil.
  • Medián - toto je stredný bod údajov. 50% všetkých údajov klesne pod medián.
  • Tretí kvartil - toto číslo sa označuje Q3 a 75% našich údajov klesne pod tretí kvartil.
  • Maximum - to je najväčšia hodnota v našom súbore údajov.
instagram viewer

Stredná a štandardná odchýlka sa môže tiež použiť spoločne na prenos stredu a šírenia súboru údajov. Obidve tieto štatistické údaje sú však citlivé na odľahlé hodnoty. Medián, prvý kvartil a tretí kvartil nie sú tak silne ovplyvnené odľahlými hodnotami.

Príklad

Vzhľadom na nasledujúci súbor údajov uvedieme súhrn piatich čísel:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

V súbore údajov je spolu dvadsať bodov. Medián je teda priemerom desiatej a jedenástej hodnoty údajov alebo:

(7 + 8)/2 = 7.5.

Medián dolnej polovice údajov je prvý kvartil. Spodná polovica je:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Preto počítameQ1= (4 + 6)/2 = 5.

Medián hornej polovice pôvodného súboru údajov je tretí kvartil. Potrebujeme nájsť strednú hodnotu:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Preto počítameQ3= (15 + 15)/2 = 15.

Zhromažďujeme všetky vyššie uvedené výsledky a uvádzame, že súhrn piatich čísel pre vyššie uvedenú množinu údajov je 1, 5, 7,5, 12, 20.

Grafické zobrazenie

Možno porovnávať päť súhrnných čísel. Zistíme, že dve sady s podobnými prostriedkami a štandardnými odchýlkami môžu mať veľmi odlišné zhrnutia piatich čísel. Na jednoduché porovnanie dvoch piatich číselných zhrnutí na prvý pohľad môžeme použiť a boxplotalebo graf škatule a fúzy.