Existuje množstvo popisných štatistík. Čísla ako priemer, medián, režim, šikmosťkurtóza, smerodajná odchýlka, prvý kvartil a tretí kvartil, aby sme vymenovali aspoň niektoré, každý nám povie niečo o našich údajoch. Skôr než sa na ne pozerať deskriptívna štatistika individuálne, niekedy ich kombináciou nám pomôže získať úplný obraz. Z tohto hľadiska je zhrnutie piatich čísel vhodným spôsobom, ako skombinovať päť opisných štatistík.
Ktorých päť čísel?
Je zrejmé, že v našom zhrnutí musí byť päť čísel, ale ktoré päť? Zvolené čísla nám majú pomôcť spoznať centrum našich údajov a zistiť, ako sú rozmiestnené údajové body. Z tohto hľadiska pozostáva zhrnutie piatich čísel z týchto údajov:
- Minimum - to je najmenšia hodnota v našom súbore údajov.
- Prvý kvartil - toto číslo sa označuje Q1 a 25% našich údajov klesne pod prvý kvartil.
- Medián - toto je stredný bod údajov. 50% všetkých údajov klesne pod medián.
- Tretí kvartil - toto číslo sa označuje Q3 a 75% našich údajov klesne pod tretí kvartil.
- Maximum - to je najväčšia hodnota v našom súbore údajov.
Stredná a štandardná odchýlka sa môže tiež použiť spoločne na prenos stredu a šírenia súboru údajov. Obidve tieto štatistické údaje sú však citlivé na odľahlé hodnoty. Medián, prvý kvartil a tretí kvartil nie sú tak silne ovplyvnené odľahlými hodnotami.
Príklad
Vzhľadom na nasledujúci súbor údajov uvedieme súhrn piatich čísel:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
V súbore údajov je spolu dvadsať bodov. Medián je teda priemerom desiatej a jedenástej hodnoty údajov alebo:
(7 + 8)/2 = 7.5.
Medián dolnej polovice údajov je prvý kvartil. Spodná polovica je:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Preto počítameQ1= (4 + 6)/2 = 5.
Medián hornej polovice pôvodného súboru údajov je tretí kvartil. Potrebujeme nájsť strednú hodnotu:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Preto počítameQ3= (15 + 15)/2 = 15.
Zhromažďujeme všetky vyššie uvedené výsledky a uvádzame, že súhrn piatich čísel pre vyššie uvedenú množinu údajov je 1, 5, 7,5, 12, 20.
Grafické zobrazenie
Možno porovnávať päť súhrnných čísel. Zistíme, že dve sady s podobnými prostriedkami a štandardnými odchýlkami môžu mať veľmi odlišné zhrnutia piatich čísel. Na jednoduché porovnanie dvoch piatich číselných zhrnutí na prvý pohľad môžeme použiť a boxplotalebo graf škatule a fúzy.