Čo sú prvý a tretí kvartil?

Prvý a tretí kvartil sú opisné štatistiky, ktoré sú mierami polohy v množine údajov. Podobne ako medián označuje stredný bod množiny údajov, prvý kvartil označuje štvrtinu alebo 25% bod. Približne 25% hodnôt údajov je menších alebo sa rovná prvému kvartilu. Tretí kvartil je podobný, ale pre horných 25% údajov. Tieto myšlienky sa podrobnejšie pozrieme v nasledujúcom texte.

Medián

Existuje niekoľko spôsobov, ako zmerať centrum súboru údajov. Priemer, medián, režim a stredné pásmo majú všetky výhody a obmedzenia pri vyjadrovaní stredu údajov. Zo všetkých týchto spôsobov, ako nájsť priemer, medián je najodolnejší voči extrémnym hodnotám. Označuje stred údajov v tom zmysle, že polovica údajov je menšia ako stredná hodnota.

Prvý kvartil

Nie je dôvod, aby sme prestali hľadať iba stred. Čo keby sme sa rozhodli pokračovať v tomto procese? Mohli sme vypočítať strednú hodnotu spodnej polovice našich údajov. Polovica 50% je 25%. Polovica alebo štvrtina údajov by teda bola pod touto úrovňou. Keďže ide o štvrtinu pôvodnej množiny, tento stredná hodnota dolnej polovice údajov sa nazýva prvý kvartil a označuje ju

instagram viewer
Q1.

Tretí kvartil

Neexistuje žiadny dôvod, prečo sme sa pozerali na spodnú polovicu údajov. Namiesto toho sme sa mohli pozrieť na hornú polovicu a vykonať rovnaké kroky ako vyššie. Medián tejto polovice, ktorý označíme Q3 tiež rozdelí súbor údajov na štvrtiny. Toto číslo však označuje hornú štvrtinu údajov. Tri štvrtiny údajov sú teda pod naším číslom Q3. Preto voláme Q3 tretí kvartil.

Príklad

Aby sme to objasnili, pozrime sa na príklad. Môže byť užitočné najskôr skontrolovať, ako vypočítať strednú hodnotu niektorých údajov. Začnite s nasledujúcou sadou údajov:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

V súprave je celkom dvadsať údajových bodov. Začneme tým, že nájdeme strednú hodnotu. Pretože existuje párny počet údajov, stredná hodnota predstavuje strednú hodnotu desiatej a jedenástej hodnoty. Inými slovami, medián je:

(7 + 8)/2 = 7.5.

Teraz sa pozrite na spodnú polovicu údajov. Medián tejto polovice sa nachádza medzi piatou a šiestou hodnotou:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Zistilo sa teda, že prvý kvartil je rovnaký Q1 = (4 + 6)/2 = 5

Ak chcete nájsť tretí kvartil, pozrite sa na hornú polovicu pôvodného súboru údajov. Potrebujeme nájsť strednú hodnotu:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Medián je (15 + 15) / 2 = 15. Teda tretí kvartil Q3 = 15.

Interkartilný rozsah a súhrn piatich čísel

Kvartily nám pomáhajú poskytnúť ucelenejší obraz o našom súbore údajov ako celku. Prvý a tretí kvartil nám poskytujú informácie o vnútornej štruktúre našich údajov. Stredná polovica údajov spadá medzi prvý a tretí kvartil a je sústredená okolo mediánu. Rozdiel medzi prvým a tretím kvartilom, nazývaným medzikvartilný rozsah, zobrazuje, ako sú údaje usporiadané o mediáne. Malý medzikvartilný rozsah označuje údaje, ktoré sú zhromaždené okolo mediánu. Väčší medzikvartilný rozsah ukazuje, že údaje sú rozložené viac.

Podrobnejší obraz údajov je možné získať tak, že poznáme najvyššiu hodnotu, ktorá sa nazýva maximálna hodnota, a najnižšiu hodnotu, ktorá sa nazýva minimálna hodnota. Minimálny, prvý kvartil, medián, tretí kvartil a maximum sú skupinou piatich hodnôt nazývaných súhrn piatich čísel. Účinný spôsob zobrazenia týchto piatich čísel sa nazýva a boxplot alebo box a graf fúzy.