Úvod do medzikvartilového rozsahu

Interkvartilný rozsah (IQR) je rozdiel medzi prvým kvartilom a tretím kvartilom. Vzorec je:

IQR = Q3 - Q1

Existuje mnoho meraní variability súboru údajov. Oba rozsah a smerodajná odchýlka povedzte nám, aké sú naše údaje. Problém s týmito popisnými štatistikami spočíva v tom, že sú veľmi citlivé na odľahlé hodnoty. Meranie šírenia súboru údajov, ktorý je odolnejší voči prítomnosti odľahlých hodnôt, je medzikvartilovým rozsahom.

Definícia medzikvartilového rozsahu

Ako je uvedené vyššie, medzikvartilový rozsah je založený na výpočte iných štatistík. Pred určením interkvartilového rozsahu musíme najprv poznať hodnoty prvého kvartilu a tretieho kvartilu. (Prvý a tretí kvartil samozrejme závisia od hodnoty mediánu).

Akonáhle sme určili hodnoty prvého a tretieho kvartilu, je veľmi ľahké vypočítať medzikvartilový rozsah. Všetko, čo musíme urobiť, je odpočítať prvý kvartil od tretieho kvartilu. Toto vysvetľuje použitie termínu medzikvartilný rozsah pre túto štatistiku.

príklad

Aby sme videli príklad výpočtu medzikvartilového rozsahu, zvážime skupinu údajov: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9.

instagram viewer
súhrn piatich čísel pre túto množinu údajov je:

  • Minimálne 2
  • Prvý kvartil 3,5
  • Medián 6
  • Tretí kvartil z 8
  • Maximálne 9

Vidíme teda, že medzikvartilný rozsah je 8 - 3,5 = 4,5.

Význam medzikvartilového rozsahu

Rozsah nám ukazuje mieru rozloženia celého súboru údajov. Interkartilný rozsah, ktorý nám hovorí, ako ďaleko od seba prvý a tretí kvartil sú, naznačuje, ako je rozložených stredných 50% našej množiny údajov.

Odolnosť voči odľahlým hodnotám

Hlavnou výhodou použitia medzikvartilového rozsahu namiesto rozsahu na meranie šírenia súboru údajov je to, že medzikvartilový rozsah nie je citlivý na odľahlé hodnoty. Aby sme to videli, pozrieme sa na príklad.

Z vyššie uvedeného súboru údajov máme medzikvartilový rozsah 3,5, rozsah 9 - 2 = 7 a štandardnú odchýlku 2,34. Ak nahradíme najvyššiu hodnotu 9 extrémnou odľahlou hodnotou 100, štandardná odchýlka sa zmení na 27,37 a rozsah je 98. Aj keď máme celkom drastické posuny týchto hodnôt, prvý a tretí kvartil nie sú ovplyvnené, a preto sa medzikvartilný rozsah nemení.

Použitie medzikvartilového rozsahu

Okrem menej citlivej miery šírenia súboru údajov má medzikvartilové rozpätie ďalšie dôležité využitie. Kvôli svojej odolnosti voči odľahlým hodnotám je medzikvartilové rozmedzie užitočné pri identifikácii, kedy je hodnota odľahlá.

pravidlo medzikvartilového rozsahu je to, čo nás informuje, či máme miernu alebo silnú odľahlú hodnotu. Aby sme hľadali odľahlú hodnotu, musíme hľadať pod prvým kvartilom alebo nad tretím kvartilom. Ako ďaleko by sme mali ísť, závisí od hodnoty medzikvartilového rozsahu.

instagram story viewer