Čo je pravidlo medzikvartilového rozsahu?

Pravidlo medzikvartilového rozsahu je užitočné pri zisťovaní prítomnosti extrémnych hodnôt. odľahlej sú jednotlivé hodnoty, ktoré sú mimo celkového vzoru súboru údajov. Táto definícia je trochu vágna a subjektívna, preto je užitočné mať pravidlo, kedy sa má uplatňovať určenie, či je údajový bod skutočne odľahlým bodom - tu platí pravidlo medzikvartálneho rozsahu prichádza.

Akýkoľvek súbor údajov možno opísať pomocou súhrn piatich čísel. Týchto päť čísel, ktoré vám poskytujú informácie, ktoré potrebujete na nájdenie vzorov a odľahlých hodnôt, sa skladá (vo vzostupnom poradí):

Týchto päť čísel hovorí osobe viac o ich údajoch, ako by sa dalo pozerať na čísla naraz, alebo by to aspoň uľahčilo. Napríklad rozsah, čo je minimum odpočítané od maxima, je jedným z ukazovateľov toho, ako sú údaje rozložené v súbore (poznámka: rozsah je vysoko citlivé na odľahlé hodnoty - ak je odľahlá hodnota tiež minimálna alebo maximálna, rozsah nebude presným vyjadrením šírky údajov set).

Inak by bolo ťažké extrapolovať rozsah. Podobný ako rozsah, ale menej citlivý na odľahlé hodnoty, je medzikvartilový rozsah.

instagram viewer
medzikvartilný rozsah sa vypočíta rovnakým spôsobom ako rozsah. Jediné, čo nájdete, je odpočítať prvý kvartil z tretieho kvartilu:

Interkartilárny rozsah ukazuje, ako sa údaje šíria o mediáne. Je menej náchylný ako rozsah na odľahlé hodnoty, a preto môže byť užitočnejší.

Aj keď to nie je často ovplyvnené nimi, medzikvartilný rozsah sa môže použiť na detekciu odľahlých hodnôt. To sa vykonáva pomocou týchto krokov:

Pamätajte, že pravidlo medzikvartálu je iba pravidlom, ktoré sa vo všeobecnosti platí, ale nevzťahuje sa na všetky prípady. Vo všeobecnosti by ste mali vždy sledovať svoju odľahlú analýzu študovaním výsledných odľahlých hodnôt, aby ste zistili, či majú zmysel. Akýkoľvek potenciálny odľahlý údaj získaný medzikvartilovou metódou by sa mal preskúmať v kontexte celého súboru údajov.

Pozrite si pravidlo medzikvartilového rozsahu pri práci s príkladom. Predpokladajme, že máte nasledujúcu množinu údajov: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Súhrn piatich čísel pre tento súbor údajov je minimum = 1, prvý kvartil = 4, medián = 7, tretí kvartil = 10 a maximum = 17. Môžete sa pozrieť na údaje a automaticky povedať, že 17 je odľahlá hodnota, ale čo hovorí pravidlo medzikvartilu?

Teraz vynásobte svoju odpoveď číslom 1,5 a získajte hodnotu 1,5 x 6 = 9. O deväť menej ako prvý kvartil je 4 - 9 = -5. Žiadne údaje nie sú nižšie. Deväť viac ako tretí kvartil je 10 + 9 = 19. Žiadne údaje nie sú väčšie. Napriek tomu, že maximálna hodnota je o päť viac ako najbližší dátový bod, pravidlo medzikvartálneho rozsahu ukazuje, že by sa pravdepodobne nemalo považovať za odľahlú hodnotu pre tento súbor údajov.