Je to polnočné predstavenie najnovšieho hitového filmu. Ľudia sú zoradení pred divadlom a čakajú na vstup. Predpokladajme, že ste požiadaní, aby ste našli stred linky. Ako by ste to urobili?
Existuje niekoľko rôznych spôsobov, ako ísť riešenie tohto problému. Nakoniec by ste museli zistiť, koľko ľudí bolo v rade, a potom zobrať polovicu tohto počtu. Ak je celkový počet párny, bude stred linky medzi dvoma ľuďmi. Ak je celkový počet nepárny, potom bude centrom jedna osoba.
Môžete sa opýtať: „Čo má spoločné nájdenie stredu čiary štatistika„Táto myšlienka nájsť centrum je presne to, čo sa používa pri výpočte mediánu súboru údajov.
Čo je medián?
Medián je jedným z troch primárnych spôsobov, ako zistiť priemer štatistické údaje. Je to ťažšie vypočítať ako režim, ale nie také náročné na prácu, ako je výpočet priemeru. Je to centrum v podstate rovnakým spôsobom ako nájdenie stredu radu ľudí. Po zoradení dátových hodnôt vo vzostupnom poradí je medián dátová hodnota s rovnakým počtom dátových hodnôt nad ňou a pod ňou.
Prípad 1: Nepárny počet hodnôt
Testuje sa jedenásť batérií, aby sa zistilo, ako dlho vydržia. Ich životnosť v hodinách je daná 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Aký je priemerný život? Pretože existuje nepárny počet dátových hodnôt, zodpovedá to riadku s nepárnym počtom ľudí. Stred bude strednou hodnotou.
Existuje jedenásť dátových hodnôt, takže šiesty je v strede. Priemerná výdrž batérie je preto šiestou hodnotou v tomto zozname alebo 105 hodín. Upozorňujeme, že stredná hodnota je jednou z hodnôt údajov.
Prípad dva: párny počet hodnôt
Váži sa dvadsať mačiek. Ich hmotnosť v librách je daná 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Aká je stredná váha mačiek? Pretože existuje párny počet údajov, zodpovedá to riadku s párnym počtom ľudí. Stred je medzi dvoma strednými hodnotami.
V tomto prípade je stred medzi desiatou a jedenástou dátovou hodnotou. Aby sme našli strednú hodnotu, vypočítame stred týchto dvoch hodnôt a získame (7 + 8) / 2 = 7,5. Medián tu nie je jednou z hodnôt údajov.
Iné prípady?
Jedinou možnosťou je mať párny alebo nepárny počet dátových hodnôt. Vyššie uvedené dva príklady sú teda jediným možným spôsobom výpočtu mediánu. Stredná hodnota bude buď stredná hodnota, alebo stredná hodnota z dvoch stredné hodnoty. Zvyčajne sú súbory údajov omnoho väčšie ako tie, ktoré sme skúmali vyššie, ale proces zistenia mediánu je rovnaký ako tieto dva príklady.
Účinok odľahlých hodnôt
Priemer a režim sú vysoko citlivé na odľahlé hodnoty. To znamená, že prítomnosť odľahlej hodnoty dramaticky ovplyvní obe tieto opatrenia centra. Jednou výhodou mediánu je, že nie je príliš ovplyvnený odľahlou hodnotou.
Ak to chcete vidieť, zvážte množinu údajov 3, 4, 5, 5, 6. Priemer je (3 + 4 + 5 + 5 + 6) / 5 = 4,6 a medián je 5. Teraz ponechajte rovnakú množinu údajov, ale pridajte hodnotu 100: 3, 4, 5, 5, 6, 100. Je zrejmé, že 100 je odľahlá hodnota, pretože je omnoho väčšia ako všetky ostatné hodnoty. Priemer novej sady je teraz (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. Avšak, medián nového súboru je 5. Napriek tomu
Uplatnenie mediánu
Vzhľadom na to, čo sme videli vyššie, je strednou hodnotou uprednostňovaná miera priemeru, keď údaje obsahujú odľahlé hodnoty. Ak sa vykazujú príjmy, typickým prístupom je vykazovanie priemerného príjmu. Deje sa tak preto, lebo priemerný príjem je skreslený malým počtom ľudí s veľmi vysokými príjmami (myslím Bill Gates a Oprah).