Čo je histogram a ako sa používa?

Histogram je typ grafu, ktorý má široké uplatnenie v štatistike. Histogramy poskytujú vizuálnu interpretáciu číselné údaje uvedením počtu dátových bodov, ktoré ležia v rozmedzí hodnôt. Tieto rozsahy hodnôt sa nazývajú triedy alebo zásobníky. Frekvencia údajov, ktoré patria do každej triedy, je znázornená pomocou stĺpca. Čím vyššia je táto lišta, tým vyššia je frekvencia údajov v danom zásobníku.

Histogramy vs. Stĺpcové grafy

Na prvý pohľad vyzerajú histogramy veľmi podobne stĺpcové grafy. Oba grafy používajú zvislé stĺpce na znázornenie údajov. Výška tyče zodpovedá relatívna frekvencia množstva údajov v triede. Čím je stĺpec vyšší, tým vyššia je frekvencia údajov. Čím nižšia je lišta, tým nižšia je frekvencia údajov. Vzhľad však môže byť klamný. Práve tu končí podobnosť medzi dvoma druhmi grafov.

Dôvod, prečo sa tieto druhy grafov líšia, súvisí s úroveň merania údajov. Na jednej strane sa stĺpcové grafy používajú pre údaje na nominálnej úrovni merania. Stĺpcové grafy zmerajte frekvenciu kategorických údajov a triedy pre stĺpcový graf sú tieto kategórie. Na druhej strane sa histogramy používajú pre údaje, ktoré sú aspoň na

instagram viewer
radová úroveň merania. Triedy pre histogram sú rozsahy hodnôt.

Ďalší kľúčový rozdiel medzi stĺpcovými grafmi a histogramami súvisí s usporiadaním stĺpcov. V stĺpcovom grafe je bežnou praxou zmeniť usporiadanie tyčí podľa klesajúcej výšky. Tyče v histograme však nemožno usporiadať. Musia byť zobrazené v poradí, v akom sa triedy vyskytujú.

Príklad histogramu

Diagram vyššie ukazuje histogram. Predpokladajme, že prevrátia sa štyri mince a zaznamenajú sa výsledky. Použitie vhodných binomická distribučná tabuľka alebo priame výpočty s binomickým vzorcom ukazujú, že pravdepodobnosť, že žiadne hlavy nie sú, je 1/16, pravdepodobnosť, že jedna hlava je, je 4/16. Pravdepodobnosť dvoch hláv je 6/16. Pravdepodobnosť troch hláv je 4/16. Pravdepodobnosť štyroch hláv je 1/16.

Konštruujeme celkom päť tried, každú zo šírky jednej. Tieto triedy zodpovedajú možnému počtu hláv: nula, jedna, dve, tri alebo štyri. Nad každou triedou nakreslíme zvislú čiaru alebo obdĺžnik. Výška týchto tyčí zodpovedá pravdepodobnostiam uvedeným v našom pravdepodobnostnom experimente vyhodenia štyroch mincí a spočítania hláv.

Histogramy a pravdepodobnosti

Vyššie uvedený príklad nielen demonštruje konštrukciu histogramu, ale tiež to dokazuje diskrétne rozdelenie pravdepodobnosti môže byť reprezentovaný histogramom. Skutočne a diskrétne rozdelenie pravdepodobnosti môže byť reprezentované histogramom.

Na zostavenie histogramu, ktorý predstavuje rozdelenie pravdepodobnosti, začneme výberom tried. Mali by to byť výsledky pravdepodobnostného experimentu. Šírka každej z týchto tried by mala byť jedna jednotka. Výška stĺpcov histogramu predstavuje pravdepodobnosť každého z výsledkov. Pri takto vytvorenom histograme sú pravdepodobnosťou aj oblasti tyčiniek.

Pretože tento druh histogramu nám dáva pravdepodobnosť, podlieha niekoľkým podmienkam. Jedným ustanovením je, že pre mierku, ktorá nám dáva výšku danej stĺpca histogramu, sa môžu použiť iba nezáporné čísla. Druhou podmienkou je, že keďže pravdepodobnosť je rovnaká ako plocha, musia všetky súčasti tyčiniek sčítať celkom jednu, čo zodpovedá 100%.

Histogramy a ďalšie aplikácie

Stĺpce v histograme nemusia byť pravdepodobné. Histogramy sú užitočné v iných oblastiach, ako je pravdepodobnosť. Kedykoľvek chceme porovnávať frekvenciu výskytu kvantitatívnych údajov, na zobrazenie nášho súboru údajov sa dá použiť histogram.