v štatistika, existuje veľa výrazov, ktoré medzi nimi jemne rozlišujú. Jedným z príkladov je rozdiel medzi frekvencia a relatívna frekvencia. Aj keď existuje veľa použití relatívnych frekvencií, existuje jedno, ktoré zahŕňa histogram relatívnej frekvencie. Toto je typ grafu, ktorý má prepojenia na iné témy v štatistike a matematickej štatistike.
definícia
Histogramy sú štatistické grafy, ktoré vyzerajú stĺpcové grafy. Typicky je však termín histogram rezervovaný kvantitatívne premenné. Horizontálna os histogramu je číselný riadok obsahujúci vyučovanie alebo koše s rovnakou dĺžkou. Tieto zásobníky sú intervaly číselného riadku, kde môžu údaje padať, a môžu pozostávať z jedného čísla (zvyčajne pre oddelený - súbory údajov, ktoré sú relatívne malé) alebo rozsah hodnôt (pre väčšie diskrétne súbory údajov a - nepretržitý dáta).
Napríklad by sme mohli mať záujem zvážiť rozdelenie skóre v 50 bodovom kvíze pre triedu študentov. Jedným z možných spôsobov zostavenia košov by bolo mať iný zásobník na každých 10 bodov.
Vertikálna os histogramu predstavuje počet alebo frekvenciu výskytu dátovej hodnoty v každom z košov. Čím je stĺpec vyšší, tým viac údajov spadá do tohto rozsahu hodnôt bin. Ak sa vrátime k nášmu príkladu, ak existuje päť študentov, ktorí v teste získali viac ako 40 bodov, potom bude stĺpec zodpovedajúci 40 až 50 zásobníkom vysoký päť jednotiek.
Porovnanie frekvenčných histogramov
Histogram relatívnej frekvencie je menšia modifikácia typického frekvenčného histogramu. Namiesto použitia vertikálnej osi na výpočet hodnôt údajov, ktoré spadajú do daného zásobníka, používame túto os na vyjadrenie celkového podielu hodnôt údajov, ktoré spadajú do tohto zásobníka. Pretože 100% = 1, všetky stĺpce musia mať výšku od 0 do 1. Okrem toho musia byť výšky všetkých stĺpcov v našom histograme relatívnej frekvencie 1.
Preto v bežnom príklade, na ktorý sme sa pozerali, predpokladajme, že v našej triede je 25 študentov a päť dosiahlo viac ako 40 bodov. Namiesto toho, aby sme pre tento kôš skonštruovali tyč s výškou päť, mali by sme tyč s výškou 5/25 = 0,2.
Pri porovnaní histogramu s relatívnym frekvenčným histogramom, každý s rovnakými zásobníkmi, si niečo všimneme. Celkový tvar histogramov bude identický. Histogram relatívnej frekvencie nezdôrazňuje celkový počet v každej koši. Namiesto toho sa tento typ grafu zameriava na to, ako počet hodnôt údajov v koši súvisí s ostatnými zásobníkmi. Spôsob, akým ukazuje tento vzťah, je vyjadrený v percentách z celkového počtu hodnôt údajov.
Pravdepodobnostné hromadné funkcie
Možno sa pýtame, aký význam má definovanie relatívneho frekvenčného histogramu. Jedna kľúčová aplikácia sa týka diskrétnych náhodných premenných, kde sú naše zásobníky šírky jedna a sú sústredené okolo každého nezáporného celého čísla. V tomto prípade môžeme v našom relatívnom frekvenčnom histograme definovať funkciu po častiach s hodnotami zodpovedajúcimi vertikálnym výškam tyčí.
Tento typ funkcie sa nazýva pravdepodobnostná hromadná funkcia. Dôvodom pre konštrukciu funkcie týmto spôsobom je, že krivka, ktorá je definovaná funkciou, má priame spojenie pravdepodobnosť. Plocha pod krivkou z hodnôt na b je pravdepodobnosť, že náhodná premenná má hodnotu z na b.
Vzťah medzi pravdepodobnosťou a oblasťou pod krivkou je taký, ktorý sa opakovane zobrazuje v matematickej štatistike. Ďalším takým spojením je použitie funkcie pravdepodobnostnej hmotnosti na modelovanie histogramu relatívnej frekvencie.