medián súboru dát je stredný bod, kde presne polovica hodnôt údajov je menšia alebo rovná strednému priemeru. Podobným spôsobom môžeme uvažovať o mediáne a nepretržitýrozdelenia pravdepodobnosti, ale namiesto nájdenia strednej hodnoty v množine údajov nachádzame stred distribúcie iným spôsobom.
Celková plocha pod funkciou hustoty pravdepodobnosti je 1, čo predstavuje 100%, a preto môže byť polovica z tohto zastúpená polovicou alebo 50 percentami. Jednou z veľkých myšlienok matematickej štatistiky je, že pravdepodobnosť predstavuje oblasť pod krivkou funkcia hustoty, ktorá sa vypočíta integrálne, a teda medián kontinuálneho rozdelenia je bodom Reálne číslo čiara, kde presne polovica oblasti leží vľavo.
Toto možno stručne uviesť pomocou nasledujúceho nesprávneho integrálu. Medián spojitej náhodnej premennej X s funkciou hustoty F( X) je hodnota M tak, že:
0.5=∫m−∞F(X)dX
Medián pre exponenciálnu distribúciu
Teraz vypočítame strednú hodnotu pre exponenciálne rozdelenie Exp (A). Náhodná premenná s týmto rozdelením má funkciu hustoty
F(X) = e-X/ A/ A pre X akékoľvek nezáporné reálne číslo. Funkcia obsahuje aj matematická konštanta e, približne rovná 2,71828.Pretože funkcia hustoty pravdepodobnosti je pre každú zápornú hodnotu nula X, všetko, čo musíme urobiť, je integrovať nasledujúce a vyriešiť M:
0,5 = -0MM (x) dx
Od integrálu ∫ e-X/ A/ A dX = -e-X/ A, výsledkom je to
0,5 = -e-M / A + l
To znamená, že 0,5 = e-M / A a po vzatí prirodzeného logaritmu oboch strán rovnice máme:
ln (1/2) = -M / A
Pretože 1/2 = 2-1, podľa vlastností logaritmov píšeme:
- ln2 = -M / A
Vynásobením oboch strán koeficientom A sa získa výsledok, že stredná hodnota M = A ln2.
Stredná nerovnováha v štatistike
Je potrebné uviesť jeden dôsledok tohto výsledku: priemer exponenciálnej distribúcie Exp (A) je A a keďže ln2 je menej ako 1, vyplýva z toho, že produkt Aln2 je menší ako A. To znamená, že medián exponenciálneho rozdelenia je menší ako priemer.
To má zmysel, ak uvažujeme o grafe funkcie hustoty pravdepodobnosti. Z dôvodu dlhého chvosta je toto rozdelenie naklonené doprava. Mnohokrát, keď je distribúcia zošikmená doprava, stredná hodnota je napravo od mediánu.
Čo to znamená z hľadiska štatistickej analýzy je to, že môžeme často predpovedať, že priemer a medián nie sú priamo korelujú vzhľadom na pravdepodobnosť, že údaje sú zošikmené doprava, čo možno vyjadriť ako stredný priemer nerovnosti známy ako Chebyshevova nerovnosť.
Ako príklad uvážte množinu údajov, ktorá predpokladá, že daná osoba získa celkom 30 návštevníkov za 10 hodín, pričom priemerná doba čakania na návštevníka je 20 minút, zatiaľ čo súbor údajov môže naznačovať, že priemerná doba čakania by bola niekde medzi 20 a 30 minútami, ak by viac ako polovica týchto návštevníkov prišla v prvých piatich hodín.