Chebyshevova nerovnosť hovorí, že najmenej 1-1 /K2 údajov zo vzorky musia spadať K štandardné odchýlky od priemeru (tu) K je pozitívny Reálne číslo viac ako jeden).
Akákoľvek množina údajov, ktorá je bežne distribuovaná alebo má tvar a zvonová krivka, má niekoľko funkcií. Jedna z nich sa zaoberá šírením údajov vo vzťahu k počtu štandardných odchýlok od priemeru. Pri normálnom rozdelení vieme, že 68% údajov predstavuje jednu štandardnú odchýlku od priemeru, 95% sú dve smerodajné odchýlky od priemeru a približne 99% je v rámci troch štandardných odchýlok od priemeru.
Ak však dátový súbor nie je distribuovaný v tvare zvonovej krivky, môže sa v rámci jednej štandardnej odchýlky pohybovať iné množstvo. Chebyshevova nerovnosť poskytuje spôsob, ako zistiť, do ktorej časti údajov spadá K štandardné odchýlky od priemeru pre akýkoľvek súbor údajov.
Fakty o nerovnosti
Vyššie uvedenú nerovnosť môžeme uviesť aj nahradením vety „údaje zo vzorky“ za rozdelenia pravdepodobnosti. Je to preto, že Chebyshevova nerovnosť je výsledkom pravdepodobnosti, ktorá sa potom môže uplatniť na štatistiku.
Je dôležité poznamenať, že táto nerovnosť je výsledkom, ktorý sa preukázal matematicky. Nie je to ako empirický vzťah medzi priemerom a režimom alebo pravidlo palca ktorý spája rozsah a štandardnú odchýlku.
Ilustrácia nerovnosti
Na ilustráciu nerovnosti sa na ňu pozrieme na niekoľko hodnôt K:
- pre K = 2 máme 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Chebyshevova nerovnosť teda hovorí, že najmenej 75% údajových hodnôt akejkoľvek distribúcie musí byť v rámci dvoch štandardných odchýlok od priemeru.
- pre K = 3 máme 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Chebyshevova nerovnosť teda hovorí, že najmenej 89% dátových hodnôt akejkoľvek distribúcie musí byť v rámci troch štandardných odchýlok od priemeru.
- pre K = 4 máme 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Chebyshevova nerovnosť teda hovorí, že najmenej 93,75% dátových hodnôt akejkoľvek distribúcie musí byť v rámci dvoch štandardných odchýlok od priemeru.
príklad
Predpokladajme, že sme odobrali vzorky hmotnosti psov v miestnom útulku pre zvieratá a zistili sme, že naša vzorka má priemer 20 libier so štandardnou odchýlkou 3 libry. S použitím Chebyshevovej nerovnosti vieme, že najmenej 75% psov, z ktorých sme odobrali vzorky, má závažia, ktoré sú dvoma štandardnými odchýlkami od priemeru. Dvojnásobok smerodajnej odchýlky nám dáva 2 x 3 = 6. Odčítajte a pridajte od priemeru 20. Toto nám hovorí, že 75% psov má hmotnosť od 14 libier do 26 libier.
Použitie nerovnosti
Ak vieme viac o distribúcii, s ktorou pracujeme, zvyčajne môžeme zaručiť, že viac údajov je určitý počet štandardných odchýlok od priemeru. Napríklad, ak vieme, že máme normálne rozdelenie, potom 95% údajov sú dve štandardné odchýlky od priemeru. Chebyshevova nerovnosť hovorí, že v tejto situácii to vieme najmenej 75% údajov sú dve štandardné odchýlky od priemeru. Ako vidíme v tomto prípade, mohlo by to byť oveľa viac ako 75%.
Hodnota nerovnosti spočíva v tom, že nám poskytuje scenár „horšieho prípadu“, v ktorom jediné, čo vieme o našich vzorkách (alebo rozdelení pravdepodobnosti), je priemer a smerodajná odchýlka. Ak o našich údajoch nevieme nič iné, Chebyshevova nerovnosť poskytuje ďalšie informácie o tom, ako je súbor údajov rozšírený.
História nerovnosti
Nerovnosť je pomenovaná po ruskom matematikovi Pafnutom Chebyshevovi, ktorý nerovnosť prvýkrát uviedol bez dôkazu v roku 1874. O desať rokov neskôr bola nerovnosť dokázaná Markovom v jeho Ph. D. dizertačnej práce. Kvôli rozdielom v spôsobe, ako reprezentovať ruskú abecedu v angličtine, je Chebyshev tiež označovaný ako Tchebysheff.