Čo je robustnosť v štatistike?

click fraud protection

v štatistika, výraz robustnosť alebo robustnosť sa vzťahuje na silu štatistického modelu, testov a postupov podľa konkrétnych podmienok štatistickej analýzy, ktorú štúdia dúfa, že sa dosiahne. Vzhľadom na to, že sú splnené tieto podmienky štúdie, je možné pomocou matematických dôkazov overiť, či sú modely pravdivé.

Mnohé modely sú založené na ideálnych situáciách, ktoré pri práci s údajmi v reálnom svete neexistujú, a preto môže model poskytnúť správne výsledky, aj keď podmienky nie sú presne splnené.

Robustná štatistika je preto každá štatistika, ktorá poskytuje dobrý výkon, keď sa údaje čerpajú zo širokého spektra pravdepodobnostné rozdelenia, ktoré sú do veľkej miery nedotknuté odľahlými hodnotami alebo malými odchýlkami od modelových predpokladov v danom prípade dátovej sady. Inými slovami, robustná štatistika je odolná voči chybám vo výsledkoch.

Jedným zo spôsobov, ako pozorovať bežne používaný robustný štatistický postup, nie je potrebné hľadať ďalej, ako t-postupy, ktoré na určenie najpresnejších štatistických predpovedí používajú testy hypotéz.

instagram viewer

Dodržiavanie postupov T

Ako príklad robustnosti budeme uvažovať T- postupy, ktoré zahŕňajú interval spoľahlivosti pre priemernú populáciu so neznámou štandardnou odchýlkou ​​populácie, ako aj pre testy hypotéz o priemere populácie.

Použitie t-postupy predpokladajú nasledujúce:

  • Súbor údajov, s ktorými pracujeme, je jednoduchá náhodná vzorka populácie.
  • Populácia, z ktorej sme odobrali vzorky, je zvyčajne distribuovaná.

V praxi s príkladmi zo skutočného života majú štatistici zriedka len populáciu, ktorá je normálne distribuovaná, takže namiesto toho sa stáva otázkou: „Ako silné sú naše t-Postupy? "

Všeobecne platí, že podmienka, že máme jednoduchú náhodnú vzorku, je dôležitejšia ako podmienka, že sme odobrali vzorky z normálne distribuovanej populácie; Dôvodom je to, že stredná limitná veta zabezpečuje distribúciu vzorkovania, ktorá je približne normálne - čím väčšia je naša veľkosť vzorky, tým bližšie je rozdelenie vzorkovania priemeru vzorky normálu.

Ako postupy T fungujú ako robustná štatistika

Takže robustnosť pre T- postupy závisia od veľkosti vzorky a distribúcie našej vzorky. Úvahy o tom zahŕňajú:

  • Ak je veľkosť vzoriek veľká, znamená to, že máme 40 alebo viac pozorovaní t-postupy je možné použiť dokonca aj so skosenými rozdeleniami.
  • Ak je veľkosť vzorky medzi 15 a 40, potom môžeme použiť t-postupy pre akékoľvek tvarované rozloženie, pokiaľ neexistujú odľahlé hodnoty alebo vysoký stupeň skreslenia.
  • Ak je veľkosť vzorky menšia ako 15, môžeme použiť T- postupy pre údaje, ktoré nemajú odľahlé hodnoty, jediný vrchol a sú takmer symetrické.

Vo väčšine prípadov sa robustnosť stanovila prostredníctvom technickej práce v matematickej štatistike a Našťastie nemusíme tieto pokročilé matematické výpočty nevyhnutne robiť, aby sme ich mohli správne využívať ich; Potrebujeme iba pochopiť, aké sú všeobecné pokyny pre spoľahlivosť našej špecifickej štatistickej metódy.

Postupy T fungujú ako spoľahlivá štatistika, pretože spravidla poskytujú dobrý výkon podľa týchto modelov tým, že faktorom veľkosti vzorky sú základ pre uplatňovanie postupu.

instagram story viewer