Jedna otázka, na ktorú je vždy potrebné sa pýtať štatistika je: „Je pozorovaný výsledok len náhodou alebo je to tak? Štatistický významný? " Jedna trieda testy hypotéz, ktoré sa nazývajú permutačné testy, nám umožňujú vyskúšať túto otázku. Prehľad a kroky takéhoto testu sú:
- Rozdeľovali sme svoje subjekty do kontrolnej a experimentálnej skupiny. Nulová hypotéza je, že medzi týmito dvoma skupinami nie je žiadny rozdiel.
- Aplikujte ošetrenie na experimentálnu skupinu.
- Zmerajte reakciu na liečbu
- Zvážte všetky možné konfigurácie experimentálnej skupiny a pozorovanú reakciu.
- Vypočítajte p-hodnotu na základe našej pozorovanej odpovede vo vzťahu ku všetkým potenciálnym experimentálnym skupinám.
Toto je náčrt permutácie. Na úvod tohto obrysu strávime čas podrobným skúmaním prepracovaného príkladu takéhoto permutačného testu.
príklad
Predpokladajme, že študujeme myši. Zaujíma nás najmä to, ako rýchlo myši dokončia bludisko, s ktorým sa nikdy predtým nestretli. Chceme poskytnúť dôkazy v prospech experimentálnej liečby. Cieľom je demonštrovať, že myši v liečenej skupine vyriešia bludisko rýchlejšie ako myši bez liečby.
Začneme s našimi subjektmi: šiestimi myšami. Pre lepšie pochopenie budú myši označované písmenami A, B, C, D, E, F. Tri z týchto myší sa náhodne vyberú na experimentálnu liečbu a ďalšie tri sa umiestnia do kontrolnej skupiny, v ktorej subjekty dostávajú placebo.
Ďalej náhodne vyberieme poradie, v ktorom sa myši vyberú na spustenie bludiska. Zaznamená sa čas strávený dokončením bludiska pre všetky myši a vypočíta sa priemer z každej skupiny.
Predpokladajme, že náš náhodný výber obsahuje myši A, C a E v experimentálnej skupine, zatiaľ čo ostatné myši v skupine placebo kontrolná skupina. Po zavedení liečby náhodne vyberieme poradie, v ktorom myši prechádzajú bludiskom.
Doby chodu pre každú z myší sú:
- Myš A spustí závod za 10 sekúnd
- Myš B spustí preteky za 12 sekúnd
- Myš C spustí preteky za 9 sekúnd
- Myš D spustí preteky za 11 sekúnd
- Myš E spustí závod za 11 sekúnd
- Myš F spustí závod za 13 sekúnd.
Priemerný čas na dokončenie bludiska u myší v experimentálnej skupine je 10 sekúnd. Priemerný čas na dokončenie bludiska v kontrolnej skupine je 12 sekúnd.
Mohli by sme položiť pár otázok. Je liečba skutočne dôvodom pre rýchlejší priemerný čas? Alebo sme mali len šťastie pri výbere kontrolnej a experimentálnej skupiny? Liečba pravdepodobne nemala žiadny účinok a náhodne sme vybrali pomalšie myši, ktoré dostali placebo, a rýchlejšie myši, ktoré dostali liečbu. Na tieto otázky odpovie permutačný test.
hypotézy
Hypotézy nášho permutačného testu sú:
- nulová hypotéza je vyhlásenie o neúčinnosti. Pre tento špecifický test máme H0: Medzi liečenými skupinami nie je žiadny rozdiel. Priemerný čas na spustenie bludiska pre všetky myši bez liečby je rovnaký ako priemerný čas pre všetky myši s liečením.
- Alternatívnou hypotézou je to, čo sa snažíme dokázať v prospech dôkazov. V tomto prípade by sme mali H: Priemerný čas pre všetky myši, ktoré boli ošetrené, bude rýchlejší ako priemerný čas pre všetky myši bez liečby.
permutácie
Existuje šesť myší a v experimentálnej skupine sú tri miesta. To znamená, že počet možných experimentálnych skupín je daný počtom kombinácií C (6,3) = 6! / (3! 3!) = 20. Zostávajúci jednotlivci by boli súčasťou kontrolnej skupiny. Existuje teda 20 rôznych spôsobov náhodného výberu jednotlivcov do našich dvoch skupín.
Priradenie A, C a E k experimentálnej skupine sa uskutočnilo náhodne. Pretože existuje 20 takýchto konfigurácií, špecifická konfigurácia s A, C a E v experimentálnej skupine má pravdepodobnosť výskytu 1/20 = 5%.
V našej štúdii musíme určiť všetkých 20 konfigurácií experimentálnej skupiny jednotlivcov.
- Experimentálna skupina: ABB a kontrolná skupina: DEF
- Experimentálna skupina: ABB a kontrolná skupina: CF
- Experimentálna skupina: A B E a kontrolná skupina: C DF
- Experimentálna skupina: ABB a kontrolná skupina: C E
- Experimentálna skupina: A C D a kontrolná skupina: B EF
- Experimentálna skupina: A C E a kontrolná skupina: B D F
- Experimentálna skupina: A C F a kontrolná skupina: BD E
- Experimentálna skupina: AD a kontrolná skupina: B C F
- Experimentálna skupina: ADF a kontrolná skupina: B C E
- Experimentálna skupina: AEF a kontrolná skupina: B C D
- Experimentálna skupina: B C D a kontrolná skupina: AEF
- Experimentálna skupina: B C E a kontrolná skupina: AD F
- Experimentálna skupina: B C F a kontrolná skupina: AD
- Experimentálna skupina: B D E a kontrolná skupina: A C F
- Experimentálna skupina: B D F a kontrolná skupina: A C E
- Experimentálna skupina: BEF a kontrolná skupina: A C D
- Experimentálna skupina: CO a kontrolná skupina: ABB
- Experimentálna skupina: CHF a kontrolná skupina: AB
- Experimentálna skupina: KF a kontrolná skupina: ABD
- Experimentálna skupina: DEF a kontrolná skupina: AB
Potom sa pozrieme na každú konfiguráciu experimentálnych a kontrolných skupín. Vypočítame priemer pre každú z 20 permutácií vo vyššie uvedenom zozname. Napríklad pre prvé, A, B a C majú časy 10, 12 a 9, v tomto poradí. Priemer z týchto troch čísiel je 10 333. Aj v tejto prvej permutácii majú D, E a F časy 11, 11 a 13. To má v priemere 11,6666.
Po výpočte priemer každej skupiny, vypočítame rozdiel medzi týmito prostriedkami. Každá z nasledujúcich odpovedí rozdielu medzi experimentálnymi a kontrolnými skupinami, ktoré boli uvedené vyššie.
- Placebo - ošetrenie = 1,333333333 sekúnd
- Placebo - ošetrenie = 0 sekúnd
- Placebo - ošetrenie = 0 sekúnd
- Placebo - ošetrenie = -1,333333333 sekúnd
- Placebo - ošetrenie = 2 sekundy
- Placebo - ošetrenie = 2 sekundy
- Placebo - ošetrenie = 0,6666666767 sekúnd
- Placebo - ošetrenie = 0,6666666767 sekúnd
- Placebo - ošetrenie = -0,666666667 sekúnd
- Placebo - ošetrenie = -0,666666667 sekúnd
- Placebo - ošetrenie = 0,6666666767 sekúnd
- Placebo - ošetrenie = 0,6666666767 sekúnd
- Placebo - ošetrenie = -0,666666667 sekúnd
- Placebo - ošetrenie = -0,666666667 sekúnd
- Placebo - ošetrenie = -2 sekundy
- Placebo - ošetrenie = -2 sekundy
- Placebo - ošetrenie = 1,333333333 sekúnd
- Placebo - ošetrenie = 0 sekúnd
- Placebo - ošetrenie = 0 sekúnd
- Placebo - ošetrenie = -1,333333333 sekúnd
P-hodnota
Teraz zoradíme rozdiely medzi prostriedkami z každej skupiny, ktoré sme si všimli vyššie. Tiež uvádzame percento našich 20 rôznych konfigurácií, ktoré sú zastúpené každým rozdielom v prostriedkoch. Napríklad štyri z 20 nemali žiadny rozdiel medzi prostriedkami kontrolnej a liečenej skupiny. To predstavuje 20% z 20 uvedených konfigurácií.
- -2 za 10%
- -1,33 pre 10%
- -0,667 na 20%
- 0 pre 20%
- 0,677 pre 20%
- 1,33 za 10%
- 2 pre 10%.
Tu porovnávame tento záznam s naším pozorovaným výsledkom. Výsledkom náhodného výberu myší pre liečené a kontrolné skupiny bol priemerný rozdiel 2 sekundy. Vidíme tiež, že tento rozdiel zodpovedá 10% všetkých možných vzoriek. Výsledkom je, že pre túto štúdiu máme a p-hodnota 10%.