Jedným z cieľov štatistiky je zmysluplné usporiadanie údajov. Dvojsmerné tabuľky sú dôležitým spôsobom usporiadania konkrétneho typu párové dáta. Rovnako ako pri zostavovaní grafov alebo tabuliek v štatistike je veľmi dôležité poznať typy premenných, s ktorými pracujeme. Ak máme kvantitatívne údaje, potom graf ako a histogram alebo stonka a list by sa mal používať. Ak máme kategorické údaje, potom stĺpcový graf alebo koláčový graf je vhodné.
Pri práci so spárovanými údajmi musíme byť opatrní. Pre spárované kvantitatívne údaje existuje rozptyl, ale aký graf je tu pre spárované kategorický Dáta? Vždy, keď máme dve kategorické premenné, mali by sme použiť dvojsmernú tabuľku.
Opis dvojsmernej tabuľky
Najprv si pripomíname, že kategorické údaje sa týkajú vlastností alebo kategórií. Nie je kvantitatívny a nemá číselné hodnoty.
Dvojsmerná tabuľka obsahuje zoznam všetkých hodnôt alebo úrovní pre dve kategorické premenné. Všetky hodnoty jednej z premenných sú uvedené vo vertikálnom stĺpci. Hodnoty pre druhú premennú sú uvedené v horizontálnom riadku. Ak má prvá premenná
m hodnoty a druhá premenná má n hodnoty, potom bude celkom mn záznamy v tabuľke. Každá z týchto položiek zodpovedá konkrétnej hodnote pre každú z týchto dvoch premenných.V každom riadku a pozdĺž každého stĺpca sa položky sčítajú. Tieto súčty sú dôležité pri určovaní marginálneho a podmieneného rozdelenia. Tieto súčty sú tiež dôležité, keď robíme test nezávislosti na štvorci.
Príklad dvojsmernej tabuľky
Napríklad vezmeme do úvahy situáciu, keď sa pozrieme na niekoľko častí štatistického kurzu na univerzite. Chceme skonštruovať obojsmernú tabuľku, aby sme určili, aké rozdiely, pokiaľ vôbec existujú, sú medzi mužmi a ženami v kurze. Aby sme to dosiahli, počítame počet každej známky, ktorú získali členovia každého pohlavia.
Poznamenávame, že prvá kategorická premenná je premenná pohlavia a pri štúdiu mužov a žien existujú dve možné hodnoty. Druhou kategorickou premennou je premenná triedy písmen a existuje päť hodnôt, ktoré sú dané A, B, C, D a F. To znamená, že budeme mať obojsmernú tabuľku s 2 x 5 = 10 záznamov, plus ďalší riadok a ďalší stĺpec, ktorý bude potrebný na zostavenie súčtov riadkov a stĺpcov.
Naše vyšetrovanie ukazuje, že:
- 50 mužov získalo A, zatiaľ čo 60 žien získalo A.
- 60 mužov získalo B a 80 žien získalo B.
- 100 mužov získalo C a 50 žien získalo C.
- 40 mužov zarobilo D a 50 žien získalo D.
- 30 mužov získalo F a 20 žien získalo F.
Tieto informácie sú uvedené v nižšie uvedenej obojsmernej tabuľke. Súčet v každom riadku nám hovorí, koľko z každého druhu známky ste získali. Celkom v stĺpci sa uvádza počet mužov a počet žien.
Dôležitosť obojsmerných tabuliek
Obojstranné tabuľky pomáhajú organizovať naše údaje, keď máme dve kategorické premenné. Táto tabuľka nám môže pomôcť porovnávať dve rôzne skupiny v našich údajoch. Napríklad by sme mohli vziať do úvahy relatívnu výkonnosť mužov v kurze štatistiky oproti výkonnosti žien v kurze.
Ďalšie kroky
Po vytvorení obojsmernej tabuľky môže byť ďalším krokom štatistická analýza údajov. Môžeme sa opýtať, či premenné, ktoré sú v štúdii, sú na sebe nezávislé alebo nie. Na zodpovedanie tejto otázky môžeme použiť dvojitý štvorcový test.
Obojsmerná tabuľka pre známky a pohlavia
Muž | Žena | Celkom | |
50 | 60 | 110 | |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Celkom | 280 | 260 | 540 |