Spárované údaje v štatistikách, často označované ako usporiadané páry, sa vzťahujú na dve premenné u jednotlivcov populácie, ktoré sú navzájom spojené, aby sa určila korelácia medzi nimi. Aby sa súbor údajov mohol považovať za spárované údaje, obidve tieto hodnoty údajov sa musia navzájom spojiť alebo prepojiť a nesmú sa posudzovať osobitne.
Myšlienka spárovaných údajov je v kontraste s obvyklým priradením jedného čísla ku každému údajovému bodu ako v inom kvantitatívne údaje nastavuje, že každý jednotlivý dátový bod je spojený s dvoma číslami, čím sa poskytuje graf, ktorý umožňuje štatistikom sledovať populáciu medzi týmito premennými.
Táto metóda spárovaných údajov sa používa, keď štúdia dúfa, že porovná dve premenné u jednotlivcov populácie, aby sa vyvodil určitý záver o pozorovanej korelácii. Pri pozorovaní týchto údajových bodov je dôležité poradie párovania, pretože prvé číslo je mierou jednej veci, zatiaľ čo druhé je mierou niečoho úplne iného.
Príklad spárovaných údajov
Ak chcete vidieť príklad spárovaných údajov, predpokladajme, že učiteľ počíta počet úloh zadaných jednotlivými študentmi zapnutý pre konkrétnu jednotku a potom spáruje toto číslo s percentom každého študenta na jednotkovej skúške. Páry sú nasledujúce:
- Jednotlivec, ktorý splnil 10 úloh, získal 95% zo svojho testu. (10, 95%)
- Jednotlivec, ktorý splnil 5 úloh, získal 80% zo svojho testu. (5, 80%)
- Jednotlivec, ktorý dokončil 9 úloh, získal 85% zo svojho testu. (9, 85%)
- Jednotlivec, ktorý splnil 2 úlohy, získal 50% zo svojho testu. (2, 50%)
- Jednotlivec, ktorý splnil 5 úloh, získal 60% zo svojho testu. (5, 60%)
- Jednotlivec, ktorý splnil 3 úlohy, získal 70% zo svojho testu. (3, 70%)
V každej z týchto množín spárovaných údajov vidíme, že počet priradení je vždy na prvom mieste objednaný pár, zatiaľ čo percento získané na teste je na druhom mieste, ako je vidieť v prvom prípade (10, 95%).
Štatistická analýza týchto údajov by sa mohla použiť aj na výpočet priemerného počtu domáce úlohy dokončené alebo priemerné skóre testu, môžu sa vyskytnúť ďalšie otázky dáta. V tomto prípade chce učiteľ vedieť, či existuje súvislosť medzi počtom domácich úloh zapnutý a výkon na teste, a učiteľ by musel údaje ponechať spárované, aby na to mohol odpovedať otázka.
Analýza spárovaných údajov
štatistické techniky z korelácia a regresia sa používajú na analýzu spárovaných údajov, kde korelačný koeficient kvantifikuje, ako úzko sú údaje pozdĺž priamky a zmeria silu lineárneho vzťahu.
Na druhej strane sa regresia používa pre niekoľko aplikácií vrátane určenia, ktorá línia sa najlepšie hodí pre náš súbor údajov. Tento riadok sa potom môže použiť na odhadovanie alebo predpovedanie y hodnoty pre hodnoty X ktoré neboli súčasťou nášho pôvodného súboru údajov.
Existuje špeciálny typ grafu, ktorý je zvlášť vhodný pre spárované údaje nazývané rozptyl. V tomto typ grafujedna súradnicová os predstavuje jedno množstvo spárovaných údajov, zatiaľ čo druhá súradnicová os predstavuje ďalšie množstvo spárovaných údajov.
Rozptyl pre vyššie uvedené údaje by znamenal, že os x znamená počet priradených obrátených úloh, zatiaľ čo os y bude znamenať skóre na jednotkovej skúške.