Koľko kalórií jedol každý z nás na raňajky? Ako ďaleko od domu dnes cestoval každý? Aké veľké je miesto, ktoré nazývame domov? Koľko ďalších ľudí to nazýva domov? Na pochopenie všetkých týchto informácií sú potrebné určité nástroje a spôsoby myslenia. Matematická veda nazývaná štatistika nám pomáha vyrovnať sa s týmto preťažením informáciami.
Štatistika je štúdia číselných informácií nazývaných údaje. Štatistici získavajú, organizujú a analyzujú údaje. Každá časť tohto procesu je tiež podrobne preskúmaná. Techniky štatistiky sa uplatňujú na množstvo ďalších oblastí vedomostí. Nižšie je uvedený úvod k niektorým hlavným témam celej štatistiky.
Obyvateľstvo a vzorky
Jednou z opakujúcich sa štatistík je, že sme schopní povedať niečo o veľkej skupine na základe štúdia relatívne malej časti tejto skupiny. Skupina ako celok je známa ako populácia. Časť skupiny, ktorú študujeme, je vzorka.
Ako príklad tohto možno predpokladať, že sme chceli poznať priemernú výšku ľudí žijúcich v Spojených štátoch. Mohli by sme sa pokúsiť zmerať viac ako 300 miliónov ľudí, ale bolo by to nemožné. Bolo by logistickou nočnou morou vykonávať merania takým spôsobom, aby nikto nevynechal a nikto sa nezapočítal dvakrát.
Kvôli nemožnej povahe merania každého v Spojených štátoch sme mohli namiesto toho použiť štatistiku. Namiesto toho, aby sme našli výšky všetkých obyvateľov, berieme a štatistická vzorka z niekoľkých tisíc. Ak sme vzorkovali populáciu správne, priemerná výška vzorky bude veľmi blízko priemernej výške populácie.
Získavajú sa údaje
Na vyvodenie dobrých záverov potrebujeme dobré údaje, s ktorými by sme mohli pracovať. Spôsob, akým vzorkujeme populáciu na získanie týchto údajov, by sa mal vždy preskúmať. Aký druh vzorky používame, závisí od otázky, ktorú sa pýtame na obyvateľstvo. Najbežnejšie používané vzorky sú:
- Jednoduché Náhodné
- vrstevnatej
- klastrov
Rovnako dôležité je vedieť, ako sa vykonáva meranie vzorky. Ak sa chceme vrátiť k vyššie uvedenému príkladu, ako získame výšky osôb v našej vzorke?
- Umožňujeme ľuďom, aby na dotazníku uviedli svoju vlastnú výšku?
- Meria niekoľko výskumníkov v celej krajine rôznych ľudí a oznamuje ich výsledky?
- Meria jeden výskumný pracovník všetkých vo vzorke rovnakým opatrením pásky?
Každý z týchto spôsobov získavania údajov má svoje výhody a nevýhody. Každý, kto použije údaje z tejto štúdie, bude chcieť vedieť, ako sa získal.
Usporiadanie údajov
Niekedy existuje veľké množstvo údajov a môžeme sa doslova stratiť vo všetkých detailoch. Je ťažké vidieť les pre stromy. Z tohto dôvodu je dôležité, aby boli naše údaje dobre usporiadané. Starostlivá organizácia a grafické displeje údajov nám pomáhajú spoznať vzorce a trendy predtým, ako skutočne vykonáme akékoľvek výpočty.
Pretože spôsob, akým graficky prezentujeme naše údaje, závisí od rôznych faktorov. Bežné grafy sú:
- Výsečové grafy alebo kruhové grafy
- Stĺpcové alebo paretografy
- bodových
- Časové grafy
- Stonky a listy
- Boxové a fúzy grafy
Okrem týchto dobre známych grafov sa používajú aj iné špecializované situácie.
Deskriptívna štatistika
Jeden spôsob, ako analyzovať údaje, sa nazýva popisná štatistika. Cieľom je vypočítať množstvá, ktoré popisujú naše údaje. Čísla nazývané priemer, medián a režim sa všetky používajú na označenie priemerný alebo stred údajov. Rozsah a štandardná odchýlka sa používajú na vyjadrenie toho, ako sú údaje rozložené. Zložitejšie techniky, ako napr korelácia a regresia popisuje dáta, ktoré sú spárované.
Inferenčná štatistika
Keď začneme vzorkou a potom sa pokúsime odvodiť niečo o populácii, používame inferenciálna štatistika. Pri práci s touto oblasťou štatistiky je téma testovanie hypotéz Vyvstáva. Tu vidíme vedecký charakter predmetu štatistiky, keďže uvádzame hypotézu, ktorú potom použijeme štatistické nástroje s našou vzorkou na určenie pravdepodobnosti, že musíme hypotézu alebo hypotézu zamietnuť nie. Toto vysvetlenie je skutočne iba poškriabaním povrchu tejto veľmi užitočnej časti štatistík.
Aplikácia štatistík
Nie je prehnané tvrdiť, že štatistické nástroje využíva takmer každá oblasť vedeckého výskumu. Tu je niekoľko oblastí, ktoré sa veľmi spoliehajú na štatistiku:
- Psychológia
- ekonómie
- Medicína
- reklama
- demografia
Základy štatistiky
Hoci niektorí myslia na štatistiku ako na odvetvie matematiky, je lepšie myslieť na ňu ako na disciplínu založenú na matematike. Štatistika sa zostavuje najmä z oblasti matematiky známej ako pravdepodobnosť. Pravdepodobnosť nám dáva spôsob, ako určiť pravdepodobnosť výskytu udalosti. Dáva nám tiež spôsob, ako hovoriť o náhodnosti. Toto je kľúčom k štatistike, pretože typická vzorka sa musí náhodne vybrať z populácie.
Pravdepodobnosť bola prvýkrát študovaná v roku 1700 matematikmi ako napr pascal a Fermat. 1700s tiež označil začiatok štatistík. Štatistika naďalej rástla zo svojich pravdepodobných koreňov a v roku 1800 sa skutočne rozbehla. Dnes sa jeho teoretický rozsah naďalej rozširuje o tzv. Matematické štatistiky.