v inferenciálna štatistika, intervaly spoľahlivosti pre podiely obyvateľstva spoliehať sa na štandardné normálne rozdelenie na určenie neznámych parametrov danej populácie vzhľadom na štatistickú vzorku populácie. Jedným z dôvodov je to, že pre vhodné veľkosti vzoriek štandardné normálne rozdelenie robí vynikajúcu prácu pri odhadovaní a binomické rozdelenie. To je pozoruhodné, pretože hoci prvé rozdelenie je nepretržité, druhé je diskrétne.
Pri vytváraní intervalov spoľahlivosti proporcií je potrebné riešiť niekoľko problémov. Jeden z nich sa týka toho, čo je známe ako „plus štyri“ interval spoľahlivosti, čo vedie k a neobjektívny odhadca. Tento odhad neznámeho podielu populácie však v niektorých situáciách dosahuje lepšie výsledky ako nezaujatí odhadcovia, najmä situácie, v ktorých nedochádza k žiadnym úspechom alebo neúspechom dát.
Vo väčšine prípadov je najlepším pokusom odhadnúť podiel obyvateľstva použiť zodpovedajúci podiel vzorky. Predpokladáme, že existuje populácia s neznámym podielom
p ich jednotlivcov, ktoré obsahujú určitú vlastnosť, potom vytvoríme jednoduchú náhodnú vzorku veľkosti n z tejto populácie. Z nich n jednotlivcov, spočítame ich počet Y ktoré majú črtu, na ktorú sme zvedaví. Teraz odhadujeme p pomocou našej vzorky. Pomer vzorky Y / N je nezaujatý odhadca p.Kedy použiť interval plus štyri spoľahlivosti
Ak použijeme interval plus štyri, upravíme odhad p. Urobíme to tak, že k celkovému počtu pozorovaní pridáme štyri, čím vysvetlíme frázu „plus štyri“. Tieto sme potom rozdelili štyri pozorovania medzi dvoma hypotetickými úspechmi a dvoma zlyhaniami, čo znamená, že k celkovému počtu úspechov. Konečným výsledkom je, že nahradíme každú inštanciu Y / N s (Y + 2)/(n + 4) a niekedy je táto časť označená ako p s vlnovkou nad ňou.
Pomer vzorky zvyčajne funguje veľmi dobre pri odhade podielu obyvateľstva. Existujú však situácie, keď musíme mierne odhadnúť náš odhadca. Štatistická prax a matematická teória ukazujú, že na dosiahnutie tohto cieľa je vhodná úprava intervalu plus štyri.
Jedna situácia, ktorá by nás mala prinútiť zvážiť interval plus štyri, je vzorka. Mnohokrát, vzhľadom na to, že podiel populácie je taký malý alebo taký veľký, je podiel vzorky tiež veľmi blízko 0 alebo veľmi blízko 1. V takomto prípade by sme mali zvážiť interval plus štyri.
Ďalším dôvodom na použitie intervalu plus štyri je to, že máme malú veľkosť vzorky. Interval plus štyri v tejto situácii poskytuje lepší odhad pre časť populácie ako použitie typického intervalu spoľahlivosti pre časť.
Pravidlá používania intervalu spoľahlivosti plus štyri
Interval spoľahlivosti plus štyri je takmer magický spôsob, ako presnejšie vypočítať inferenciálne štatistiky tým, že jednoducho pridáte štyri imaginárne pozorovania ľubovoľného súboru údajov, dvoch úspechov a dvoch zlyhaní, dokáže presnejšie predpovedať podiel súboru údajov, ktorý vyhovuje Parametre.
Interval spoľahlivosti plus štyri nie je vždy použiteľný na každý problém. Môže sa použiť, len keď interval spoľahlivosti súboru údajov je nad 90% a veľkosť vzorky populácie je najmenej 10. Súbor údajov však môže obsahovať ľubovoľný počet úspechov a neúspechov, ale funguje lepšie, keď v údajoch o danej populácii neexistujú žiadne úspechy alebo žiadne zlyhania.
Majte na pamäti, že na rozdiel od výpočtov pravidelnej štatistiky sa výpočty inferenčnej štatistiky spoliehajú na výber vzoriek, aby sa určili najpravdepodobnejšie výsledky v rámci populácie. Interval spoľahlivosti plus plus sa koriguje na väčší miera chyby, musí byť táto rezerva ešte zohľadnená, aby sa zabezpečilo čo najpresnejšie štatistické pozorovanie.