Čo sú rezíduá?

click fraud protection

Lineárna regresia je štatistický nástroj, ktorý určuje, nakoľko priamka vyhovuje množine párové dáta. Rovná čiara, ktorá najlepšie vyhovuje týmto údajom, sa nazýva regresná čiara najmenších štvorcov. Tento riadok sa dá použiť rôznymi spôsobmi. Jedným z týchto použití je odhadnúť hodnotu premennej odozvy pre danú hodnotu vysvetľujúcej premennej. S touto myšlienkou súvisí myšlienka zvyšku.

(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)

Na výpočet zvyšku v bodoch X = 5, odčítame predpokladanú hodnotu od našej pozorovanej hodnoty. Od y súradnica nášho údajového bodu bola 9, čo dáva zvyšok 9 - 10 = -1.

Existuje niekoľko použití zvyškov. Jedným z použití je pomôcť nám určiť, či máme súbor údajov, ktorý má celkový lineárny trend, alebo či by sme mali zvážiť iný model. Dôvodom je to, že zvyšky pomáhajú zosilniť akýkoľvek nelineárny obrazec v našich údajoch. To, čo môže byť ťažké vidieť pri pohľade na rozptyl, možno ľahšie pozorovať skúmaním zvyškov a zodpovedajúcich zvyškových grafov.

Ďalším dôvodom na zváženie zvyškov je skontrolovať, či sú splnené podmienky na odvodenie pre lineárnu regresiu. Po overení lineárneho trendu (kontrolou zvyškov) skontrolujeme aj distribúciu zvyškov. Aby sme mohli vykonať regresnú inferenciu, chceme, aby zvyšky okolo našej regresnej línie boli približne normálne rozdelené.

instagram viewer
histogram alebo stemplot zvyškov pomôže overiť, či bola táto podmienka splnená.

instagram story viewer