Bodový graf je typ grafu, ktorý sa používa na znázornenie spárované dáta. Vysvetľujúca premenná je vynesená pozdĺž horizontálnej osi a premenná odozvy je vynesená do grafu pozdĺž vertikálnej osi. Jedným z dôvodov použitia tohto typu grafu je hľadanie vzťahov medzi premennými.
Najzákladnejším vzorom, ktorý je potrebné vyhľadať v sérii spárovaných údajov, je priamka. Prostredníctvom ľubovoľných dvoch bodov môžeme nakresliť priamku. Ak sú v našom rozptylovom bode viac ako dva body, väčšinu času už nebudeme môcť nakresliť čiaru, ktorá prechádza každým bodom. Namiesto toho nakreslíme čiaru, ktorá prechádza uprostred bodov a zobrazuje celkový lineárny trend údajov.
Keď sa pozrieme na body v našom grafe a chceme týmito bodmi nakresliť čiaru, vzniká otázka. Ktorú čiaru by sme mali nakresliť? Existuje nekonečný počet čiar, ktoré by bolo možné nakresliť. Použitím našich očí samotných je zrejmé, že každý, kto sa pozerá na rozptyl, môže vytvoriť trochu inú líniu. Táto nejednoznačnosť je problém. Chceme mať dobre definovaný spôsob, ako môžu všetci získať tú istú líniu. Cieľom je získať matematicky presný opis toho, ktorá čiara by mala byť nakreslená. Najmenšie štvorce
regresná čiara je jedna takáto čiara cez naše dátové body.Najmenej štvorce
Názov čiary najmenších štvorcov vysvetľuje, čo robí. Začneme so zbierkou bodov so súradnicami od (Xja, yja). Každá priama čiara bude prechádzať medzi týmito bodmi a bude ísť nad alebo pod každý z nich. Vzdialenosť medzi týmito bodmi a čiarou môžeme vypočítať výberom hodnoty X a potom odpočítané pozorované y súradnice, ktoré zodpovedajú tomuto X z y súradnice našej linky.
Rôzne čiary prechádzajúce rovnakou množinou bodov by dávali odlišnú množinu vzdialeností. Chceme, aby tieto vzdialenosti boli čo najmenšie. Je tu však problém. Keďže naše vzdialenosti môžu byť buď kladné alebo záporné, súčet všetkých týchto vzdialeností sa navzájom zruší. Súčet vzdialeností sa vždy bude rovnať nule.
Riešením tohto problému je eliminácia všetkých záporných čísiel porovnaním vzdialeností medzi bodmi a čiarou. Takto získate zbierku nezáporných čísel. Cieľ, ktorý sme mali, nájsť najvýhodnejšiu líniu, je rovnaký, ako súčet týchto štvorcových vzdialeností čo najmenší. Tu prichádza na záchranu počet. Proces diferenciácie v kalkulu umožňuje minimalizovať súčet štvorcových vzdialeností od danej čiary. To vysvetľuje frázu „najmenších štvorcov“ v našom názve pre tento riadok.
Rad najvhodnejších
Pretože čiara najmenších štvorcov minimalizuje štvorcové vzdialenosti medzi čiarou a našimi bodmi, môžeme ju považovať za tú, ktorá najlepšie vyhovuje našim údajom. Preto je čiara najmenších štvorcov známa aj ako línia najlepšieho nasadenia. Zo všetkých možných čiar, ktoré by bolo možné nakresliť, je čiara najmenších štvorcov najbližšia množine údajov ako celku. Môže to znamenať, že nášmu riadku bude chýbať ktorýkoľvek z bodov v našej sade údajov.
Funkcie línie najmenších štvorcov
Existuje niekoľko funkcií, ktoré každá línia najmenších štvorcov vlastní. Prvá zaujímavá položka sa týka sklonu našej linky. Na svahu je napojenie na korelačný koeficient našich údajov. V skutočnosti je sklon čiary rovný r (sy/ sX). Tu s X označuje smerodajnú odchýlku X súradnice a s y štandardná odchýlka y súradnice našich údajov. Znamienko korelačného koeficientu priamo súvisí so znamením sklonu našej čiary najmenších štvorcov.
Ďalší znak čiary najmenších štvorcov sa týka bodu, ktorým prechádza. Kým y priesečník najmenších štvorcov nemusí byť zo štatistického hľadiska zaujímavý, existuje jeden bod. Čiara najmenších štvorcov prechádza stredom údajov. Tento stredný bod má X koordinovať to je Priemerný z X hodnoty a y súradnice, ktorá je strednou hodnotou y hodnôt.