Lineārās regresijas statistika un analīze

Lineārā regresija ir statistikas paņēmiens, ko izmanto, lai uzzinātu vairāk par saistību starp neatkarīgu (prognozētāju) mainīgo un atkarīgo (kritēriju) mainīgo. Ja analīzē ir vairāk nekā viens neatkarīgs mainīgais, to sauc par vairāku lineāru regresiju. Kopumā regresija ļauj pētniekam uzdot vispārīgu jautājumu “Kāds ir labākais pareģotājs…?”

Piemēram, pieņemsim, ka mēs pētījām cēloņus aptaukošanās, ko mēra pēc ķermeņa masas indeksa (ĶMI). Jo īpaši mēs vēlējāmies noskaidrot, vai šie mainīgie ir nozīmīgi cilvēka ĶMI paredzētāji: ātrās ēdināšanas skaits nedēļā apēstie ēdieni, nedēļā noskatīto televīzijas stundu skaits, nedēļā pavadīto vingrinājumu skaits un vecāku ĶMI. Šīs analīzes laba metodika būtu lineārā regresija.

Regresijas vienādojums

Veicot regresijas analīzi ar vienu neatkarīgu mainīgo, regresijas vienādojums ir Y = a + b * X, kur Y ir atkarīgs mainīgais, X ir neatkarīgais mainīgais, a ir konstante (vai pārtveršana), un b ir regresijas līnijas slīpums. Piemēram, pieņemsim, ka GPA vislabāk prognozē ar regresijas vienādojumu 1 + 0,02 * IQ. Ja studentam būtu IQ 130, tad viņa vai viņas GPA būtu 3,6 (1 + 0,02 * 130 = 3,6).

instagram viewer

Veicot regresijas analīzi, kurā jums ir vairāk nekā viens neatkarīgs mainīgais, regresijas vienādojums ir Y = a + b1 * X1 + b2 * X2 +… + bp * Xp. Piemēram, ja mēs gribētu savā GPA analīzē iekļaut vairāk mainīgo, piemēram, motivācijas un pašdisciplīnas rādītājus, mēs to izmantotu vienādojums.

R-kvadrāts

R-kvadrāts, pazīstams arī kā noteikšanas koeficients, ir parasti izmantota statistika, lai novērtētu regresijas vienādojuma modeļa piemērotību. Tas ir, cik labi visi jūsu neatkarīgie mainīgie var prognozēt atkarīgo mainīgo? R-kvadrāta vērtība svārstās no 0,0 līdz 1,0, un to var reizināt ar 100, lai iegūtu procentus dispersija paskaidroja. Piemēram, atgriežoties pie mūsu GPA regresijas vienādojuma ar tikai vienu neatkarīgu mainīgo (IQ)... Teiksim, ka mūsu R-kvadrāts vienādojumam bija 0,4. Mēs to varētu interpretēt tādējādi, ka 40% no GPA atšķirībām izskaidro: IQ. Ja mēs pievienojam mūsu pārējos divus mainīgos lielumus (motivācija un pašdisciplīna) un R kvadrāts palielinās līdz 0,6, tas nozīmē, ka IQ, motivācija un pašdisciplīna kopā izskaidro 60% no GPA atšķirībām partitūras.

Regresijas analīzes parasti tiek veiktas, izmantojot statistisko programmatūru, piemēram, SPSS vai SAS, un tāpēc R kvadrāts tiek aprēķināts jums.

Regresijas koeficientu interpretēšana (b)

B koeficienti no iepriekšminētajiem vienādojumiem parāda attiecību stiprumu un virzienu starp neatkarīgajiem un atkarīgajiem mainīgajiem. Ja skatāmies uz GPA un IQ vienādojumu, 1 + 0,02 * 130 = 3,6, 0,02 ir mainīgā IQ regresijas koeficients. Tas mums saka, ka attiecību virziens ir pozitīvs, tā kā, palielinoties IQ, palielinās arī GPA. Ja vienādojums būtu 1 - 0,02 * 130 = Y, tas nozīmētu, ka attiecības starp IQ un GPA bija negatīvas.

Pieņēmumi

Ir vairāki pieņēmumi par datiem, kas jāizpilda, lai veiktu lineāru regresijas analīzi:

  • Linearitāte: Tiek pieņemts, ka saistība starp neatkarīgajiem un atkarīgajiem mainīgajiem ir lineāra. Lai gan šo pieņēmumu nekad nevar pilnībā apstiprināt, apskatot a izkaisīt jūsu mainīgo lielumu var palīdzēt izdarīt šo noteikšanu. Ja attiecībās ir izliekums, varat apsvērt mainīgo mainīšanu vai skaidri atļaut nelineārus komponentus.
  • Normalitāte: Tiek pieņemts, ka atlikumi no jūsu mainīgajiem lielumiem parasti tiek sadalīti. Tas ir, kļūdas Y (atkarīgā mainīgā) vērtības prognozēšanā tiek sadalītas tādā veidā, kas tuvojas normālajai līknei. Jūs varat paskatīties histogrammas vai parastās varbūtības diagrammas, lai pārbaudītu mainīgo lielumu sadalījumu un to atlikušās vērtības.
  • Neatkarība: Tiek pieņemts, ka Y vērtības prognozēšanas kļūdas visi ir savstarpēji neatkarīgi (nav savstarpēji saistīti).
  • Homoscedasticitāte: Tiek pieņemts, ka dispersija ap regresijas līniju ir vienāda visām neatkarīgo mainīgo vērtībām.

Avots

  • StatSoft: Elektroniskās statistikas mācību grāmata. (2011). http://www.statsoft.com/textbook/basic-statistics/#Crosstabulationb.