Lineārā regresija ir statistikas rīks, kas nosaka, cik labi taisna līnija atbilst pāra dati. Taisnu līniju, kas vislabāk atbilst šiem datiem, sauc par mazāko kvadrātu regresijas līniju. Šo līniju var izmantot vairākos veidos. Viens no šiem lietojumiem ir noteikt atbildes mainīgā lieluma vērtību noteiktā skaidrojošā mainīgā vērtībā. Šī ideja ir saistīta ar atlikumu.
(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)
Lai aprēķinātu atlikumu punktos x = 5, no novērotās vērtības mēs atņemam prognozēto vērtību. Kopš y mūsu datu punkta koordināta bija 9, tas dod atlikumu 9 - 10 = -1.
Atlikumus var izmantot vairākos veidos. Viens pielietojums ir palīdzēt mums noteikt, vai mums ir datu kopa, kurai ir vispārēja lineārā tendence, vai arī mums vajadzētu apsvērt citu modeli. Iemesls tam ir tas, ka atlikumi palīdz pastiprināt jebkuru nelineāru modeli mūsu datos. To, ko var būt grūti redzēt, aplūkojot izkliedes diagrammu, var vieglāk novērot, izpētot atlikumus un atbilstošo atlikuma grafiku.
Vēl viens iemesls izskatīt atlikumus ir pārbaudīt, vai ir izpildīti nosacījumi, lai izdarītu secinājumus par lineāro regresiju. Pēc lineāras tendences pārbaudes (pārbaudot atlikumus), mēs pārbaudām arī atlikumu sadalījumu. Lai varētu veikt regresijas secinājumus, mēs vēlamies, lai mūsu regresijas līnijas atlikumi būtu aptuveni normāli sadalīti. A
histogramma vai stemplot Pārpalikumi palīdzēs pārliecināties, ka šis nosacījums ir izpildīts.