Daudzas reizes pētot statistika ir svarīgi izveidot savienojumus starp dažādām tēmām. Mēs redzēsim tā piemēru, kurā regresijas līnijas slīpums ir tieši saistīts ar korelācijas koeficients. Tā kā abi šie jēdzieni ietver taisnas līnijas, ir tikai dabiski uzdot jautājumu: "Kā ir korelācijas koeficients un vismazākā kvadrātveida līnija saistīti? "
Pirmkārt, mēs apskatīsim fona attiecībā uz abām šīm tēmām.
Sīkāka informācija par korelāciju
Ir svarīgi atcerēties detaļas, kas attiecas uz korelācijas koeficientu, ko apzīmē ar r. Šī statistika tiek izmantota, kad esam izveidojuši pārus kvantitatīvie dati. Sākot no pāra dati, mēs varam meklēt tendences vispārējā datu izplatīšanā. Dažiem pārī savienotiem datiem ir lineāra vai taisna shēma. Bet praksē dati nekad neslīd tieši pa taisnu līniju.
Vairāki cilvēki skatās uz to pašu izkaisīt no pārī savienotiem datiem nebūtu vienisprātis par to, cik tuvu bija vispārējās lineārās tendences parādīšana. Galu galā mūsu kritēriji tam var būt nedaudz subjektīvi. Mūsu izmantotā skala var ietekmēt arī mūsu uztveri par datiem. Šo un vēl vairāk iemeslu dēļ mums ir vajadzīgs kaut kāds objektīvs pasākums, lai pateiktu, cik tuvu mūsu pāra dati ir lineāri. Korelācijas koeficients to sasniedz mums.
Daži pamata fakti par r ietver:
- Vērtība r svārstās starp jebkuru reālo skaitli no -1 līdz 1.
- Vērtības r tuvu 0 norāda, ka starp datiem ir maz vai nav lineāras attiecības.
- Vērtības r tuvu 1 nozīmē, ka starp datiem ir pozitīvas lineāras attiecības. Tas nozīmē, ka kā x palielina to y palielinās arī.
- Vērtības r tuvu -1 norāda, ka starp datiem ir negatīva lineāra sakarība. Tas nozīmē, ka kā x palielina to y samazinās.
Vismazāko kvadrātu līnijas slīpums
Iepriekšējā saraksta pēdējie divi elementi norāda mūs uz vispiemērotāko vismazāko kvadrātu līnijas slīpumu. Atgādiniet, ka līnijas slīpums ir mērījums, cik vienību tā iet uz augšu vai uz leju katrai vienībai, ko mēs pārvietojam pa labi. Dažreiz to izsaka kā līnijas pieaugumu, dalītu ar braucienu, vai izmaiņas y vērtības dalītas ar izmaiņām x vērtības.
Parasti taisnām līnijām ir pozitīvas, negatīvas vai nulles slīpnes. Ja mēs pārbaudītu mūsu vismazākās kvadrāta regresijas līnijas un salīdzinātu atbilstošās vērtības r, mēs pamanīsim, ka katru reizi, kad mūsu datiem ir a negatīvs korelācijas koeficients, regresijas līnijas slīpums ir negatīvs. Tāpat katru reizi, kad mums ir pozitīvs korelācijas koeficients, regresijas līnijas slīpums ir pozitīvs.
No šī novērojuma ir skaidri redzams, ka starp korelācijas koeficienta zīmi un vismazāko kvadrātu līnijas slīpumu noteikti ir saistība. Atliek izskaidrot, kāpēc tā ir taisnība.
Slīpuma formula
Iemesls saiknei starp vērtību r un vismazāko kvadrātu līnijas slīpums ir saistīts ar formulu, kas dod mums šīs līnijas slīpumu. Pārī savienotiem datiem (x, y) mēs apzīmējam standarta novirze no x dati pēc sx un standartnovirze y dati pēc sy.
Slīpuma formula a regresijas līnijas ir:
- a = r (sy/ sx)
Standarta novirzes aprēķināšana ietver nenegatīva skaitļa pozitīvās kvadrātsaknes ņemšanu. Tā rezultātā abām standarta novirzēm slīpuma formulā jābūt nenegatīvām. Ja pieņemsim, ka mūsu datos ir kaut kādas atšķirības, mēs varēsim neņemt vērā iespēju, ka kāda no šīm standarta novirzēm ir nulle. Tāpēc korelācijas koeficienta zīme būs tāda pati kā regresijas līnijas slīpuma zīme.