Kā aprēķināt korelācijas koeficientu

Apskatot izkliedēto platību, ir daudz jautājumu, kas jāuzdod. Viens no visizplatītākajiem ir jautājums, vai taisna līnija tuvina datus. Lai palīdzētu atbildēt uz to, ir aprakstoša statistika, ko sauc par korelācijas koeficientu. Mēs redzēsim, kā aprēķināt šo statistiku.

Korelācijas koeficients

korelācijas koeficients, apzīmēts ar r, stāsta mums, cik cieši dati a izkaisīt nokrist pa taisnu līniju. Jo tuvāk absolūtā vērtība no r ir viens, jo labāk, ka datus apraksta ar lineāru vienādojumu. Ja r = 1 vai r = -1 tad datu kopa ir lieliski saskaņota. Datu kopas ar r tuvu nullei rāda maz vai nav tiešas attiecības.

Ilgu aprēķinu dēļ vislabāk ir aprēķināt r izmantojot kalkulatoru vai statistisko programmatūru. Tomēr vienmēr ir vērts censties uzzināt, ko aprēķina kalkulators. Turpmāk korelācijas koeficientu aprēķina galvenokārt ar rokām, izmantojot kalkulatoru parastām aritmētiskām darbībām.

Aprēķināšanas soļi r

Sākumā uzskaitīsim korelācijas koeficienta aprēķināšanas soļus. Dati, ar kuriem mēs strādājam, ir pāra dati, kuru pāri tiks apzīmēti ar (xi, yi).

instagram viewer
  1. Mēs sākam ar dažiem provizoriskiem aprēķiniem. Šajos aprēķinos izmantotie daudzumi tiks izmantoti nākamajos mūsu aprēķinu posmos r:
    1. Aprēķiniet x̄, nozīmē no visām pirmajām datu koordinātām xi.
    2. Aprēķiniet ȳ, visu otro datu koordinātu vidējo
    3. yi.
    4. Aprēķināt s x paraugs standarta novirze no visām pirmajām datu koordinātām xi.
    5. Aprēķināt s y visu otro datu koordinātu parauga standartnovirze yi.
  2. Izmantojiet formulu (zx)i = (xi - x̄) / s x un aprēķina standartizētu vērtību katram xi.
  3. Izmantojiet formulu (zy)i = (yi – ȳ) / s y un aprēķina standartizētu vērtību katram yi.
  4. Reiziniet atbilstošās standartizētās vērtības: (zx)i(zy)i
  5. Pievienojiet produktus no pēdējās darbības kopā.
  6. Sadaliet summu no iepriekšējā posma ar n - 1, kur n ir kopējais punktu skaits mūsu pāra datu kopā. Visa tā rezultāts ir korelācijas koeficients r.

Šis process nav grūts, un katrs solis ir diezgan ierasts, taču visu šo darbību apkopošana ir diezgan iesaistīta. Standarta novirzes aprēķins pats par sevi ir pietiekami garlaicīgs. Bet korelācijas koeficienta aprēķināšana ietver ne tikai divas standarta novirzes, bet arī daudzas citas operācijas.

Piemērs

Lai precīzi redzētu, kāda ir r tiek iegūts, mēs aplūkojam piemēru. Atkal ir svarīgi atzīmēt, ka praktiskiem pielietojumiem mēs gribētu aprēķināšanai izmantot mūsu kalkulatoru vai statistisko programmatūru r priekš mums.

Mēs sākam ar pāru datu uzskaitījumu: (1, 1), (2, 3), (4, 5), (5,7). Vidējā vērtība x vērtībām, vidējā vērtība 1, 2, 4 un 5 ir x̄ = 3. Mums ir arī tas, ka ȳ = 4. Standarta novirze

x vērtības ir sx = 1,83 un sy = 2.58. Zemāk esošajā tabulā ir apkopoti citi aprēķini, kas vajadzīgi r. Produktu summa labajā labajā kolonnā ir 2.969848. Tā kā kopā ir četri punkti un 4 - 1 = 3, produktu summu dalām ar 3. Tas dod mums korelācijas koeficientu r = 2.969848/3 = 0.989949.

Korelācijas koeficienta aprēķināšanas piemēra tabula

x y zx zy zxzy
1 1 -1.09544503 -1.161894958 1.272792057
2 3 -0.547722515 -0.387298319 0.212132009
4 5 0.547722515 0.387298319 0.212132009
5 7 1.09544503 1.161894958 1.272792057
instagram story viewer