Skaits brīvības pakāpes divu kategorisko mainīgo neatkarībai tiek dota vienkārša formula: (r - 1)(c - 1). Šeit r ir rindu skaits un c ir kolonnu skaits divvirzienu galds no kategoriskā mainīgā vērtībām. Lasiet tālāk, lai uzzinātu vairāk par šo tēmu un saprastu, kāpēc šī formula dod pareizo skaitli.
Pamatinformācija
Viens solis daudzu procesā hipotēžu testi ir brīvības pakāpes skaita noteikšana. Šis skaitlis ir svarīgs, jo priekš varbūtības sadalījumi kas ietver sadalījumu saimi, piemēram, chi-kvadrāta sadalījums, grāda skaits brīvība precīzi norāda precīzu sadalījumu no ģimenes, kuru mums vajadzētu izmantot savā hipotēzē pārbaude.
Brīvības pakāpes norāda to brīvo izvēļu skaitu, kuras mēs varam izdarīt attiecīgajā situācijā. Viens no hipotēžu testiem, kas prasa mums noteikt brīvības pakāpes, ir: chi-kvadrāts Divu kategorisku mainīgo neatkarības pārbaude.
Neatkarības testi un divvirzienu tabulas
Chi-square neatkarības pārbaude liek mums izveidot divvirzienu tabulu, kas pazīstama arī kā ārkārtas tabula. Šāda veida galdiem ir
r rindas un c kolonnas, kas attēlo r viena kategoriskā mainīgā un c otra kategoriskā mainīgā līmeņi. Tādējādi, ja mēs neskaitīsim rindu un kolonnu, kurā mēs reģistrējam kopsummas, ir pavisam rc šūnas divvirzienu tabulā.Chi-kvadrāta neatkarības pārbaude ļauj mums pārbaudīt hipotēzi, ka kategorisks mainīgie ir neatkarīgi viens no otra. Kā mēs minēts iepriekš, r rindas un c kolonnas tabulā dod mums (r - 1)(c - 1) brīvības pakāpes. Bet var nebūt uzreiz skaidrs, kāpēc tas ir pareizais brīvības pakāpju skaits.
Brīvības pakāpju skaits
Lai uzzinātu, kāpēc (r - 1)(c - 1) ir pareizs skaitlis, mēs šo situāciju apskatīsim sīkāk. Pieņemsim, ka mēs zinām robežas kopsummas katram mūsu kategorisko mainīgo līmenim. Citiem vārdiem sakot, mēs zinām katras rindas kopsummu un katras kolonnas kopsummu. Pirmajai rindai ir c kolonnas mūsu tabulā, tāpēc ir c šūnas. Kad mēs zinām visu šo šūnu, izņemot vienu, vērtības, tāpēc, ka mēs zinām visu šūnu kopējo vērtību, tā ir vienkārša algebra problēma, lai noteiktu atlikušās šūnas vērtību. Ja mēs aizpildītu šīs tabulas ailes, mēs varētu iekļūt c - 1 no tiem brīvi, bet pēc tam atlikušo šūnu nosaka pēc rindas kopsummas. Tātad ir c - 1 brīvības pakāpe pirmajai rindai.
Mēs turpinām šādā veidā nākamo rindu, un ir atkal c - 1 brīvības pakāpe. Šis process turpinās, kamēr nonākam pie priekšpēdējās rindas. Katra no rindām, izņemot pēdējo, tiek pievienota c - 1 brīvības pakāpe pret kopējo. Tā kā mums ir tikai pēdējā rinda, tāpēc, ka mēs zinām kolonnu summu, mēs varam noteikt visus pēdējās rindas ierakstus. Tas dod mums r - 1 rindas ar c - 1 brīvības pakāpe katrā no tām, kopā (r - 1)(c - 1) brīvības pakāpes.
Piemērs
Mēs to redzam ar šādu piemēru. Pieņemsim, ka mums ir divvirzienu tabula ar diviem kategoriskiem mainīgajiem. Vienam mainīgajam ir trīs līmeņi, bet otram - divi. Turklāt pieņemsim, ka mēs zinām rindu un kolonnu kopsummu šai tabulai:
A līmenis | B līmenis | Kopā | |
1. līmenis | 100 | ||
2. līmenis | 200 | ||
3. līmenis | 300 | ||
Kopā | 200 | 400 | 600 |
Formula paredz, ka ir (3-1) (2-1) = 2 brīvības pakāpes. Mēs to redzam šādi. Pieņemsim, ka kreisās augšējās šūnas aizpildām ar numuru 80. Tas automātiski noteiks visu pirmo ierakstu rindu:
A līmenis | B līmenis | Kopā | |
1. līmenis | 80 | 20 | 100 |
2. līmenis | 200 | ||
3. līmenis | 300 | ||
Kopā | 200 | 400 | 600 |
Ja mēs zinām, ka otrajā rindā pirmais ieraksts ir 50, tad tiek aizpildīta pārējā tabula, jo mēs zinām katras rindas un kolonnas kopsummu:
A līmenis | B līmenis | Kopā | |
1. līmenis | 80 | 20 | 100 |
2. līmenis | 50 | 150 | 200 |
3. līmenis | 70 | 230 | 300 |
Kopā | 200 | 400 | 600 |
Tabula ir pilnībā aizpildīta, bet mums bija tikai divas izvēles iespējas. Kad šīs vērtības bija zināmas, pārējā tabula tika pilnībā noteikta.
Lai gan mums parasti nav jāzina, kāpēc ir tik daudz brīvības pakāpi, ir labi zināt, ka mēs patiešām piemērojam brīvības pakāpes jēdzienu tikai jaunā situācijā.