Dažreiz statistikā ir noderīgi redzēt izstrādātus problēmu piemērus. Šie piemēri var mums palīdzēt izdomāt līdzīgas problēmas. Šajā rakstā mēs apskatīsim secinošās statistikas veikšanas procesu attiecībā uz rezultātiem, kas saistīti ar diviem populācijas līdzekļiem. Mēs ne tikai redzēsim, kā vadīt a hipotēzes pārbaude par divu iedzīvotāju skaita atšķirību, mēs arī konstruēsim a ticamības intervāls par šo atšķirību. Metodes, kuras mēs izmantojam, dažreiz sauc par divu paraugu t testu un divu paraugu t ticamības intervālu.
Problēmas izklāsts
Pieņemsim, ka mēs vēlamies pārbaudīt skolas vecuma bērnu matemātiskās spējas. Viens no jautājumiem, kas mums varētu rasties, ir, ja augstākas pakāpes līmeņiem ir augstāki vidējie pārbaudes punkti.
Vienkāršam izlases veidam, kas sastāv no 27 trešās klases skolniekiem, tiek izsniegts matemātikas tests, viņu atbildes tiek vērtētas, un tiek atklāts, ka rezultātu vidējais vērtējums ir 75 punkti ar parauga standartnovirze no 3 punktiem.
Vienkāršam izlases veidam, kas sastāv no 20 piektās klases dalībniekiem, tiek veikts tas pats matemātikas tests, un viņu atbildes tiek vērtētas. Piekto klasētāju vidējais vērtējums ir 84 punkti ar parauga standartnovirzi 5 punkti.
Ņemot vērā šo scenāriju, mēs uzdodam šādus jautājumus:
- Vai izlases dati sniedz mums pierādījumus tam, ka visu piekto greideru populācijas vidējais testa rādītājs pārsniedz visu trešo greideru populācijas vidējo testa rezultātu?
- Kāds ir 95% ticamības intervāls vidējā testa rezultāta starpībai starp trešās un piektās pakāpes populācijām?
Nosacījumi un procedūra
Mums jāizvēlas, kuru procedūru izmantot. To darot, mums jāpārliecinās un jāpārbauda, vai ir ievēroti šīs procedūras nosacījumi. Mums tiek lūgts salīdzināt divus iedzīvotāju skaita veidus. Viena metožu kolekcija, ko var izmantot, ir divu paraugu t-procedūras.
Lai izmantotu šīs t-procedūras diviem paraugiem, mums jāpārliecinās, ka pastāv šādi nosacījumi:
- Mums ir divi vienkārši izlases paraugi no abām interesējošajām populācijām.
- Mūsu vienkāršie izlases paraugi nepārsniedz 5% no visiem iedzīvotājiem.
- Abi paraugi ir neatkarīgi viens no otra, un subjekti nesakrīt.
- Mainīgais parasti tiek sadalīts.
- Gan populācijas vidējais lielums, gan standartnovirze abām populācijām nav zināmas.
Mēs redzam, ka lielākā daļa šo nosacījumu ir izpildīti. Mums teica, ka mums ir vienkārši izlases paraugi. Iedzīvotāju skaits, kurus mēs pētām, ir liels, jo šajos līmeņos ir miljoniem studentu.
Nosacījums, kuru mēs nevaram automātiski pieņemt, ir tāds, ka pārbaudes rezultāti parasti tiek sadalīti. Tā kā mums ir pietiekami liels izlases lielums, mūsu t-procedūru robustumam mums nav obligāti jābūt mainīgajam, lai to normāli sadalītu.
Tā kā nosacījumi ir izpildīti, mēs veicam pāris sākotnējos aprēķinus.
Standarta kļūda
Standarta kļūda ir standartnovirzes novērtējums. Šai statistikai mēs pievienojam paraugu izlases dispersiju un pēc tam ņem kvadrātsakni. Tas dod formulu:
(s1 2 / n1 + s22 / n2)1/2
Izmantojot iepriekšminētās vērtības, mēs redzam, ka standarta kļūdas vērtība ir
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
Brīvības pakāpes
Mēs varam izmantot konservatīvu tuvinājumu brīvības pakāpes. Tas var par zemu novērtēt brīvības pakāpju skaitu, taču to ir daudz vieglāk aprēķināt, nekā izmantojot Welch formulu. Mēs izmantojam mazāko no diviem paraugu lielumiem un pēc tam no šī skaitļa atņemam vienu.
Mūsu piemērā mazākais no diviem paraugiem ir 20. Tas nozīmē, ka brīvības pakāpju skaits ir 20 - 1 = 19.
Hipotēzes pārbaude
Mēs vēlamies pārbaudīt hipotēzi, ka piekto klašu skolēnu vidējais pārbaudes punktu skaits ir lielāks nekā trešo klašu skolēnu vidējais vērtējums. Ļaujiet μ1 jābūt visu piekto greideru populācijas vidējam rādītājam. Līdzīgi mēs μ2 jābūt vidējam rādītājam visu trešo greideru populācijā.
Hipotēzes ir šādas:
- H0: μ1 - μ2 = 0
- Ha: μ1 - μ2 > 0
Pārbaudes statistika ir starpība starp izlases vidējo vērtību, kuru pēc tam dala ar standarta kļūdu. Tā kā populācijas standartnovirzes novērtēšanai mēs izmantojam parauga standartnovirzes, testa statistika no t-sadalījuma.
Pārbaudes statistikas vērtība ir (84 - 75) / 1,2583. Tas ir aptuveni 7.15.
Tagad mēs nosakām, kāda ir šīs hipotēzes testa p-vērtība. Mēs aplūkojam testa statistikas vērtību un to, kur tā atrodas uz t-sadalījuma ar 19 brīvības pakāpēm. Šim sadalījumam mums ir 4,2 x 10-7 kā mūsu p-vērtību. (Viens veids, kā to noteikt, ir izmantot funkciju T.DIST.RT programmā Excel.)
Tā kā mums ir tik maza p-vērtība, mēs noraidām nulles hipotēzi. Secinājums ir tāds, ka piekto greideru vidējais pārbaudes punktu skaits ir augstāks nekā trešo kategoriju pārbaudītāju vidējais vērtējums.
Ticamības intervāls
Tā kā esam noskaidrojuši, ka starp vidējiem rādītājiem ir atšķirība, tagad mēs nosakām ticamības intervālu starpībai starp šiem diviem vidējiem rādītājiem. Mums jau ir daudz no tā, kas mums vajadzīgs. Atšķirības ticamības intervālam ir jābūt gan novērtējumam, gan kļūdas robežai.
Aprēķināt divu vidējo starpību ir viegli aprēķināms. Mēs vienkārši atrodam atšķirību starp izlases līdzekļiem. Šī izlases vidējā starpība novērtē vidējo kopas starpību.
Saskaņā ar mūsu datiem atšķirība izlases vidē ir 84 - 75 = 9.
Kļūdas robežu ir nedaudz grūtāk aprēķināt. Lai to izdarītu, attiecīgā statistika ir jāreizina ar standarta kļūdu. Mums nepieciešamo statistiku var atrast, izmantojot tabulu vai statistikas programmatūru.
Atkal izmantojot konservatīvo tuvinājumu, mums ir 19 brīvības pakāpes. 95% ticamības intervālam mēs redzam, ka t* = 2.09. Mēs varētu izmantot T.INV funkcija Excel, lai aprēķinātu šo vērtību.
Tagad mēs visu saliekam kopā un redzam, ka mūsu kļūdas robeža ir 2,09 x 1,2583, kas ir aptuveni 2,63. Uzticamības intervāls ir 9 ± 2,63. Intervāls ir no 6,37 līdz 11,63 punktiem testā, kuru izvēlējās piektais un trešais greideris.