Piemērotības testa piemērs

piemērotības testa chi-kvadrāta labestība ir noderīgi salīdzināt teorētiskais modelis novērotajiem datiem. Šis tests ir vispārīgāka chi-kvadrāta testa veids. Tāpat kā jebkurai matemātikas vai statistikas tēmai, var būt noderīgi strādāt, izmantojot piemēru, lai izprastu notiekošo, izmantojot piemēru par chi-kvadrāta piemērotības testu.

Apsveriet piena šokolādes standarta M & Ms paketi. Ir sešas dažādas krāsas: sarkana, oranža, dzeltena, zaļa, zila un brūna. Pieņemsim, ka mums ir interese par šo krāsu sadalījumu un jautājiet, vai visas sešas krāsas rodas vienādās proporcijās? Šis ir jautājums, uz kuru var atbildēt ar piemērotības pārbaudi.

Iestatīšana

Sākumā atzīmējam iestatījumu un to, kāpēc piemērotības pārbaude ir piemērota. Mūsu krāsu mainīgais ir kategorisks. Šim mainīgajam ir seši līmeņi, kas atbilst sešām iespējamām krāsām. Mēs pieņemsim, ka M & Ms, kuras mēs skaitām, būs vienkārša izlases veida izlase no visu M & Ms populācijas.

Nulles un alternatīvas hipotēzes

nulle un alternatīvas hipotēzes

instagram viewer
mūsu piemērotības testa pārbaude atspoguļo pieņēmumu, ko mēs darām par iedzīvotājiem. Tā kā mēs pārbaudām, vai krāsas rodas vienādās proporcijās, mūsu nulles hipotēze būs, ka visas krāsas rodas vienādās proporcijās. Formāli, ja lpp1 ir sarkano konfekšu īpatsvars iedzīvotāju skaitā, lpp2 ir apelsīnu konfekšu īpatsvars iedzīvotāju skaitā utt., tad hipotēze ir nulle lpp1 = lpp2 =... = lpp6 = 1/6.

Alternatīva hipotēze ir tāda, ka vismaz viena no populācijas proporcijām nav vienāda ar 1/6.

Faktiskais un paredzamais skaits

Faktiskais skaits ir konfekšu skaits katrai no sešām krāsām. Paredzamais skaits attiecas uz to, ko mēs gaidītu, ja nulles hipotēze būtu patiesa. Mēs ļausim n jābūt mūsu izlases lielumam. Paredzamais sarkano konfekšu skaits ir lpp1 n vai n/6. Faktiski šajā piemērā paredzamais konfekšu skaits katrai no sešām krāsām ir vienkārši n reizes lppi, vai n/6.

Či kvadrāta statistika par piemērotību

Tagad mēs aprēķināsim chi-square statistiku konkrētam piemēram. Pieņemsim, ka mums ir vienkāršs izlases veida 600 M&M konfekšu paraugs ar šādu sadalījumu:

  • 212 no konfektēm ir zilas.
  • 147 no konfektēm ir oranžas.
  • 103 konfektes ir zaļas.
  • 50 no konfektēm ir sarkanas.
  • 46 konfektes ir dzeltenas.
  • 42 no konfektēm ir brūnas.

Ja nulles hipotēze būtu patiesa, tad paredzamais katras krāsas skaits būtu (1/6) x 600 = 100. Tagad mēs to izmantojam, aprēķinot chi-square statistiku.

Mēs aprēķinām katras krāsas ieguldījumu mūsu statistikā. Katrs no tiem ir formā (aktuāls - paredzēts)2/Expected.:

  • Zilajam mums ir (212 - 100)2/100 = 125.44
  • Apelsīniem mums ir (147–100)2/100 = 22.09
  • Zaļajiem mums ir (103. – 100.)2/100 = 0.09
  • Sarkanajiem mums ir (50 - 100)2/100 = 25
  • Dzeltenai mums ir (46–100)2/100 = 29.16
  • Brūnā krāsā mums ir (42 - 100)2/100 = 33.64

Pēc tam mēs summējam visus šos ieguldījumus un nosakām, ka mūsu kvadrātiskā statistika ir 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42.

Brīvības pakāpes

Skaits brīvības pakāpes piemērotības testa pārbaude ir vienkārši par vienu mazāka nekā mūsu mainīgā līmeņu skaits. Tā kā bija sešas krāsas, mums ir 6 - 1 = 5 brīvības pakāpes.

Chi-square tabula un P-vērtība

Chi-kvadrāta statistika 235.42, ko mēs aprēķinājām, atbilst noteiktai vietai chi-kvadrāta sadalījumā ar piecām brīvības pakāpēm. Mums tagad ir nepieciešams p-vērtība, lai noteiktu testa statistikas iegūšanas varbūtību vismaz tikpat galēju kā 235.42, pieņemot, ka nulles hipotēze ir patiesa.

Šim aprēķinam var izmantot Microsoft Excel. Mēs atklājam, ka mūsu testa statistikai ar piecām brīvības pakāpēm ir p-vērtība 7,29 x 10-49. Šī ir ārkārtīgi maza p-vērtība.

Lēmuma noteikums

Mēs pieņemam lēmumu par to, vai noraidīt nulles hipotēzi, pamatojoties uz p-vērtības lielumu. Tā kā mums ir ļoti mazvērtīga p-vērtība, mēs noraidām nulles hipotēzi. Mēs secinām, ka M & Ms nav vienmērīgi sadalītas sešās dažādās krāsās. Pēcpārbaudes analīzi varētu izmantot, lai noteiktu ticamības intervālu vienas krāsas populācijas proporcijai.

instagram story viewer