ANOVA (dispersijas analīze)

Daudzas reizes, pētot grupu, mēs patiešām salīdzinām divas populācijas. Atkarībā no parametrs Šīs grupas interesēm un nosacījumiem, ar kuriem mēs saskaramies, ir pieejami vairāki paņēmieni. Statistiskā secinājums procedūras, kas attiecas uz divu populāciju salīdzināšanu, parasti nevar piemērot trim vai vairāk populācijām. Lai pētītu vairāk nekā divas populācijas vienlaikus, mums ir nepieciešami dažāda veida statistikas rīki. Dispersijas analīzejeb ANOVA ir statistiskas iejaukšanās metode, kas ļauj mums tikt galā ar vairākām populācijām.

Līdzekļu salīdzinājums

Apskatīsim piemēru, lai redzētu, kādas problēmas rodas un kāpēc mums ir nepieciešama ANOVA. Pieņemsim, ka mēs cenšamies noteikt, vai nozīmē zaļo, sarkano, zilo un oranžo M&M konfekšu svars atšķiras. Mēs norādīsim vidējo svaru katrai no šīm populācijām, μ1, μ2, μ3 μ4 un attiecīgi. Mēs varam izmantot atbilstošo hipotēzes pārbaude vairākas reizes un pārbaudiet C (4,2) vai sešas dažādas nulle hipotēzes:

  • H0: μ1 = μ2 lai pārbaudītu, vai sarkano konfekšu vidējais iedzīvotāju svars atšķiras no zilo konfekšu vidējā svara.
  • instagram viewer
  • H0: μ2 = μ3 lai pārbaudītu, vai zilo konfekšu vidējais iedzīvotāju svars atšķiras no zaļo konfekšu vidējā svara.
  • H0: μ3 = μ4 lai pārbaudītu, vai zaļo konfekšu vidējais iedzīvotāju svars atšķiras no apelsīnu konfekšu vidējā svara.
  • H0: μ4 = μ1 lai pārbaudītu, vai apelsīnu konfekšu vidējais iedzīvotāju svars atšķiras no sarkano konfekšu vidējā svara.
  • H0: μ1 = μ3 lai pārbaudītu, vai sarkano konfekšu vidējais iedzīvotāju svars atšķiras no zaļo konfekšu vidējā svara.
  • H0: μ2 = μ4 lai pārbaudītu, vai zilo konfekšu vidējais iedzīvotāju svars atšķiras no apelsīnu konfekšu vidējā svara.

Šāda veida analīzei ir daudz problēmu. Mums būs seši lpp-vērtības. Pat ja mēs katrs varam pārbaudīt 95% pārliecības līmenis, mūsu pārliecība par kopējo procesu ir mazāka par šo, jo varbūtības reizinās: .95 x .95 x .95 x .95 x .95 x .95 ir aptuveni .74 jeb 74% ticamības pakāpe. Tādējādi ir palielinājusies I tipa kļūdas varbūtība.

Vairāk fundamentālā līmenī mēs nevaram salīdzināt šos četrus parametrus kopumā, salīdzinot tos divus vienlaikus. Sarkanā un zilā M & Ms vidējie rādītāji var būt nozīmīgi, un sarkanā svara vidējais svars ir relatīvi lielāks nekā zila vidējais svars. Tomēr, apsverot visu četru veidu konfekšu vidējo svaru, nozīmīgas atšķirības var nebūt.

Dispersijas analīze

Lai risinātu situācijas, kurās mums ir jāveic vairāki salīdzinājumi, mēs izmantojam ANOVA. Šis tests ļauj mums ņemt vērā vairāku populāciju parametrus vienlaikus, neiedziļinoties dažās problēmās, ar kurām mēs saskaramies hipotēžu testu veikšana uz diviem parametriem vienlaikus.

Lai veiktu ANOVA, izmantojot iepriekš minēto M&M piemēru, mēs pārbaudīsim nulles hipotēzi H01 = μ2 = μ3= μ4. Tas norāda, ka nav atšķirības starp sarkanā, zilā un zaļā M & Ms vidējo svaru. Alternatīva hipotēze ir tāda, ka pastāv neliela atšķirība starp sarkanā, zilā, zaļā un oranžā M & Ms vidējo svaru. Šī hipotēze patiešām ir vairāku apgalvojumu kombinācija Ha:

  • Sarkano konfekšu populācijas vidējais svars nav vienāds ar zilo konfekšu populācijas vidējo svaru, VAI
  • Zilo konfekšu vidējais iedzīvotāju svars nav vienāds ar zaļo konfekšu populācijas vidējo svaru, VAI
  • Zaļo konfekšu vidējais iedzīvotāju svars nav vienāds ar apelsīnu konfekšu vidējo masu, VAI
  • Zaļo konfekšu vidējais iedzīvotāju svars nav vienāds ar sarkano konfekšu vidējo masu, VAI
  • Zilo konfekšu vidējais iedzīvotāju svars nav vienāds ar apelsīnu konfekšu vidējo masu, VAI
  • Zilo konfekšu vidējais iedzīvotāju svars nav vienāds ar sarkano konfekšu populācijas vidējo svaru.

Šajā konkrētajā gadījumā, lai iegūtu mūsu p-vērtību, mēs izmantojam a varbūtības sadalījums pazīstams kā F-sadalījums. Aprēķinus ar ANOVA F testu var veikt ar rokām, bet parasti tos aprēķina ar statistikas programmatūru.

Vairāki salīdzinājumi

ANOVA no citiem statistikas paņēmieniem ir atšķirīgs tas, ka to izmanto, lai veiktu vairākus salīdzinājumus. Tas ir izplatīts visā statistikā, jo ir daudz reizes, kad mēs vēlamies salīdzināt vairāk nekā tikai divas grupas. Parasti kopējais tests liek domāt, ka pastāv kaut kādas atšķirības starp parametriem, kurus mēs pētām. Pēc tam mēs sekojam šai pārbaudei ar kādu citu analīzi, lai izlemtu, kurš parametrs atšķiras.

instagram story viewer