Galveno komponentu analīze (PCA) un faktoru analīze (FA) ir statistikas metodes, ko izmanto datu samazināšanai vai struktūras noteikšanai. Šīs divas metodes tiek piemērotas vienam mainīgo kopumam, kad pētnieks ir ieinteresēts atklājot, kuri mainīgie komplektā veido saskaņotas apakškopas, kas ir relatīvi neatkarīgas no vienas cits. Mainīgos lielumus, kas savstarpēji korelē, bet lielākoties nav atkarīgi no citām mainīgo lielumu kopām, apvieno faktoros. Šie faktori ļauj apkopot mainīgo skaitu analīzē, apvienojot vairākus mainīgos vienā faktorā.
PCA vai FA īpašie mērķi ir apkopot PCA modeļus korelācijas starp novērotajiem mainīgajiem lieliem novērojamo mainīgo skaitu reducēt uz mazāku faktoru skaitu, lai iegūtu a regresijas vienādojums pamata procesam, izmantojot novērotos mainīgos, vai arī pārbaudīt teoriju par pamatā esošo procesu raksturu.
Piemērs
Teiksim, piemēram, pētnieks ir ieinteresēts studēt maģistrantu īpašības. Pētnieks aptaujā lielu skaitu maģistrantu par tādām personības īpašībām kā motivācija, intelektuālās spējas, mācību vēsture, ģimenes vēsture, veselība, fiziskās īpašības, utt. Katru no šīm jomām mēra ar vairākiem mainīgiem lielumiem. Pēc tam mainīgos lielumus individuāli ievada analīzē un pēta to korelācijas. Analīze atklāj korelācijas modeļus starp mainīgajiem, kas, domājams, atspoguļo pamatā esošos procesus, kas ietekmē maģistrantu uzvedību. Piemēram, vairāki intelektuālo spēju mēru mainīgie apvienojas ar dažiem mainīgajiem no zinātniskās vēstures mērījumiem, veidojot intelektu mērošu faktoru. Tāpat arī personības rādītāju mainīgie lielumi var būt apvienoti ar dažiem motivācijas un zinātniskajiem vēstures mēri, lai veidotu faktoru, kas mēra pakāpi, kurai students dod priekšroku patstāvīgam darbam - neatkarību faktors.
Galveno komponentu analīzes un faktoru analīzes posmi
Galveno komponentu analīzes un faktoru analīzes posmi ietver:
- Atlasiet un izmēriet mainīgo kopu.
- Sagatavojiet korelācijas matricu, lai veiktu vai nu PCA, vai FA.
- No korelācijas matricas izvelciet faktoru kopu.
- Nosakiet faktoru skaitu.
- Ja nepieciešams, pagrieziet faktorus, lai palielinātu interpretāciju.
- Interpretējiet rezultātus.
- Pārbaudiet koeficientu struktūru, nosakot faktoru konstruktīvo derīgumu.
Atšķirība starp galveno komponentu analīzi un faktoru analīzi
Galveno komponentu analīze un faktoru analīze ir līdzīgas, jo abas procedūras tiek izmantotas, lai vienkāršotu mainīgo kopas struktūru. Tomēr analīzes atšķiras vairākos nozīmīgos veidos:
- PCA komponentus aprēķina kā sākotnējo mainīgo lineāras kombinācijas. FA sākotnējie mainīgie tiek definēti kā koeficientu lineāras kombinācijas.
- PCA mērķis ir iekļaut tikpat lielu daļu no kopsummas dispersija mainīgajos lielumos. FA mērķis ir izskaidrot mainīgo kovariācijas vai korelācijas.
- PCA tiek izmantots, lai datus samazinātu mazākos komponentos. FA tiek izmantots, lai saprastu, kuras konstrukcijas ir datu pamatā.
Problēmas ar galveno komponentu analīzi un faktoru analīzi
Viena no PCA un FA problēmām ir tā, ka nav neviena kritērija, ar kuru varētu pārbaudīt risinājumu. Citās statistikas metodēs, piemēram, diskriminējošās funkcijas analīzē, loģistikas regresijā, profila analīzē un daudzfaktoru modelī dispersijas analīze, risinājums tiek vērtēts pēc tā, cik labi tas paredz dalību grupā. PCA un FA nav tāda ārēja kritērija, kā, piemēram, dalība grupā, lai pārbaudītu risinājumu.
Otrā PCA un FA problēma ir tā, ka pēc ekstrakcijas ir pieejams bezgalīgs rotāciju skaits, visi veido vienādu sākotnējo datu novirzes lielumu, bet ar koeficientu nedaudz definētu savādāk. Galīgo izvēli atstāj pētnieks, pamatojoties uz novērtējumu par tā interpretāciju un zinātnisko lietderību. Pētnieki bieži vien atšķiras pēc tā, kura izvēle ir labākā.
Trešā problēma ir tā, ka FA bieži tiek izmantota vāji iecerētu pētījumu “saglabāšanai”. Ja neviena cita statistikas procedūra nav piemērota vai piemērojama, datus var vismaz analizēt faktoros. Tas daudziem liek domāt, ka dažādas FA formas ir saistītas ar aplieto pētījumu.