Bootstrapping ir statistikas paņēmiens, kas ietilpst plašākā paraugu ņemšanas pozīcijā. Šis paņēmiens ietver samērā vienkāršu procedūru, taču to atkārto tik daudzas reizes, ka tā ir ļoti atkarīga no datora aprēķiniem. Bootstrapping nodrošina metodi, kas nav ticamības intervāls, lai novērtētu populācijas parametru. Šķiet, ka sāknēšanas operācija darbojas kā maģija. Lasiet tālāk, lai uzzinātu, kā tas iegūst savu interesanto vārdu.
Bootstrapping skaidrojums
Viens mērķis secinošā statistika ir noteikt populācijas parametra vērtību. Parasti to tieši izmērīt ir pārāk dārgi vai pat neiespējami. Tātad mēs izmantojam statistiskā paraugu ņemšana. Mēs atlasām populāciju, izmērām šīs izlases statistiku un pēc tam izmantojam šo statistiku, lai kaut ko pateiktu par atbilstošais parametrs iedzīvotāju.
Piemēram, šokolādes fabrikā mēs varētu vēlēties garantēt, ka konfekšu batoniņiem ir īpaša nozīme nozīmē svars. Nav iespējams nosvērt katru saražoto konfekšu batoniņu, tāpēc mēs izmantojam paraugu ņemšanas paņēmienus, lai nejauši izvēlētos 100 konfekšu batoniņus. Mēs aprēķinām šo 100 konfekšu bāru vidējo vērtību un sakām, ka vidējais iedzīvotāju skaits ietilpst kļūdas robežās no tā, kas ir mūsu izlases vidējais.
Pieņemsim, ka dažus mēnešus vēlāk mēs vēlamies uzzināt ar lielāku precizitāti - vai mazāku par a kļūdas robeža - kāds bija konfekšu bāra vidējais svars dienā, kad paraugu ņēmām ražošanas līnijā. Mēs arī nevaram izmantot mūsdienu konfekšu batoniņus daudz mainīgo ir ienākuši attēlā (dažādas piena, cukura un kakao pupiņu partijas, dažādi atmosfēras apstākļi, dažādi darbinieki rindā utt.). Viss, kas mums ir pieejams no dienas, kad mums ir interese, ir 100 svari. Ja nebūtu laika mašīnu līdz šai dienai, šķiet, ka sākotnējā kļūdas robeža ir labākā, uz ko mēs varam cerēt.
Par laimi, mēs varam izmantot zābaku pacelšanas tehnika. Šajā situācijā mēs nejauši paraugs ar nomaiņu no 100 zināmajiem svariem. Pēc tam mēs to saucam par sāknēšanas paraugu. Tā kā mēs pieļaujam nomaiņu, šis sāknēšanas paraugs, visticamāk, nav identisks mūsu sākotnējam paraugam. Daži datu punkti var tikt dublēti, bet citi datu punkti no sākotnējiem 100 var tikt izlaisti sāknēšanas paraugā. Ar datora palīdzību salīdzinoši īsā laikā var izveidot tūkstošiem sāknēšanas paraugu.
Piemērs
Kā minēts, lai patiesi izmantotu sāknēšanas paņēmienus, mums jāizmanto dators. Šis skaitliskais piemērs palīdzēs parādīt, kā process darbojas. Ja mēs sākam ar 2., 4., 5., 6., 6. paraugu, tad visi šie ir iespējamie sāknēšanas paraugi:
- 2 ,5, 5, 6, 6
- 4, 5, 6, 6, 6
- 2, 2, 4, 5, 5
- 2, 2, 2, 4, 6
- 2, 2, 2, 2, 2
- 4,6, 6, 6, 6
Tehnikas vēsture
Bootstrap metodes ir salīdzinoši jaunas statistikas jomā. Pirmais lietojums tika publicēts Bredlija Efrona 1979. gada rakstā. Tā kā skaitļošanas jauda ir palielinājusies un kļūst lētāka, sāknēšanas paņēmieni ir kļuvuši arvien izplatītāki.
Kāpēc vārds Bootstrapping?
Nosaukums “bootstrapping” cēlies no frāzes “Lai paceltu sevi pie sava bagāžnieka”. Tas attiecas uz kaut ko prātīgu un neiespējamu. Izmēģiniet cik vien iespējams, jūs nevarat pacelt sevi gaisā, velkot zābaku ādas gabalus.
Ir kāda matemātiska teorija, kas attaisno sāknēšanas metodes. Tomēr, izmantojot bootstrapping, jūtaties kā jūs darāt neiespējamo. Lai arī nešķiet, ka jūs varētu uzlabot iedzīvotāju statistikas novērtējumu, atkal un atkal izmantojot to pašu paraugu, faktiski bootstrapping to var izdarīt.