Kāda ir statistikas vidējā vērtība?

Tas ir jaunākās filmas filmas pusnakts seanss. Cilvēki ir ierindoti ārpus teātra, kas gaida iekļūšanu. Pieņemsim, ka jums tiek lūgts atrast līnijas centru. Kā jūs to izdarītu?

Ir pāris dažādi veidi, kā rīkoties šīs problēmas risināšana. Rezultātā jums būtu jāizdomā, cik cilvēku bija rindā, un pēc tam ņemtu pusi no šī skaita. Ja kopējais skaits ir vienāds, tad līnijas centrs būtu starp diviem cilvēkiem. Ja kopējais skaits ir nepāra, tad centrā būtu viena persona.

Jūs varat jautāt: "Kāds sakars līnijas centra atrašanai statistika? "Šī ideja par centra atrašanu ir tieši tā, kas tiek izmantota, aprēķinot datu kopas mediānu.

Kas ir mediāna?

Mediāna ir viens no trim galvenajiem veidiem, kā noteikt vidējo statistikas dati. To ir grūtāk aprēķināt nekā režīmu, bet tas nav tik darbietilpīgs kā vidējā aprēķināšana. Tas ir centrs līdzīgi kā cilvēku līnijas centra atrašana. Pēc datu vērtību uzskaitīšanas augošā secībā, vidējā vērtība ir datu vērtība ar tādu pašu datu vērtību skaitu virs tā un zem tā.

Pirmais gadījums: nepāra vērtību skaits

instagram viewer

Tiek pārbaudītas vienpadsmit baterijas, lai redzētu, cik ilgi tās kalpo. Viņu dzīves ilgums stundās ir norādīts ar skaitļiem 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Kāds ir vidējais dzīves ilgums? Tā kā ir nepāra skaits datu vērtību, tas atbilst līnijai ar nepāra cilvēku skaitu. Centrs būs vidējā vērtība.

Ir vienpadsmit datu vērtības, tāpēc sestā ir centrā. Tāpēc akumulatora vidējais darbības laiks ir sestā vērtība šajā sarakstā jeb 105 stundas. Ņemiet vērā, ka vidējā vērtība ir viena no datu vērtībām.

Otrais gadījums: pāra vērtību skaits

Nosver divdesmit kaķu. Viņu svari, izteikti mārciņās, ir izteikti ar 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Kāds ir vidējais kaķu svars? Tā kā ir pāra skaits datu vērtību, tas atbilst rindai ar pāra cilvēku skaitu. Centrs atrodas starp divām vidējām vērtībām.

Šajā gadījumā centrs atrodas starp desmito un vienpadsmito datu vērtību. Lai atrastu mediānu, mēs aprēķinām šo divu vērtību vidējo vērtību un iegūstam (7 + 8) / 2 = 7,5. Šeit mediāna nav viena no datu vērtībām.

Kādas citas lietas?

Vienīgās divas iespējas ir iegūt pāra vai nepāra skaitu datu vērtību. Tātad iepriekš minētie divi piemēri ir vienīgie iespējamie veidi, kā aprēķināt vidējo vērtību. Vai nu vidējā vērtība būs vidējā vērtība, vai vidējā būs vidējais no abiem vidējās vērtības. Parasti datu kopas ir daudz lielākas nekā tās, kuras mēs apskatījām iepriekš, taču mediānas atrašanas process ir tāds pats kā šie divi piemēri.

Neizturīgo ietekme

Vidējais un režīms ir ļoti jutīgi pret novirzēm. Tas nozīmē, ka novirzes klātbūtne dramatiski ietekmēs abus šos centra pasākumus. Viena no mediānas priekšrocībām ir tā, ka to tik ļoti neietekmē ārējs apstāklis.

Lai to redzētu, ņemiet vērā datu kopu 3, 4, 5, 5, 6. Vidējais rādītājs ir (3 + 4 + 5 + 5 + 6) / 5 = 4,6, un vidējā vērtība ir 5. Tagad saglabājiet to pašu datu kopu, bet pievienojiet vērtību 100: 3, 4, 5, 5, 6, 100. Skaidrs, ka 100 ir novirze, jo tā ir daudz lielāka par visām pārējām vērtībām. Jaunā komplekta vidējais lielums tagad ir (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. Tomēr jaunā komplekta vidējā vērtība ir 5. Lai gan

Mediānas piemērošana

Sakarā ar to, ko mēs redzējām iepriekš, vidējā vērtība ir vidējais rādītājs, ja dati satur novirzes. Kad tiek uzrādīti ienākumi, tipiska pieeja ir vidējo ienākumu uzrādīšana. Tas tiek darīts tāpēc, ka neliels skaits cilvēku ar ļoti augstiem ienākumiem vidējos ienākumus izkropļo (domā Bils Geitss un Oprah).