Histogrammas klases: informācija un piemēri

click fraud protection

Patiešām nav noteikumu, cik nodarbību vajadzētu būt. Ir pāris lietas, kas jāņem vērā par nodarbību skaitu. Ja būtu tikai viena klase, visi dati ietilptu šajā klasē. Mūsu histogramma būtu vienkārši viens taisnstūris ar augstumu, ko norāda elementu skaits mūsu datu kopā. Tas nebūtu ļoti noderīgi vai noderīga histogramma.

Otrkārt, mums varētu būt daudz klašu. Tā rezultātā būtu daudz joslu, no kurām neviens, iespējams, nebūtu ļoti garš. Izmantojot šāda veida histogrammu, būtu ļoti grūti noteikt atšķirīgus raksturlielumus no datiem.

Lai pasargātu no šīm divām galējībām, mums ir īkšķa noteikums, kas jāizmanto, lai noteiktu histogrammas klašu skaitu. Ja mums ir salīdzinoši mazs datu kopums, mēs parasti izmantojam tikai apmēram piecas klases. Ja datu kopums ir salīdzinoši liels, tad mēs izmantojam apmēram 20 klases.

Atkal ļaujiet uzsvērt, ka tas ir īkšķa noteikums, nevis absolūts statistikas princips. Datu klašu skaitam var būt atšķirīgi iemesli. Tālāk mēs redzēsim tā piemēru.

Pirms apsveram dažus piemērus, mēs redzēsim, kā noteikt, kādas ir klases faktiski. Mēs sākam šo procesu, atrodot

instagram viewer
diapazons no mūsu datiem. Citiem vārdiem sakot, no lielākās datu vērtības mēs atņemam zemāko datu vērtību.

Kad datu kopa ir salīdzinoši maza, diapazonu dalām ar piecām. Rezultāts ir mūsu histogrammas klašu platums. Iespējams, ka šajā procesā būs jāveic daži noapaļojumi, kas nozīmē, ka kopējais nodarbību skaits var nebūt piecas.

Kad datu kopa ir salīdzinoši liela, diapazonu dalām ar 20. Tāpat kā iepriekš, šī dalīšanas problēma mums dod klases platumu mūsu histogrammai. Tāpat, kā mēs redzējām iepriekš, mūsu noapaļošana var izraisīt nedaudz vairāk vai nedaudz mazāk par 20 klasēm.

Nevienā no lieliem vai maziem datu kopas gadījumiem pirmās klases sākums sākas ar punktu, kas ir nedaudz mazāks par mazāko datu vērtību. Mums tas jādara tā, lai pirmā datu vērtība nonāk pirmajā klasē. Citas nākamās klases nosaka platums, kas tika iestatīts, sadalot diapazonu. Mēs zinām, ka atrodamies pēdējā klasē, kad mūsu klase satur augstāko datu vērtību.

Piemēram, mēs noteiksim atbilstošu klases platumu un klases datu kopai: 1.1, 1.9, 2.3, 3.0, 3.2, 4.1, 4.2, 4.4, 5.5, 5.5, 5.6, 5.7, 5.9, 6.2, 7.1, 7.9, 8.3, 9.0, 9.2, 11.1, 11.2, 14.4, 15.5, 15.5, 16.7, 18.9, 19.2.

Mēs redzam, ka mūsu komplektā ir 27 datu punkti. Šis ir salīdzinoši mazs komplekts, tāpēc diapazonu mēs dalīsim ar pieciem. Diapazons ir 19,2 - 1,1 = 18,1. Mēs dalām 18,1 / 5 = 3,62. Tas nozīmē, ka klases platums būtu 4. Mūsu mazākā datu vērtība ir 1,1, tāpēc pirmo klasi sākam vietā, kas ir mazāka par šo. Tā kā mūsu dati sastāv no pozitīviem skaitļiem, būtu jēga likt pirmajai klasei pāriet no 0 līdz 4.

Piemēram, pieņemsim, ka ir atbilžu variantu pārbaude ar 35 jautājumiem, un pārbaudījumu kārto 1000 vidusskolas studentu. Mēs vēlamies izveidot histogrammu, kurā parādīts studentu skaits, kuri pārbaudē ieguva noteiktus punktus. Mēs redzam, ka 35/5 = 7 un ka 35/20 = 1,75. Neskatoties uz īkšķa likumu, ar kuru mums var izvēlēties 2. vai 7. klases klases, kuras izmantot mūsu histogrammai, labāk var būt 1. platuma klases. Šīs nodarbības atbildīs katram jautājumam, uz kuru students pārbaudījumā atbildēja pareizi. Pirmais no tiem būtu centrēts uz 0, bet pēdējais - uz 35.

instagram story viewer