Iekšā statistika, ir daudz terminu, kas atšķir smalki. Viens piemērs tam ir atšķirība starp frekvence un relatīvā frekvence. Lai arī relatīvās frekvences ir daudz izmantojamas, jo īpaši tās ir saistītas ar relatīvās frekvences histogrammu. Šis ir diagrammas veids, kam ir savienojumi ar citām statistikas un matemātiskās statistikas tēmām.
Definīcija
Histogrammas ir statistiskas diagrammas, kas izskatās joslu diagrammas. Parasti termins histogramma tomēr ir rezervēts kvantitatīvs mainīgie. Histogrammas horizontālā ass ir skaitļu līnija, kurā ir klases vai vienāda garuma tvertnes. Šīs tvertnes ir skaitļu līnijas intervāli, kur dati var krist, un tie var sastāvēt no viena numura (parasti diskrēts datu kopas, kas ir salīdzinoši nelielas) vai vērtību diapazonu (lielākām diskrētām datu kopām un nepārtraukts dati).
Piemēram, mēs varētu būt ieinteresēti apsvērt punktu sadalījumu 50 klašu viktorīnā studentiem. Viens no iespējamiem veidiem, kā veidot tvertnes, būtu katram konteineram ar atšķirīgu atkritumu tvertni.
Histogrammas vertikālā ass apzīmē skaitli vai frekvenci, kādā datu vērtība rodas katrā no tvertnēm. Jo augstāka ir josla, jo vairāk datu vērtību ietilpst šajā atkritumu tvertņu vērtību diapazonā. Atgriezties pie mūsu piemēra, ja mums ir pieci studenti, kuri viktorīnā ieguva vairāk nekā 40 punktus, tad josla, kas atbilst atkritumu tvertnei no 40 līdz 50, būs piecu vienību augsta.
Frekvences histogrammas salīdzinājums
Relatīvās frekvences histogramma ir tipiskas frekvences histogrammas neliela modifikācija. Tā vietā, lai izmantotu vertikālo asi datu vērtību skaitam, kas ietilpst konkrētajā atkritumu tvertnē, mēs izmantojam šo asi, lai attēlotu kopējo datu vērtību daļu, kas ietilpst šajā tvertnē. Kopš 100% = 1, visiem stieņiem jābūt ar augstumu no 0 līdz 1. Turklāt visu joslu augstumam mūsu relatīvās frekvences histogrammā jābūt summai 1.
Tādējādi pašreizējā piemērā, kuru mēs apskatījām, pieņemsim, ka mūsu klasē ir 25 skolēni un pieci ir ieguvuši vairāk nekā 40 punktus. Tā vietā, lai šai tvertnei izveidotu piecu augstumu joslu, mums būtu josla ar augstumu 5/25 = 0,2.
Salīdzinot histogrammu ar relatīvās frekvences histogrammu, katrai ar vienām un tām pašām tvertnēm, mēs kaut ko pamanīsim. Histogrammu kopējā forma būs identiska. Relatīvās frekvences histogramma neuzsver kopējo skaitu katrā atkritumu tvertnē. Tā vietā šāda veida diagramma koncentrējas uz to, kā atkritumu vērtību skaits atkritumu tvertnē attiecas uz pārējām tvertnēm. Veids, kā tas parāda šo attiecību, ir procentos no kopējā datu vērtību skaita.
Varbūtības masu funkcijas
Mums var rasties jautājums, kāda jēga ir relatīvās frekvences histogrammas noteikšanā. Viena galvenā lietojumprogramma attiecas uz diskrētiem nejaušiem mainīgajiem, kur mūsu tvertņu platums ir viens un to centrā ir katrs negatīvs vesels skaitlis. Šajā gadījumā mēs varam definēt gabalu funkciju ar vērtībām, kas atbilst joslu vertikālajam augstumam mūsu relatīvās frekvences histogrammā.
Šāda veida funkciju sauc par varbūtības masas funkciju. Funkcijas šādā veidā konstruēšanas iemesls ir tāds, ka līknei, kuru definē funkcija, ir tieša saistība ar varbūtība. Laukums zem līknes no vērtībām a uz b ir varbūtība, ka nejaušajam mainīgajam ir vērtība no a uz b.
Saikne starp varbūtību un laukumu zem līknes ir tāda, kas atkārtoti parādās matemātiskajā statistikā. Vēl viens šāds savienojums ir varbūtības masas funkcijas izmantošana relatīvās frekvences histogrammas modelēšanai.