Ievads starpkvartilu diapazonā

Starpkvartilu diapazons (IQR) ir atšķirība starp pirmo un trīskvarci. Tam ir šāda formula:

IQR = Q3 - Q1

Datu kopas mainīgumu var mērīt daudz. Gan diapazons un standarta novirze pastāstiet mums, cik izkliedēti ir mūsu dati. Šīs aprakstošās statistikas problēma ir tā, ka tie ir diezgan jutīgi pret novirzēm. Tādas datu kopas izplatības mērījums, kas ir izturīgāks pret novirzēm, ir starpkvartilu diapazons.

Starpkvartilu diapazona definīcija

Kā redzams iepriekš, starpkvartilu diapazons tiek veidots, aprēķinot citu statistiku. Pirms starpkvartilu diapazona noteikšanas vispirms jāzina pirmās ceturtās un trešās kvartiles vērtības. (Protams, pirmā un trešā kvartila ir atkarīga no mediānas vērtības).

Kad esam noteikuši pirmās un trešās kvartiles vērtības, starpkvartilu diapazonu ir ļoti viegli aprēķināt. Viss, kas mums jādara, ir atņemt pirmo kvartili no trešās kvartiles. Tas izskaidro termina starpkvartilu diapazona izmantošanu šai statistikai.

Piemērs

Lai redzētu starpkvartilu diapazona aprēķināšanas piemēru, mēs apsvērsim datu kopu: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9.

instagram viewer
piecu numuru kopsavilkums šim datu kopumam ir:

  • Vismaz 2
  • Pirmā ceturtdaļa 3.5
  • Mediāna no 6
  • Trešā ceturtdaļa no 8
  • Maksimums 9

Tādējādi mēs redzam, ka starpkvartilu diapazons ir 8 - 3,5 = 4,5.

Starpkvartilu diapazona nozīme

Diapazons ļauj mums novērtēt, cik visa mūsu datu kopa ir sadalīta. Starpkvartilu diapazons, kas mums norāda, cik tālu viens no otra atrodas pirmā un trešā kvartile ir, norāda, cik plaši ir vidējie 50% no mūsu datu kopas.

Izturība pret novirzēm

Starpkvartilu diapazona, nevis datu kopas izplatības mērīšanas diapazona izmantošanas galvenā priekšrocība ir tā, ka starpkvartilu diapazons nav jutīgs pret novirzēm. Lai to redzētu, mēs apskatīsim piemēru.

No iepriekšminētā datu kopuma starpkvartilu diapazons ir 3,5, diapazons ir 9 - 2 = 7 un standarta novirze ir 2,34. Ja augstāko 9 vērtību aizstājam ar galējo ārējo vērtību 100, tad standarta novirze kļūst par 27,37 un diapazons ir 98. Pat ja mums ir diezgan krasas šo vērtību nobīdes, pirmā un trešā kvartila netiek ietekmēta, un tādējādi starpkvartilu diapazons nemainās.

Starpkvartilu diapazona izmantošana

Starpkvartilu diapazonam ir ne tikai jutīgs datu kopas izplatības mērs, bet arī vēl viens svarīgs pielietojums. Tā kā tā ir izturīga pret novirzēm, starpkvartilu diapazons ir noderīgs, lai noteiktu, kad vērtība ir novirze.

starpkvartilu diapazona noteikums ir tas, kas mūs informē, vai mums ir viegls vai spēcīgs pārsvars. Lai meklētu novirzīšanos, mums jāraugās zem pirmās kvartiles vai virs trešās kvartiles. Cik tālu mums jāiet, ir atkarīgs no starpkvartilu diapazona vērtības.

instagram story viewer