Čebiševa varbūtības nevienlīdzība

Čebiševa nevienlīdzība saka, ka vismaz 1-1 /K2 no parauga datu jābūt iekļautiem pozīcijā K standarta novirzes no vidējā (šeit K ir kāds pozitīvs reālais skaitlis lielāks par vienu).

Jebkura datu kopa, kas parasti tiek izplatīta vai ir a zvanu līkne, ir vairākas funkcijas. Viens no tiem attiecas uz datu izplatību attiecībā pret standarta noviržu skaitu no vidējā. Normālā sadalījumā mēs zinām, ka 68% datu ir viena standarta novirze no vidējā, 95% ir divi standarta novirzes no vidējā, un aptuveni 99% ir trīs standarta novirzēs no vidējā.

Bet, ja datu kopa nav sadalīta zvanu līknes formā, tad atšķirīga summa varētu būt vienas standartnovirzes robežās. Čebiševa nevienlīdzība sniedz iespēju uzzināt, kāda daļa datu ietilpst K standarta novirzes no vidējā jebkura datu kopa.

Fakti par nevienlīdzību

Mēs varam arī norādīt iepriekš minēto nevienlīdzību, aizstājot frāzi “dati no parauga” ar varbūtības sadalījums. Tas notiek tāpēc, ka Čebiševa nevienlīdzība izriet no varbūtības, kuru pēc tam var izmantot statistikā.

instagram viewer

Ir svarīgi atzīmēt, ka šī nevienlīdzība ir rezultāts, kas ir pierādīts matemātiski. Tas nav kā empīriskās attiecības starp vidējo un režīmu vai īkšķa likums kas savieno diapazonu un standartnovirzi.

Nevienlīdzības attēlojums

Lai ilustrētu nevienlīdzību, mēs aplūkosim tajā dažas vērtības K:

  • Priekš K = 2 mums ir 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Tātad Čebiševa nevienlīdzība saka, ka vismaz 75% no jebkura sadalījuma datu vērtībām jābūt vidējās vērtības divās standartnovirzēs.
  • Priekš K = 3 mums ir 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Tātad Čebiševa nevienlīdzība saka, ka vismaz 89% no jebkura sadalījuma datu vērtībām jāatrodas vidējās vērtības trīs standarta novirzēs.
  • Priekš K = 4 mums ir 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Tātad Čebiševa nevienlīdzība saka, ka vismaz 93,75% no jebkura sadalījuma datu vērtībām jābūt vidējās vērtības divās standarta novirzēs.

Piemērs

Pieņemsim, ka mēs esam paraugu ņemuši suņu svariem vietējā dzīvnieku patversmē un secinājuši, ka mūsu parauga vidējais lielums ir 20 mārciņas ar standarta novirzi 3 mārciņas. Izmantojot Čebiševa nevienlīdzību, mēs zinām, ka vismaz 75% suņu, no kuriem mēs izvēlējāmies, ir svars, kas ir divas standarta novirzes no vidējā. Divreiz lielāka par standarta novirzi dod 2 x 3 = 6. Atņemiet un pievienojiet to no vidējā 20. Tas stāsta, ka 75% suņu svara ir no 14 mārciņām līdz 26 mārciņām.

Nevienlīdzības izmantošana

Ja mēs zinām vairāk par izplatīšanu, ar kuru mēs strādājam, parasti mēs varam garantēt, ka vairāk datu ir noteikts skaits standarta noviržu no vidējā. Piemēram, ja mēs zinām, ka mums ir normāls sadalījums, tad 95% datu ir divas standarta novirzes no vidējā. Čebiševa nevienlīdzība saka, ka šajā situācijā mēs to zinām vismaz 75% datu ir divas standarta novirzes no vidējā. Kā mēs redzam šajā gadījumā, tas varētu būt daudz vairāk nekā šie 75%.

Nevienlīdzības vērtība ir tāda, ka tas dod mums “sliktāka gadījuma” scenāriju, kurā vienīgās lietas, ko mēs zinām par mūsu izlases datiem (vai varbūtības sadalījumu), ir vidējais un standarta novirze. Kad neko vairāk par mūsu datiem nezinām, Čebiševa nevienlīdzība sniedz zināmu papildu ieskatu datu kopas izkliedē.

Nevienlīdzības vēsture

Nevienlīdzība nosaukta pēc krievu matemātiķa Pafnutija Čebiševa vārda, kurš 1874. gadā pirmo reizi paziņoja par nevienlīdzību bez pierādījumiem. Desmit gadus vēlāk nevienlīdzību pierādīja Markovs savā Ph. disertācija. Sakarā ar atšķirībām krievu alfabēta attēlošanā angļu valodā, Čebiševs tiek saukts arī par Čebišefu.

instagram story viewer