Kas statistikā ir šķībs?

Daži datu izplatīšanas veidi, piemēram, zvanu līkne vai normāls sadalījums, ir simetriski. Tas nozīmē, ka sadalījums labajā un kreisajā pusē ir perfekti spoguļattēli viens otram. Ne katrs datu sadalījums ir simetrisks. Datu kopas, kas nav simetriskas, tiek uzskatītas par asimetriskām. Asimetriskā sadalījuma mērauklu sauc par šķībumu.

Vidējais, vidējais un režīms ir visi centra pasākumi datu kopas. Datu viltīgumu var noteikt pēc tā, kā šie daudzumi ir savstarpēji saistīti.

Slīpi pa labi

Dati, kas ir sašķiebti pa labi, ir ar garu asti, kas stiepjas pa labi. Alternatīvs veids, kā runāt par datu kopu, kas ir šķībi pa labi, ir pateikt, ka tā ir pozitīvi sagrozīta. Šajā situācijā vidējais un mediāna abi ir lielāki par režīmu. Parasti lielākai daļai datu, kas ir sašķiebti pa labi, vidējais rādītājs ir lielāks nekā vidējais. Kopumā par datu kopu, kas ir sašķiebta pa labi:

  • Vienmēr: nozīmē lielāku nekā režīms
  • Vienmēr: vidējā vērtība ir lielāka par režīmu
  • Lielāko daļu laika: vidējais lielāks nekā vidējais
instagram viewer

Slīpi pa kreisi

Situācija mainās, kad mēs strādājam ar datiem, kas ir sašķiebti pa kreisi. Dati, kas ir sašķiebti pa kreisi, ir ar garu asti, kas stiepjas pa kreisi. Alternatīvs veids, kā runāt par datu kopu, kas ir šķībi pa kreisi, ir pateikt, ka tā ir negatīvi sagrozīta. Šajā situācijā vidējais un vidējais rādītājs ir mazāks par režīmu. Parasti lielākoties laika dati, kas ir sašķiebti pa kreisi, vidējais rādītājs būs mazāks par vidējo. Kopumā par datu kopu, kas ir šķībi pa kreisi:

  • Vienmēr: nozīmē mazāk nekā režīms
  • Vienmēr: vidējā vērtība mazāka par režīmu
  • Lielāko daļu laika nozīmē mazāk nekā vidējo

Viltības mēri

Viena lieta ir aplūkot divas datu kopas un noteikt, ka viena ir simetriska, bet otra - asimetriska. Cits ir aplūkot divus asimetrisku datu kopus un teikt, ka viens ir vairāk šķībs nekā otrs. Var būt ļoti subjektīvi noteikt, kurš ir vairāk šķībs, vienkārši apskatot sadalījuma grafiku. Tāpēc ir veidi, kā skaitliski aprēķināt šķībuma lielumu.

Viens šķībuma mērs, ko sauc par Pīrsona pirmo šķībuma koeficientu, ir no režīma atņemt vidējo un pēc tam dalīt šo starpību ar standarta novirze no datiem. Starpības dalīšanas iemesls ir tāds, ka mums ir lielums bez dimensijas. Tas izskaidro, kāpēc datiem, kas ir sašķiebti pa labi, ir pozitīvs šķībs. Ja datu kopa ir šķībi pa labi, vidējais ir lielāks nekā režīms, un, atņemot režīmu no vidējā, tiek iegūts pozitīvs skaitlis. Līdzīgs arguments izskaidro, kāpēc kreisajā pusē esošajiem datiem ir negatīvs šķībs.

Pīrsona otrais šķībuma koeficients tiek izmantots arī, lai izmērītu datu kopas asimetriju. Šim daudzumam mēs atņemam režīmu no mediānas, reizinām šo skaitli ar trīs un tad dalām ar standarta novirzi.

Viltotu datu lietojumi

Viltoti dati rodas diezgan dabiski dažādās situācijās. Ienākumi ir šķībi pa labi, jo pat tikai daži cilvēki, kas nopelna miljoniem dolāru, var ievērojami ietekmēt vidējos rādītājus, un nav negatīvu ienākumu. Līdzīgi dati par produkta kalpošanas laiku, piemēram, spuldzes zīmolu, ir sašķiebti pa labi. Šeit mazākais, kāds kalpošanas laiks var būt, ir nulle, un ilgstošas ​​spuldzes sniegs pozitīvu datu šķībumu.

instagram story viewer