logo

Pa labi šķībs sadalījums: ko tas nozīmē?

feature_right_skewed_histogram

Studē statistiku? Tad, aprakstot datus, jūs, iespējams, esat dzirdējis frāzi “normāls sadalījums”. Bet kā ir ar frāzi “šķībi pareizi”? Kā izskatās pa labi sašķiebta histogramma? Un kas to izraisa?

java kā pārvērst virkni par int

Šajā rakstā mēs sniedzam histogrammu piemērus, kas novirzīti pa labi, un paskaidrosim, kā tās atšķiras no parastā sadalījuma grafikiem.

Funkcijas attēls: Monika vieta /Wikimedia Commons

Kas ir normāls sadalījums?

Pirms izskaidrojam, ko nozīmē, ja dati ir šķībi, apskatīsim normālā sadalījuma definīciju.

Ar normālu sadalījumu, diviem vai vairākiem mainīgajiem ir kopīga tieša saistība, lai izveidotu a simetriska datu kopa , uz kuras kreisā puse atspoguļo labo pusi. Šos grafikus sauc zvanu līknes to skaidri izteiktās, zvanam līdzīgas formas dēļ:

body_normal_distribution-300x215

Parastā sadalījuma grafikā vidējais (vidējais), mediāna un režīms ir vienādi . Visi šie punkti ir datu centrs vai diagrammas virsotne.

Ko nozīmē šķībs pa labi?

Lai gan normālais sadalījums ir viens no visizplatītākajiem sadalījuma veidiem, ne visas datu kopas atbilst šai pamata līknei. Citiem vārdiem sakot, dažas histogrammas ir sašķiebtas pa labi vai pa kreisi .

Ja sadalījums ir pa labi (pazīstams arī kā “pozitīvi šķībs” sadalījums), lielākā daļa datu atrodas diagrammas pīķa labajā vai pozitīvajā pusē. Tādējādi histogramma ir sašķiebusies tā, ka tās labā puse (vai 'aste') ir garāka par kreiso pusi.

body_right_skewed_histogram

Pa labi sašķiebtas histogrammas piemērs.

Pa labi šķībajā histogrammā vidējais, mediāna un režīms ir atšķirīgi. Šajā gadījumā režīms ir histogrammas augstākais punkts, savukārt mediāna un vidējais atrodas pa labi no tā (vai vizuāli pa labi no pīķa). Pieraksti to vidējā griba vienmēr būt pa labi no mediānas .

body_skewed_right_left

Diagramma A ir sašķiebta pa labi, savukārt diagramma B ir šķība pa kreisi. Labi sašķiebtiem grafikiem vidējais vienmēr ir pa labi no režīma (t.i., maksimums). ( Asitgoes /Wikimedia Commons) )

Šīs funkcijas galu galā padara to grūti piešķirt tipisku vērtību jo pa labi šķībā grafikā nav skaidra centra punkta. Turpretim ar normālu sadalījumu, jo vidējais, mediāna un režīms ir vienādi un atrodas datu kopas centrā, varat viegli izmantot šo vērtību, lai precīzāk vispārinātu datus.

Kas izraisa pa labi sašķiebtu histogrammu?

Dati, kas novirzīti pa labi, parasti ir datu kopas apakšējās robežas rezultāts (turpretī dati, kas novirzīti pa kreisi, ir augstākas robežas rezultāts). Tātad, ja datu kopas apakšējās robežas ir ārkārtīgi zemas salīdzinājumā ar pārējiem datiem, tas izraisīs datu novirzes.

Vēl viens šķībuma cēlonis ir sākuma efekti . Piemēram, ja procedūrai sākotnēji ir daudz panākumu ilgā palaišanas periodā, tas var radīt pozitīvu datu novirzi. (Savukārt, palaišanas periods ar vairākām sākotnējām kļūmēm var negatīvi sagrozīt datus.)