dispersija ir mērījumu vērtība, ko izmanto, lai noskaidrotu, kā dati tiek izplatīti attiecībā uz datu kopas vidējo vai vidējo vērtību. To izmanto, lai noskaidrotu, kā sadalījuma dati tiek sadalīti attiecībā uz vidējo vai vidējo vērtību. Dispersijas definēšanai izmantotais simbols ir σ2. Tas ir standarta novirzes kvadrāts.
Statistikā tiek izmantoti divu veidu dispersijas,
- Parauga dispersija
- Iedzīvotāju dispersija
Populācijas dispersiju izmanto, lai noteiktu, kā katrs datu punkts konkrētajā populācijā svārstās vai tiek izkliedēts, savukārt izlases dispersiju izmanto, lai atrastu vidējo noviržu kvadrātā no vidējās vērtības.
Šajā rakstā mēs uzzināsim par Variance (izlase, populācija), to formulas, īpašības un citi detalizēti.
Satura rādītājs
- Kas ir dispersija?
- Variances veidi
- dispersijas simbols
- Izkliedes piemērs
- dispersijas formula
- Variācijas formulas paraugs
- Iedzīvotāju dispersijas formula
- Grupētu datu novirzes formula
- Negrupētu datu dispersijas formula
- Formula dispersijas aprēķināšanai
- Kā aprēķināt dispersiju?
- Izkliede un standarta novirze
- Variance un Kovariance
- Izkliedes īpašības
- Piemēri par dispersijas formulu
- Kopsavilkums – dispersija
- Bieži uzdotie jautājumi par dispersiju
Kas ir dispersija?
Mēs izmērām dažādas datu vērtības, un šīs vērtības tiek izmantotas dažādiem mērķiem. Datus var sniegt divu veidu grupētos datos vai negrupētos (diskrētos) datos. Ja dati tiek sniegti klašu intervālu veidā, tos sauc par grupētiem datiem, savukārt, ja dati tiek sniegti viena datu punkta veidā, tos sauc par diskrētu vai negrupētu datu punktu. Izkliede ir datu izkliedes mērs attiecībā uz datu vidējo vērtību. Tas mums norāda, kā dati tiek izkliedēti dotajā datu vērtībā. Mēs varam viegli aprēķināt izlases dispersiju un populācijas dispersiju gan grupētiem, gan negrupētiem datiem.
Izkliedes definīcija
dispersija ir statistikas mērs, kas kvantitatīvi nosaka datu punktu kopas izplatību vai izkliedi. Tas norāda, cik ļoti atsevišķie datu punkti datu kopā atšķiras no datu kopas vidējā (vidējā).
Variances veidi
Mēs varam definēt doto datu dispersiju divos veidos,
- Iedzīvotāju dispersija
- Parauga dispersija
Tagad uzzināsim par tiem sīkāk.
Iedzīvotāju dispersija
Populācijas dispersiju izmanto, lai noteiktu dotās populācijas izplatību. Iedzīvotāji ir definēti kā cilvēku grupa, un visi cilvēki šajā grupā ir daļa no iedzīvotājiem. Tas mums stāsta par to, kā grupas populācija mainās attiecībā pret vidējo iedzīvotāju skaitu.
Visi grupas dalībnieki ir pazīstami kā iedzīvotāji. Ja mēs vēlamies noskaidrot, kā katrs datu punkts konkrētajā populācijā atšķiras vai ir sadalīts, mēs izmantojam populācijas dispersiju. To izmanto, lai norādītu katra datu punkta attālumu kvadrātā no populācijas vidējā.
Parauga dispersija
Ja populācijas dati ir ļoti lieli, kļūst grūti aprēķināt datu kopas populācijas dispersiju. Tādā gadījumā mēs ņemam datu paraugu no dotās datu kopas un atrodam šīs datu kopas dispersiju, ko sauc par izlases dispersiju. Aprēķinot izlases vidējo vērtību, mēs noteikti aprēķinām izlases vidējo, t.i., izlases datu kopas vidējo, nevis populācijas vidējo. Mēs varam definēt izlases dispersiju kā vidējo lielumu no starpības starp izlases datu punktu un izlases vidējo vērtību kvadrātā.
dispersijas simbols
Atsaucoties uz populācijas dispersiju, dispersijas simbolu parasti apzīmē ar grieķu burtu sigma kvadrātā (σ²). Izlases dispersijai to bieži apzīmē ar s².
Variācijas piemērs
Mēs varam saprast dispersijas jēdzienu, izmantojot tālāk apskatīto piemēru.
Atrodiet datu populācijas dispersiju {4,6,8,10}
Risinājums:
Vidējā = (4+6+8+10)/4 = 7
4 (4-7)2 9 6 (6-7)2 1 8 (8-7)2 1 10 (10-7)2 9 Distance = (9+1+1+9)/4 = 20/4 = 5
Tādējādi datu dispersija ir 5
dispersijas formula
Datu kopas dispersiju apzīmē ar simbolu σ2. Iedzīvotāju datiem tās formula ir vienāda ar datu ierakstu atšķirību kvadrātā summu no vidējās vērtības, kas dalīta ar ierakstu skaitu. Parauga datiem mēs dalām skaitītāja vērtību ar starpību starp ierakstu skaitu un vienību.
Variācijas formulas paraugs
Ja datu kopa ir paraugs, dispersijas formula tiek dota ar:
lpp 2 = ∑ (x i – x̄) 2 /(n-1)
kur,
- x ir izlases datu kopas vidējais lielums
- n ir kopējais novērojumu skaits
Iedzīvotāju dispersijas formula
Ja mums ir iedzīvotāju datu kopa, formula tiek uzrakstīta šādi:
lpp 2 = ∑ (x i – x̄) 2 /n
kur,
- x ir iedzīvotāju datu kopas vidējais lielums
- n ir kopējais novērojumu skaits
Mēs varam arī aprēķināt dispersiju grupētajām un negrupētajām datu kopām. Dažādas dispersijas formulas ir,
java concat virknes
Grupētu datu novirzes formula
Grupētiem datiem dispersijas formula ir aplūkota tālāk,
Parauga dispersijas formula grupētiem datiem (σ 2 ) = ∑ f(m i – x̄) 2 /(n-1)
Populācijas dispersijas formula grupētiem datiem (lpp 2 ) = ∑ f(m i – x̄) 2 /n
kur,
- f ir katra intervāla biežums
- m i ir i viduspunktsthintervāls
- x ir grupēto datu vidējais lielums
Grupētiem datiem vidējo aprēķina kā
Vidējais = ∑ (f i x i ) / ∑ f i
Negrupētu datu dispersijas formula
Negrupētiem datiem dispersijas formula ir aplūkota tālāk,
- Negrupētu datu dispersijas formulas paraugs (lpp 2 ) = ∑ (x i – x̄) 2 /(n-1)
- Populācijas dispersijas formula negrupētiem datiem (lpp 2 ) = ∑ (x i – x̄) 2 /n
kur x ir grupēto datu vidējais lielums
Formula dispersijas aprēķināšanai
Formula, kas tiek izmantota novirzes aprēķināšanai, ir aplūkota zemāk esošajā attēlā,

Kā aprēķināt dispersiju?
Kopumā dispersija nozīmē populācijas standarta dispersiju. Dotās vērtību kopas dispersijas aprēķināšanas soļi ir šādi:
1. darbība: Aprēķiniet novērojuma vidējo vērtību, izmantojot formulu (vidējais = novērojumu summa/novērojumu skaits)
2. darbība: Aprēķiniet datu vērtību atšķirības kvadrātā no vidējās. (Datu vērtība — vidējā)2
3. darbība: Aprēķināt vidējo kvadrātā norādīto vērtību starpību, ko sauc par datu kopas dispersiju.
(Variance = atšķirību kvadrātā summa / novērojumu skaits)
Izkliede un standarta novirze
Variance un Standarta novirze abi ir centrālās tendences mēri, ko izmanto, lai pastāstītu mums par to, cik lielā mērā datu kopas vērtības atšķiras no datu kopas centrālās vai vidējās vērtības.
Jebkurai datu kopai pastāv noteikta saistība starp dispersiju un standarta novirzi.
Novirze = (standarta novirze) 2
Novirze tiek definēta kā standarta novirzes kvadrāts, t.i., jebkurai datu grupai ņemot standarta novirzes kvadrātu, mēs iegūstam šīs datu kopas dispersiju. dispersiju nosaka, izmantojot simbolu lpp 2 tā kā lpp tiek izmantots, lai definētu datu kopas standarta novirzi. Datu kopas dispersiju izsaka kvadrāta vienībās, savukārt datu kopas standartnovirzi izsaka vienībā, kas ir līdzīga datu kopas vidējai vērtībai.
Uzzināt vairāk: Izkliede un standarta novirze
Binomiālā sadalījuma dispersija
Binomiālais sadalījums ir diskrēts varbūtības sadalījums, kas parāda pozitīvo rezultātu skaitu binominālā eksperimentā, kas veikts n reižu skaitu. Binomiālā eksperimenta rezultāts ir 0 vai 1, t.i., pozitīvs vai negatīvs.
Binomiālā eksperimentā n izmēģinājumi un kur ir norādīta katra izmēģinājuma iespējamība lpp , tad binoma sadalījuma dispersiju uzrāda, izmantojot,
lpp 2 = np (1–p)
kur 'piem' ir definēts kā binoma sadalījuma vērtību vidējais lielums.
Puasona sadalījuma dispersija
Indes izplatīšana ir definēts kā diskrēts varbūtības sadalījums, ko izmanto, lai noteiktu varbūtību, ka “n” notikumu skaits notiks “x” laika periodā. Vidējais Puasona sadalījumā tiek definēts ar simbolu l.
Puasona sadalījumā dotās datu kopas vidējais lielums un dispersija ir vienādi. Puasona sadalījuma dispersiju uzrāda, izmantojot formulu,
lpp 2 = λ
Vienotā sadalījuma dispersija
Vienmērīgā sadalījumā varbūtības sadalījuma dati ir nepārtraukti. Šo eksperimentu rezultāts ir diapazonā starp noteiktu augšējo robežu un noteiktu apakšējo robežu, un tāpēc šos sadalījumus sauc arī par taisnstūrveida sadalījumiem. Ja augšējā robeža vai maksimālā robeža ir b un apakšējā robeža vai minimālā robeža ir a, tad vienmērīgā sadalījuma dispersiju aprēķina, izmantojot formulu,
lpp 2 = (1/12) (b–a) 2
Vienmērīgā sadalījuma vidējo vērtību uzrāda, izmantojot formulu,
Vidējais = (b + a) / 2
kur,
- b ir vienmērīgā sadalījuma augšējā robeža
- a ir vienmērīgā sadalījuma apakšējā robeža
Variance un Kovariance
Datu kopas dispersija nosaka visu datu kopas vērtību nepastāvību attiecībā pret datu kopas vidējo vērtību. Kovariance parāda, kā nejaušie mainīgie ir saistīti viens ar otru, un tas mums norāda, kā viena mainīgā izmaiņas ietekmē izmaiņas citos mainīgajos.
Kovariācija var būt pozitīva vai negatīva, pozitīvā kovariācija nozīmē, ka abi mainīgie virzās vienā virzienā attiecībā pret vidējo vērtību, savukārt negatīvā kovariācija nozīmē, ka abi mainīgie virzās pretējos virzienos attiecībā pret vidējo vērtību.
Diviem gadījuma lielumiem x un y, kur x ir atkarīgais mainīgais un y ir neatkarīgais mainīgais, kovariāciju aprēķina, izmantojot formulu, kas minēta tālāk pievienotajā attēlā.

Izkliedes īpašības
Variance tiek plaši izmantota matemātikā, statistikā un citās zinātnes nozarēs dažādiem mērķiem. Variancei ir dažādas īpašības, kuras plaši izmanto dažādu problēmu risināšanai. Dažas no dispersijas pamatīpašībām ir,
- Datu kopas dispersija ir nenegatīvs lielums, un dispersijas nulles vērtība nozīmē, ka visas datu kopas vērtības ir vienādas.
- Lielāka dispersijas vērtība norāda, ka visas datu kopas datu vērtības ir plaši izkliedētas, t.i., tās atrodas tālu no datu kopas vidējās vērtības.
- Mazāka dispersijas vērtība norāda, ka visas datu kopas datu vērtības ir tuvu viena otrai, t.i., tās ir ļoti tuvas no datu kopas vidējās vērtības.
Jebkurai konstantei “c”
- Var(x + c) = Var(x)
kur x ir nejaušs mainīgais
- Var(cx) = c2
kur x ir nejaušs mainīgais
Tāpat, ja a un b ir nemainīgā vērtība un x tad ir nejaušs mainīgais,
- Var(ax + b) = a2
Neatkarīgiem mainīgajiem x1, x2, x3…,xnmēs to zinām,
- Kur (x1+ x2+……+ xn) = Var(x1) + Kur (x2) +……..+Kur(xn)
Cilvēki arī lasa:
- Vidēji
- Režīms
- Atšķirība starp dispersiju un standarta novirzi
Variances formulas piemēri
1. piemērs. Aprēķiniet izlases datu dispersiju: 7, 11, 15, 19, 24.
Risinājums:
Mums ir dati: 7, 11, 15, 19, 24
Atrodiet datu vidējo vērtību.
x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15.2Izmantojot dispersijas formulu, mēs iegūstam,
lpp2= ∑ (xi– x̄)2/(n-1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5–1)
= 176,8/4
= 44,2
2. piemērs: Aprēķiniet novērojumu skaitu, ja datu dispersija ir 12 un datu kvadrātu atšķirību summa no vidējā ir 156.
Risinājums:
Mums ir,
(xi– x̄)2= 156
lpp2= 12
Izmantojot dispersijas formulu, mēs iegūstam,
lpp2= ∑ (xi– x̄)2/n
12 = 156/n
n = 156/12
n = 13
3. piemērs: Aprēķiniet dispersiju dotajiem datiem
| xi | fi |
|---|---|
| 10 | 1 |
| 4 | 3 |
| 6 | 5 |
| 8 | 1 |
Risinājums:
Vidējais (x̄) = ∑(fixi)/∑(fi)
mākslīgais neironu tīkls= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6n = ∑(fi) = 1+3+5+1 = 10
xi
fi
fixi
(xi– x̄)
(xi– x̄)2
fi(xi– x̄)2
10 1 10 4 16 16 4 3 12 -2 4 12 6 5 30 0 0 0 8 1 8 2 4 8 Tagad
lpp 2 = (∑ i n f i (x i – x̄) 2 /n)
= [(16 + 12 + 0 + 8)/10]
= 3,6Izkliede (σ2) = 3,6
4. piemērs. Atrodiet tālāk norādītās datu tabulas dispersiju
| Klase | Biežums |
|---|---|
| 0-10 | 3 |
| 10-20 | 6 |
| 20-30 | 4 |
| 30-40 | 2 |
| 40-50 | 1 |
Risinājums:
Klase
Sji
fi
f × Xi
Xi - μ
(Xi – μ)2
f×(Xi – μ)2
0-10
5
3
piecpadsmit
- piecpadsmit
225
675
10-20
piecpadsmit
6
90
-5
25
150
20-30
25
4
100
5
25
100
30-40
35
2
70
piecpadsmit
225
450
40-50
Četri
1
Četri
25
625
625
Kopā
16
320
2000. gads
Vidējais (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20lpp 2 = (∑ i n f i (x i – m) 2 /n)
= [(2000)/(16)]
= (125)Dotās datu kopas dispersija ir 125.
Kopsavilkums – dispersija
Izkliede ir statistikas rādītājs, kas parāda, cik ļoti vērtības datu kopā atšķiras no vidējās. Tas palīdz mums izprast datu punktu izplatību vai izkliedi. Ir divi galvenie dispersijas veidi: populācijas dispersija, kas mēra datu punktu sadalījumu visā populācijā, un izlases dispersija, kas mēra datu punktu izplatību izlasē. Izkliede tiek apzīmēta ar σ² un ir standarta novirzes kvadrāts. Lai aprēķinātu dispersiju, atrodiet datu vidējo lielumu, no katra datu punkta atņemiet vidējo, atšķirības kvadrātā un pēc tam šīs atšķirības kvadrātā. Atšķirība ir svarīga, jo tā palīdz mums izprast datu kopas mainīgumu. Liela dispersija norāda, ka datu punkti ir plaši izplatīti, savukārt zema dispersija norāda, ka tie ir tuvu vidējam. Izkliede vienmēr nav negatīva, jo tā ietver atšķirību kvadrātu.
Bieži uzdotie jautājumi par dispersiju
Kas ir statistikas dispersija?
Variance ir definēta kā datu kopas vērtību izkliede attiecībā pret datu kopas vidējo vērtību. Datu kopas dispersija norāda, cik lielā mērā vērtības konkrētā datu kopā izplatās no vidējās vērtības.
Kas ir dispersijas simbols?
Mēs izmantojam simbolus σ2, s2 un Var(x), lai apzīmētu datu kopas dispersiju.
Kas ir dispersijas formula?
Datu kopas dispersiju aprēķina, izmantojot formulu,
kā pārbaudīt ekrāna izmērulpp 2 = E[( X – m ) 2 ]
Ko stāsta Variance?
Izkliede tiek izmantota, lai noteiktu datu izplatības apmēru, t.i., tā norāda, kā datu kopas vērtības tiek sadalītas attiecībā pret vidējo vērtību. Lielākai dispersijas vērtībai vērtības ir plaši izplatītas attiecībā pret vidējo vērtību, turpretim attiecībā uz mazāko dispersijas vērtību vērtības ir cieši sadalītas attiecībā pret vidējo vērtību
Kāda ir saistība starp dispersiju un standarta novirzi?
Dotās datu kopas datu kopas dispersija ir šīs datu kopas standarta novirzes kvadrāts. Šī saistība tiek izteikta kā
Distance = (standarta novirze) 2
Kā jūs aprēķināt dispersiju?
Lai aprēķinātu dispersiju, vispirms atrodiet datu kopas vidējo (vidējo). Pēc tam no katra datu punkta atņemiet vidējo un rezultātu kvadrātā. Visbeidzot, aprēķiniet šīs atšķirības kvadrātā.
Kāpēc dispersija ir svarīga?
Atšķirība ir ļoti svarīga, lai izprastu datu sadalījumu datu kopā. Tas palīdz noteikt, cik datu punkti ir sadalīti no vidējās vērtības, norādot datu mainīgumu vai konsekvenci.
Kāda ir atšķirība starp dispersiju un standarta novirzi?
Lai gan gan dispersija, gan standarta novirze mēra datu izkliedi, standarta novirze ir dispersijas kvadrātsakne. Standarta novirze ir izteikta tajās pašās vienībās kā dati, padarot to interpretējamāku, lai norādītu starpību.
Vai dispersija var būt negatīva?
Nē, dispersija nevar būt negatīva. Tā kā to aprēķina kā vidējo atšķirību kvadrātā no vidējās vērtības, iegūtā vērtība vienmēr nav negatīva.