DISTANCE | DEFINĪCIJA, FORMULA, PIEMĒRI UN ĪPAŠĪBAS

dispersija ir mērījumu vērtība, ko izmanto, lai noskaidrotu, kā dati tiek izplatīti attiecībā uz datu kopas vidējo vai vidējo vērtību. To izmanto, lai noskaidrotu, kā sadalījuma dati tiek sadalīti attiecībā uz vidējo vai vidējo vērtību. Dispersijas definēšanai izmantotais simbols ir σ². Tas ir standarta novirzes kvadrāts.

Statistikā tiek izmantoti divu veidu dispersijas,

Parauga dispersija
Iedzīvotāju dispersija

Populācijas dispersiju izmanto, lai noteiktu, kā katrs datu punkts konkrētajā populācijā svārstās vai tiek izkliedēts, savukārt izlases dispersiju izmanto, lai atrastu vidējo noviržu kvadrātā no vidējās vērtības.

Šajā rakstā mēs uzzināsim par Variance (izlase, populācija), to formulas, īpašības un citi detalizēti.

Satura rādītājs

Kas ir dispersija?

Izkliedes definīcija

Variances veidi
dispersijas simbols
Izkliedes piemērs
dispersijas formula

Variācijas formulas paraugs
Iedzīvotāju dispersijas formula
Grupētu datu novirzes formula
Negrupētu datu dispersijas formula
Formula dispersijas aprēķināšanai

Kā aprēķināt dispersiju?
Izkliede un standarta novirze
Variance un Kovariance
Izkliedes īpašības
Piemēri par dispersijas formulu
Kopsavilkums – dispersija
Bieži uzdotie jautājumi par dispersiju

Kas ir dispersija?

Mēs izmērām dažādas datu vērtības, un šīs vērtības tiek izmantotas dažādiem mērķiem. Datus var sniegt divu veidu grupētos datos vai negrupētos (diskrētos) datos. Ja dati tiek sniegti klašu intervālu veidā, tos sauc par grupētiem datiem, savukārt, ja dati tiek sniegti viena datu punkta veidā, tos sauc par diskrētu vai negrupētu datu punktu. Izkliede ir datu izkliedes mērs attiecībā uz datu vidējo vērtību. Tas mums norāda, kā dati tiek izkliedēti dotajā datu vērtībā. Mēs varam viegli aprēķināt izlases dispersiju un populācijas dispersiju gan grupētiem, gan negrupētiem datiem.

Izkliedes definīcija

dispersija ir statistikas mērs, kas kvantitatīvi nosaka datu punktu kopas izplatību vai izkliedi. Tas norāda, cik ļoti atsevišķie datu punkti datu kopā atšķiras no datu kopas vidējā (vidējā).

Variances veidi

Mēs varam definēt doto datu dispersiju divos veidos,

Iedzīvotāju dispersija
Parauga dispersija

Tagad uzzināsim par tiem sīkāk.

Iedzīvotāju dispersija

Populācijas dispersiju izmanto, lai noteiktu dotās populācijas izplatību. Iedzīvotāji ir definēti kā cilvēku grupa, un visi cilvēki šajā grupā ir daļa no iedzīvotājiem. Tas mums stāsta par to, kā grupas populācija mainās attiecībā pret vidējo iedzīvotāju skaitu.

Visi grupas dalībnieki ir pazīstami kā iedzīvotāji. Ja mēs vēlamies noskaidrot, kā katrs datu punkts konkrētajā populācijā atšķiras vai ir sadalīts, mēs izmantojam populācijas dispersiju. To izmanto, lai norādītu katra datu punkta attālumu kvadrātā no populācijas vidējā.

Parauga dispersija

Ja populācijas dati ir ļoti lieli, kļūst grūti aprēķināt datu kopas populācijas dispersiju. Tādā gadījumā mēs ņemam datu paraugu no dotās datu kopas un atrodam šīs datu kopas dispersiju, ko sauc par izlases dispersiju. Aprēķinot izlases vidējo vērtību, mēs noteikti aprēķinām izlases vidējo, t.i., izlases datu kopas vidējo, nevis populācijas vidējo. Mēs varam definēt izlases dispersiju kā vidējo lielumu no starpības starp izlases datu punktu un izlases vidējo vērtību kvadrātā.

dispersijas simbols

Atsaucoties uz populācijas dispersiju, dispersijas simbolu parasti apzīmē ar grieķu burtu sigma kvadrātā (σ²). Izlases dispersijai to bieži apzīmē ar s².

Variācijas piemērs

Mēs varam saprast dispersijas jēdzienu, izmantojot tālāk apskatīto piemēru.

Atrodiet datu populācijas dispersiju {4,6,8,10}

Risinājums:

Vidējā = (4+6+8+10)/4 = 7

4 (4-7)² 9

6 (6-7)² 1

8 (8-7)² 1

10 (10-7)² 9

Distance = (9+1+1+9)/4 = 20/4 = 5

Tādējādi datu dispersija ir 5

dispersijas formula

Datu kopas dispersiju apzīmē ar simbolu σ². Iedzīvotāju datiem tās formula ir vienāda ar datu ierakstu atšķirību kvadrātā summu no vidējās vērtības, kas dalīta ar ierakstu skaitu. Parauga datiem mēs dalām skaitītāja vērtību ar starpību starp ierakstu skaitu un vienību.

Variācijas formulas paraugs

Ja datu kopa ir paraugs, dispersijas formula tiek dota ar:

lpp ² = ∑ (x _i – x̄) ² /(n-1)

kur,

x ir izlases datu kopas vidējais lielums

n ir kopējais novērojumu skaits

Iedzīvotāju dispersijas formula

Ja mums ir iedzīvotāju datu kopa, formula tiek uzrakstīta šādi:

lpp ² = ∑ (x _i – x̄) ² /n

kur,

x ir iedzīvotāju datu kopas vidējais lielums

n ir kopējais novērojumu skaits

Mēs varam arī aprēķināt dispersiju grupētajām un negrupētajām datu kopām. Dažādas dispersijas formulas ir,

java concat virknes

Grupētu datu novirzes formula

Grupētiem datiem dispersijas formula ir aplūkota tālāk,

Parauga dispersijas formula grupētiem datiem (σ ² ) = ∑ f(m _i – x̄) ² /(n-1)

Populācijas dispersijas formula grupētiem datiem (lpp ² ) = ∑ f(m _i – x̄) ² /n

kur,

f ir katra intervāla biežums

m _i ir i viduspunkts^thintervāls

x ir grupēto datu vidējais lielums

Grupētiem datiem vidējo aprēķina kā

Vidējais = ∑ (f _i x _i ) / ∑ f _i

Negrupētu datu dispersijas formula

Negrupētiem datiem dispersijas formula ir aplūkota tālāk,

Negrupētu datu dispersijas formulas paraugs (lpp ² ) = ∑ (x _i – x̄) ² /(n-1)

Populācijas dispersijas formula negrupētiem datiem (lpp ² ) = ∑ (x _i – x̄) ² /n

kur x ir grupēto datu vidējais lielums

Formula dispersijas aprēķināšanai

Formula, kas tiek izmantota novirzes aprēķināšanai, ir aplūkota zemāk esošajā attēlā,

$dispersijas formula$

Kā aprēķināt dispersiju?

Kopumā dispersija nozīmē populācijas standarta dispersiju. Dotās vērtību kopas dispersijas aprēķināšanas soļi ir šādi:

1. darbība: Aprēķiniet novērojuma vidējo vērtību, izmantojot formulu (vidējais = novērojumu summa/novērojumu skaits)

2. darbība: Aprēķiniet datu vērtību atšķirības kvadrātā no vidējās. (Datu vērtība — vidējā)²

3. darbība: Aprēķināt vidējo kvadrātā norādīto vērtību starpību, ko sauc par datu kopas dispersiju.

(Variance = atšķirību kvadrātā summa / novērojumu skaits)

Izkliede un standarta novirze

Variance un Standarta novirze abi ir centrālās tendences mēri, ko izmanto, lai pastāstītu mums par to, cik lielā mērā datu kopas vērtības atšķiras no datu kopas centrālās vai vidējās vērtības.

Jebkurai datu kopai pastāv noteikta saistība starp dispersiju un standarta novirzi.

Novirze = (standarta novirze) ²

Novirze tiek definēta kā standarta novirzes kvadrāts, t.i., jebkurai datu grupai ņemot standarta novirzes kvadrātu, mēs iegūstam šīs datu kopas dispersiju. dispersiju nosaka, izmantojot simbolu lpp ² tā kā lpp tiek izmantots, lai definētu datu kopas standarta novirzi. Datu kopas dispersiju izsaka kvadrāta vienībās, savukārt datu kopas standartnovirzi izsaka vienībā, kas ir līdzīga datu kopas vidējai vērtībai.

Uzzināt vairāk: Izkliede un standarta novirze

Binomiālā sadalījuma dispersija

Binomiālais sadalījums ir diskrēts varbūtības sadalījums, kas parāda pozitīvo rezultātu skaitu binominālā eksperimentā, kas veikts n reižu skaitu. Binomiālā eksperimenta rezultāts ir 0 vai 1, t.i., pozitīvs vai negatīvs.

Binomiālā eksperimentā n izmēģinājumi un kur ir norādīta katra izmēģinājuma iespējamība lpp , tad binoma sadalījuma dispersiju uzrāda, izmantojot,

lpp ² = np (1–p)

kur 'piem' ir definēts kā binoma sadalījuma vērtību vidējais lielums.

Puasona sadalījuma dispersija

Indes izplatīšana ir definēts kā diskrēts varbūtības sadalījums, ko izmanto, lai noteiktu varbūtību, ka “n” notikumu skaits notiks “x” laika periodā. Vidējais Puasona sadalījumā tiek definēts ar simbolu l.

Puasona sadalījumā dotās datu kopas vidējais lielums un dispersija ir vienādi. Puasona sadalījuma dispersiju uzrāda, izmantojot formulu,

lpp ² = λ

Vienotā sadalījuma dispersija

Vienmērīgā sadalījumā varbūtības sadalījuma dati ir nepārtraukti. Šo eksperimentu rezultāts ir diapazonā starp noteiktu augšējo robežu un noteiktu apakšējo robežu, un tāpēc šos sadalījumus sauc arī par taisnstūrveida sadalījumiem. Ja augšējā robeža vai maksimālā robeža ir b un apakšējā robeža vai minimālā robeža ir a, tad vienmērīgā sadalījuma dispersiju aprēķina, izmantojot formulu,

lpp ² = (1/12) (b–a) ²

Vienmērīgā sadalījuma vidējo vērtību uzrāda, izmantojot formulu,

Vidējais = (b + a) / 2

kur,

b ir vienmērīgā sadalījuma augšējā robeža

a ir vienmērīgā sadalījuma apakšējā robeža

Variance un Kovariance

Datu kopas dispersija nosaka visu datu kopas vērtību nepastāvību attiecībā pret datu kopas vidējo vērtību. Kovariance parāda, kā nejaušie mainīgie ir saistīti viens ar otru, un tas mums norāda, kā viena mainīgā izmaiņas ietekmē izmaiņas citos mainīgajos.

Kovariācija var būt pozitīva vai negatīva, pozitīvā kovariācija nozīmē, ka abi mainīgie virzās vienā virzienā attiecībā pret vidējo vērtību, savukārt negatīvā kovariācija nozīmē, ka abi mainīgie virzās pretējos virzienos attiecībā pret vidējo vērtību.

Diviem gadījuma lielumiem x un y, kur x ir atkarīgais mainīgais un y ir neatkarīgais mainīgais, kovariāciju aprēķina, izmantojot formulu, kas minēta tālāk pievienotajā attēlā.

$Kovariācijas formula$

Izkliedes īpašības

Variance tiek plaši izmantota matemātikā, statistikā un citās zinātnes nozarēs dažādiem mērķiem. Variancei ir dažādas īpašības, kuras plaši izmanto dažādu problēmu risināšanai. Dažas no dispersijas pamatīpašībām ir,

Datu kopas dispersija ir nenegatīvs lielums, un dispersijas nulles vērtība nozīmē, ka visas datu kopas vērtības ir vienādas.
Lielāka dispersijas vērtība norāda, ka visas datu kopas datu vērtības ir plaši izkliedētas, t.i., tās atrodas tālu no datu kopas vidējās vērtības.
Mazāka dispersijas vērtība norāda, ka visas datu kopas datu vērtības ir tuvu viena otrai, t.i., tās ir ļoti tuvas no datu kopas vidējās vērtības.

Jebkurai konstantei “c”

Var(x + c) = Var(x)

kur x ir nejaušs mainīgais

Var(cx) = c²

kur x ir nejaušs mainīgais

Tāpat, ja a un b ir nemainīgā vērtība un x tad ir nejaušs mainīgais,

Var(ax + b) = a²

Neatkarīgiem mainīgajiem x₁, x₂, x₃…,x_nmēs to zinām,

Kur (x₁+ x₂+……+ x_n) = Var(x₁) + Kur (x₂) +……..+Kur(x_n)

Cilvēki arī lasa:

Vidēji

Režīms

Atšķirība starp dispersiju un standarta novirzi

Variances formulas piemēri

1. piemērs. Aprēķiniet izlases datu dispersiju: 7, 11, 15, 19, 24.

Risinājums:

Mums ir dati: 7, 11, 15, 19, 24

Atrodiet datu vidējo vērtību.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15.2

Izmantojot dispersijas formulu, mēs iegūstam,

lpp²= ∑ (x_i– x̄)²/(n-1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5–1)
= 176,8/4
= 44,2

2. piemērs: Aprēķiniet novērojumu skaitu, ja datu dispersija ir 12 un datu kvadrātu atšķirību summa no vidējā ir 156.

Risinājums:

Mums ir,

(x_i– x̄)²= 156

lpp²= 12

Izmantojot dispersijas formulu, mēs iegūstam,

lpp²= ∑ (x_i– x̄)²/n

12 = 156/n

n = 156/12

n = 13

3. piemērs: Aprēķiniet dispersiju dotajiem datiem

x_i	f_i
10	1
4	3
6	5
8	1

Risinājums:

Vidējais (x̄) = ∑(f_ix_i)/∑(f_i)
mākslīgais neironu tīkls

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(f_i) = 1+3+5+1 = 10

x_i

f_i

f_ix_i

(x_i– x̄)

(x_i– x̄)²

f_i(x_i– x̄)²

10 1 10 4 16 16

4 3 12 -2 4 12

6 5 30 0 0 0

8 1 8 2 4 8

Tagad

lpp ² = (∑ _i ⁿ f _i (x _i – x̄) ² /n)

= [(16 + 12 + 0 + 8)/10]
= 3,6

Izkliede (σ²) = 3,6

x_i	f_i	f_ix_i	(x_i– x̄)	(x_i– x̄)²	f_i(x_i– x̄)²
10	1	10	4	16	16
4	3	12	-2	4	12
6	5	30	0	0	0
8	1	8	2	4	8

4. piemērs. Atrodiet tālāk norādītās datu tabulas dispersiju

Klase	Biežums
0-10	3
10-20	6
20-30	4
30-40	2
40-50	1

Risinājums:

Klase

Sji

f_i

f × Xi

Xi - μ

(Xi – μ)2

f×(Xi – μ)2

0-10

5

3

piecpadsmit

- piecpadsmit

225

675

10-20

piecpadsmit

6

90

-5

25

150

20-30

25

4

100

5

25

100

30-40

35

2

70

piecpadsmit

225

450

40-50

Četri

1

Četri

25

625

625

Kopā

16

320

2000. gads

Vidējais (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

lpp ² = (∑ _i ⁿ f _i (x _i – m) ² /n)

= [(2000)/(16)]
= (125)

Dotās datu kopas dispersija ir 125.

Klase	Sji	f_i	f × Xi	Xi - μ	(Xi – μ)2	f×(Xi – μ)2
0-10	5	3	piecpadsmit	- piecpadsmit	225	675
10-20	piecpadsmit	6	90	-5	25	150
20-30	25	4	100	5	25	100
30-40	35	2	70	piecpadsmit	225	450
40-50	Četri	1	Četri	25	625	625
Kopā		16	320			2000. gads

Kopsavilkums – dispersija

Izkliede ir statistikas rādītājs, kas parāda, cik ļoti vērtības datu kopā atšķiras no vidējās. Tas palīdz mums izprast datu punktu izplatību vai izkliedi. Ir divi galvenie dispersijas veidi: populācijas dispersija, kas mēra datu punktu sadalījumu visā populācijā, un izlases dispersija, kas mēra datu punktu izplatību izlasē. Izkliede tiek apzīmēta ar σ² un ir standarta novirzes kvadrāts. Lai aprēķinātu dispersiju, atrodiet datu vidējo lielumu, no katra datu punkta atņemiet vidējo, atšķirības kvadrātā un pēc tam šīs atšķirības kvadrātā. Atšķirība ir svarīga, jo tā palīdz mums izprast datu kopas mainīgumu. Liela dispersija norāda, ka datu punkti ir plaši izplatīti, savukārt zema dispersija norāda, ka tie ir tuvu vidējam. Izkliede vienmēr nav negatīva, jo tā ietver atšķirību kvadrātu.

Bieži uzdotie jautājumi par dispersiju

Kas ir statistikas dispersija?

Variance ir definēta kā datu kopas vērtību izkliede attiecībā pret datu kopas vidējo vērtību. Datu kopas dispersija norāda, cik lielā mērā vērtības konkrētā datu kopā izplatās no vidējās vērtības.

Kas ir dispersijas simbols?

Mēs izmantojam simbolus σ², s2 un Var(x), lai apzīmētu datu kopas dispersiju.

Kas ir dispersijas formula?

Datu kopas dispersiju aprēķina, izmantojot formulu,
kā pārbaudīt ekrāna izmēru

lpp ² = E[( X – m ) ² ]

Ko stāsta Variance?

Izkliede tiek izmantota, lai noteiktu datu izplatības apmēru, t.i., tā norāda, kā datu kopas vērtības tiek sadalītas attiecībā pret vidējo vērtību. Lielākai dispersijas vērtībai vērtības ir plaši izplatītas attiecībā pret vidējo vērtību, turpretim attiecībā uz mazāko dispersijas vērtību vērtības ir cieši sadalītas attiecībā pret vidējo vērtību

Kāda ir saistība starp dispersiju un standarta novirzi?

Dotās datu kopas datu kopas dispersija ir šīs datu kopas standarta novirzes kvadrāts. Šī saistība tiek izteikta kā

Distance = (standarta novirze) ²

Kā jūs aprēķināt dispersiju?

Lai aprēķinātu dispersiju, vispirms atrodiet datu kopas vidējo (vidējo). Pēc tam no katra datu punkta atņemiet vidējo un rezultātu kvadrātā. Visbeidzot, aprēķiniet šīs atšķirības kvadrātā.

Kāpēc dispersija ir svarīga?

Atšķirība ir ļoti svarīga, lai izprastu datu sadalījumu datu kopā. Tas palīdz noteikt, cik datu punkti ir sadalīti no vidējās vērtības, norādot datu mainīgumu vai konsekvenci.

Kāda ir atšķirība starp dispersiju un standarta novirzi?

Lai gan gan dispersija, gan standarta novirze mēra datu izkliedi, standarta novirze ir dispersijas kvadrātsakne. Standarta novirze ir izteikta tajās pašās vienībās kā dati, padarot to interpretējamāku, lai norādītu starpību.

Vai dispersija var būt negatīva?

Nē, dispersija nevar būt negatīva. Tā kā to aprēķina kā vidējo atšķirību kvadrātā no vidējās vērtības, iegūtā vērtība vienmēr nav negatīva.