logo

Kā atrast R standarta novirzi?

Šajā rakstā mēs apspriedīsim, kā atrast standarta novirzi R programmēšanas valoda . Standarta novirze R ir vērtību izkliedes mērs. To var definēt arī kā dispersijas kvadrātsakni.

Parauga standartnovirzes formula:



s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2}

kur,

  • s = parauga standartnovirze
  • N = entītiju skaits
  • overline{x}= entītiju vidējais rādītājs

Pamatā ir divi dažādi veidi, kā aprēķināt standarta novirzi R programmēšanas valodā, un abi tie ir apskatīti tālāk.



1. metode: naiva pieeja

Šajā standartnovirzes aprēķināšanas metodē mēs izmantosim iepriekš minēto parauga standartnovirzes standarta formulu R valodā.

1. piemērs:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Izvade:



[1]   25.53886>

2. piemērs:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Izvade:

java salīdzināt virknes
[1] 2.676004>

2. metode: izmantojot sd()

Funkciju sd() izmanto, lai atgrieztu standarta novirzi.

Sintakse: sd(x, na.rm = FALSE)

Parametri:

    x: skaitlisks vektors, matrica vai dati frame.na.rm: vai noņemt trūkstošās vērtības?

Atgriezties: Parauga standartnovirze x.

1. piemērs:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)>
>
>

Izvade:

[1] 25.53886>

2. piemērs:

R

v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Izvade:

[1] 23.52175>

3. piemērs:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Izvade:

[1] 2.676004>

Aprēķiniet datu rāmja standarta novirzi:

Mēs varam aprēķināt datu rāmja standarta novirzi, izmantojot abas metodes. mēs varam ņemt varavīksnenes datu kopu, un katrai kolonnai mēs aprēķināsim standarta novirzi.

1. piemērs:

R

data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)>
>
>

Izvade:

upcasting
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>

Mēs varam arī aprēķināt standarta novirzi visam datu kadram kopā ar pielietošanas funkcijas palīdzību.

R

# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)>
>
>

Izvade:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>

Varavīksnenes datu kopas 1. līdz 4. kolonna, kas ir skaitliskās kolonnas, kurās ir mainīgie mērījumi, tiek izvēlētas, izmantojot izteiksmi varavīksnenes[, 1:4] iepriekš minētajā kodā.

Funkcija sd tiek lietota katrai kolonnai (atzīmēta ar 2) izvēlētajā varavīksnenes datu kopas apakškopā, izmantojot lietotnes funkciju. Iegūtās standarta novirzes vērtības tiek saglabātas katras kolonnas vektorā std_deviation.