R programmēšanas valoda ir atvērtā koda programmēšanas valoda, kas tiek plaši izmantota kā statistikas programmatūra un datu analīzes rīks. Datu rāmji R valodā ir vispārīgi R datu objekti, ko izmanto tabulas datu glabāšanai.
Datu rāmjus var interpretēt arī kā matricas, kur katra a kolonna matrica var būt dažāda veida dati. R DataFrame sastāv no trim galvenajām sastāvdaļām — datiem, rindām un kolonnām.
R datu rāmju struktūra
Kā redzams tālāk esošajā attēlā, šādi tiek strukturēts datu rāmis.
Dati tiek parādīti tabulas veidā, kas atvieglo darbību un izpratni.

R – datu rāmji
Izveidojiet datu rāmi R programmēšanas valodā
Lai izveidotu R datu rāmi, izmantojiet data.frame() funkciju un pēc tam nododiet funkcijai katru no izveidotajiem vektoriem kā argumentus.
R
# R program to create dataframe> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # print the data frame> print>(friend.data)> |
>
>
Izvade:
friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>
Iegūstiet R datu rāmja struktūru
R datu rāmja struktūru var iegūt, izmantojot str() funkcija R.
Tas var parādīt pat lielu sarakstu iekšējo struktūru, kas ir ligzdotas. Tas nodrošina vienas līnijas izvadi pamata R objektiem, ļaujot lietotājam uzzināt par objektu un tā sastāvdaļām.
R
labākās automašīnas pasaulē
# R program to get the> # structure of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using str()> print>(>str>(friend.data))> |
>
>
Izvade:
'data.frame': 5 obs. of 2 variables: $ friend_id : int 1 2 3 4 5 $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL>
Datu kopsavilkums R datu rāmī
R datu rāmī statistisko kopsavilkumu un datu būtību var iegūt, piesakoties kopsavilkums() funkciju.
Tā ir vispārīga funkcija, ko izmanto, lai izveidotu dažādu modeļu pielāgošanas funkciju rezultātu kopsavilkumus. Funkcija izsauc noteiktas metodes, kas ir atkarīgas no pirmā argumenta klases.
R
# R program to get the> # summary of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using summary()> print>(>summary>(friend.data))> |
>
>
Izvade:
friend_id friend_name Min. :1 Length:5 1st Qu.:2 Class :character Median :3 Mode :character Mean :3 3rd Qu.:4 Max. :5>
Izņemiet datus no datu rāmja R
Datu izvilkšana no R datu rāmja nozīmē piekļuvi tā rindām vai kolonnām. No R datu rāmja var iegūt noteiktu kolonnu, izmantojot tās kolonnas nosaukumu.
R
# R program to extract> # data from the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Extracting friend_name column> result <->data.frame>(friend.data$friend_name)> print>(result)> |
>
>
Izvade:
friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni>
Izvērsiet datu rāmi valodā R
Datu rāmi R var paplašināt, pievienojot jaunas kolonnas un rindas jau esošajam R datu rāmim.
R
# R program to expand> # the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Expanding data frame> friend.data$location <->c>(>'Kolkata'>,>'Delhi'>,> >'Bangalore'>,>'Hyderabad'>,> >'Chennai'>)> resultant <- friend.data> # print the modified data frame> print>(resultant)> |
>
>
Izvade:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>
Programmā R ar datu rāmi var veikt dažāda veida darbības, piemēram piekļūt rindām un kolonnām, atlasīt datu rāmja apakškopu, rediģēt datu rāmjus, dzēst rindas un kolonnas datu rāmī utt.
Lūdzu atsaucies uz DataFrame darbības R uzzināt par visu veidu darbībām, kuras var veikt datu rāmī.
Piekļūstiet vienumiem R Data Frame
Mēs varam atlasīt un piekļūt jebkuram elementam no datu rāmja, izmantojot vienu$>, iekavās[ ] or>dubultās iekavas[[]]>lai piekļūtu kolonnām no datu rāmja.
R
# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[>'friend_name'>]]> # Access Items using $> friend.data$friend_id> |
>
>
Izvade:
friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni' Access Items using $ [1] 1 2 3 4 5>
Rindu un kolonnu skaits
Mēs varam uzzināt, cik rindu un kolonnu ir parsant mūsu datu rāmī, izmantojot dim funkciju.
R
kā pārvērst virkni par java veselu skaitli
# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # find out the number of rows and clumns> dim>(friend.data)> |
>
>
Izvade:
[1] 5 2>
Pievienojiet rindas un kolonnas R datu rāmī
R DataFrame varat viegli pievienot rindas un kolonnas. Ievietošana palīdz paplašināt jau esošo DataFrame, neprasot jaunu.
Apskatīsim, kā DataFrame pievienot rindas un kolonnas? ar piemēru:
Pievienojiet rindas R datu rāmī
Lai datu rāmim pievienotu rindas, varat izmantot iebūvēto funkciju rbind().
Šis piemērs parāda rbind() darbību R Data Frame.
R
java virkne isempty
# Creating a dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products):
'>)> print>(Products)> # Adding a new row for a new product> New_Product <->c>(104,>'Sunglasses'>, 39.99, 40)> Products <->rbind>(Products, New_Product)> # Print the updated dataframe after adding the new product> cat>(>'
Updated dataframe after adding a new product:
'>)> print>(Products)> |
>
>
Izvade:
Existing dataframe (Products): Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 Updated dataframe after adding a new product: Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40>
Pievienojiet kolonnas R datu rāmī
Lai datu rāmim pievienotu kolonnas, varat izmantot iebūvēto funkciju cbind ().
Šis piemērs parāda cbind() darbību R Data Frame .
R
# Existing dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products):
'>)> print>(Products)> # Adding a new column for 'Discount' to the dataframe> Discount <->c>(5, 10, 8)># New column values for discount> Products <->cbind>(Products, Discount)> # Rename the added column> colnames>(Products)[>ncol>(Products)] <->'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat>(>'
Updated dataframe after adding a new column 'Discount':
'>)> print>(Products)> |
>
>
Izvade:
Existing dataframe (Products): Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 Updated dataframe after adding a new column 'Discount': Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8>
Noņemt rindas un kolonnas
Datu rāmis R noņem kolonnas un rindas no jau esošā R datu rāmja.
Noņemiet rindu R DataFrame
R
library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove a row with friend_id = 3> data <->subset>(data, friend_id != 3)> data> |
>
>
Izvade:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai # Remove a row with friend_id = 3 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>
Iepriekš minētajā kodā mēs vispirms izveidojām datu rāmi ar nosaukumu datus ar trim kolonnām: drauga_id , drauga_vārds , un atrašanās vieta . Lai noņemtu rindu ar drauga_id vienāds ar 3, mēs izmantojām apakškopa() funkciju un norādīja nosacījumu drauga_id != 3 . Tādējādi tika noņemta rinda ar drauga_id vienāds ar 3.
Noņemiet kolonnu R DataFrame
R
library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove the 'location' column> data <->select>(data, -location)> data> |
>
>
Izvade:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Noņemiet sleju 'atrašanās vieta' drauga_id drauga_vārds 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>
Lai noņemtu atrašanās vieta kolonnu, mēs izmantojām atlasīt() funkcija un norādīta - atrašanās vieta . The – zīme norāda, ka mēs vēlamies noņemt atrašanās vieta kolonna. Iegūtais datu rāmis datus būs tikai divas kolonnas: drauga_id un drauga_vārds .
Datu rāmju apvienošana R
Ir divi veidi, kā apvienot datu rāmjus R. Varat tos apvienot vertikāli vai horizontāli.
Apskatīsim abus gadījumus ar piemēru:
Apvienojiet R datu rāmi vertikāli
Ja vēlaties vertikāli apvienot 2 datu kadrus, varat izmantot rbind() funkcija. Šī funkcija darbojas divu vai vairāku datu rāmju kombinācijai.
R
# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Name =>c>(>'Charlie'>,>'David'>),> >Age =>c>(28, 35),> >Score =>c>(90, 85)> )> # Print the existing dataframes> cat>(>'Dataframe 1:
'>)> print>(df1)> cat>(>'
Dataframe 2:
'>)> print>(df2)> # Combining the dataframes using rbind()> combined_df <->rbind>(df1, df2)> # Print the combined dataframe> cat>(>'
Combined Dataframe:
'>)> print>(combined_df)> |
>
>
Izvade:
Dataframe 1: Name Age Score 1 Alice 25 80 2 Bob 30 75 Dataframe 2: Name Age Score 1 Charlie 28 90 2 David 35 85 Combined Dataframe: Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85>
Apvienot R datu rāmi horizontāli:
Ja vēlaties horizontāli apvienot 2 datu kadrus, varat izmantot cbind() funkcija. Šī funkcija darbojas divu vai vairāku datu rāmju kombinācijai.
R
cpp vienāds
# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Height =>c>(160, 175),> >Weight =>c>(55, 70)> )> # Print the existing dataframes> cat>(>'Dataframe 1:
'>)> print>(df1)> cat>(>'
Dataframe 2:
'>)> print>(df2)> # Combining the dataframes using cbind()> combined_df <->cbind>(df1, df2)> # Print the combined dataframe> cat>(>'
Combined Dataframe:
'>)> print>(combined_df)> |
>
>
Izvade:
Dataframe 1: Name Age Score 1 Alice 25 80 2 Bob 30 75 Dataframe 2: Height Weight 1 160 55 2 175 70 Combined Dataframe: Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70>
Lasi arī:
- R – objekti
- Datu struktūras R programmēšanā
Šajā rakstā mēs esam apskatījuši R datu rāmji, un visas pamata darbības, piemēram, izveide, piekļuve, kopsavilkums, pievienošana un noņemšana. Šī raksta mērķis ir iepazīstināt jūs ar datu rāmjiem R, lai jūs varētu tos izmantot savos projektos.
Cerams, ka tas palīdzēs jums izprast datu rāmju jēdzienu R un jūs varat viegli ieviest R datu ietvaru savos projektos.