logo

CSV faila satura lasīšana programmā R Programming — funkcija read.csv()

lasīt.csv() funkcija R Valodā tiek izmantota, lai lasītu komatu atdalītu vērtību failus. Tas importē datus formā a datu rāmis.

kolekcijas java

Sintakse: read.csv(fails, galvene, sep, dec) Parametri: fails: ceļš uz failu, kas satur datus, kas jāimportē R. galvene: loģiskā vērtība. Ja TRUE, read.csv() pieņem, ka failam ir galvenes rinda, tāpēc 1. rinda ir katras kolonnas nosaukums. Ja tas tā nav, varat pievienot argumenta galveni = FALSE. septembris: lauka atdalīšanas rakstzīme decembris: failā izmantotā rakstzīme decimālpunktiem.



Datu mainīgajā glabāsies CSV faila saturs, tiklīdz būsim izmantojuši funkciju read.csv(), taču jūs varat izmantot citu mainīgo.

Funkcija read.csv() pieņem arī vairākus izvēles argumentus, ko varam izmantot, lai modificētu importēšanas procedūru. mēs varam izvēlēties pirmo rindu uzskatīt par kolonnu nosaukumiem, atlasīt norobežotāja rakstzīmi un daudz ko citu. Papildinformāciju par šīm opcijām skatiet read.csv() dokumentācijā.

Nodrošiniet, lai fails būtu pareizā CSV formātā ar pareiziem norobežotājiem un pēdiņu rakstzīmēm, norādot metodei read.csv() pareizo faila ceļu vai URL.



1. piemērs. Faila lasīšana no tās pašas mapes

R






# R program to read a csv file> # Get content into a data frame> data <->read.csv>(>'CSVFileExample.csv'>,> >header =>FALSE>, sep =>' '>)> > # Printing content of Text File> print>(data)>

>

>

Izvade:

 V1 V2 V3 1 100 AB ab 2 200 CD cd 3 300 EF ef 4 400 GH gh 5 500 IJ ij>

2. piemērs: failu lasīšana no dažādiem direktorijiem

R




# Simple R program to read csv file> x <->read.csv>(>' D://Datas//myfile.csv '>)> > # print x> print>(x)>

>

>

Izvade:

 X V1 V2 V3 1 1 100 a1 b1 2 2 200 a2 b2 3 3 300 a3 b3>

3. piemērs: CSV faila lasīšana ar citu atdalītāju

R




data <->read.csv>(>'path/to/your/file.csv'>, sep =>';'>)>

>

>

Sep opcija ir iestatīta uz ; šajā piemērā, kas norāda, ka CSV fails izmanto semikolu (;) kā atdalītāju, nevis standarta komatu (,).

4. piemērs: pirmās rindas apstrāde kā kolonnu nosaukumi

R




data <->read.csv>(>'path/to/your/file.csv'>, header =>TRUE>)>

>

>

CSV faila pirmā rinda pēc noklusējuma tiek apstrādāta kā kolonnu nosaukumi, jo galvenes arguments ir iestatīts uz TRUE. Ja mūsu CSV faila pirmajā rindā nav kolonnu nosaukumu, mēs varam importēt datus bez tiem, iestatot header = FALSE.

4. piemērs: kolonnu klašu norādīšana

R


karte mašīnrakstā



data <->read.csv>(>'path/to/your/file.csv'>,> >colClasses =>c>(>'character'>,>'numeric'>,>'integer'>))>

>

>

Mēs varam definēt klases katrai kolonnai CSV failā, izmantojot opciju colClasses. Šīs ilustrācijas labad pirmā kolonna tiks interpretēta kā rakstzīme, otrā kā skaitlis un trešā kā vesels skaitlis. Ja vēlamies pārvaldīt konkrētu kolonnu datu tipus.

5. piemērs: rindu izlaišana un trūkstošo vērtību norādīšana

R




data <->read.csv>(>'path/to/your/file.csv'>, skip = 3, na.strings =>c>(>''>,>'NA'>))>

>

>

Mēs varam izlaist noteiktu rindu skaitu CSV faila sākumā, izmantojot izlaišanas argumentu. Pirmās trīs rindas šajā ilustrācijā tiks izlaistas. Vērtības, kas jāuzskata par trūkstošām vērtībām (NA), ir norādītas ar an. stīgu arguments. Šajā situācijā gan virkne NA, gan tukšas virknes tiek atzītas par trūkstošām vērtībām.