Pandas DataFrame ir 2 dimensiju datu struktūra ar etiķetēm, piemēram, tabula ar rindām un kolonnām. DataFrame lielums un vērtības ir mainīgas, t.i., var tikt modificētas.
DataFrame galvenokārt tiek izmantots datu analīzē un datu manipulācijās. Tas ļauj saglabāt datus tabulas veidā, piemēram, SQL datu bāzē, MS Excel vai Google izklājlapās, atvieglojot aritmētisko darbību veikšanu ar datiem.
Tas ir visbiežāk izmantotais Pandas objekts. The DataFrame() funkcija tiek izmantots, lai izveidotu datu rāmi Pandas. Varat arī izveidot Pandas DataFrame vairākos veidos.
Pandas Dataframe() Sintakse
pandas.DataFrame(dati, indekss, kolonnas)
java skaitītājs
Parametri:
- datus : tā ir datu kopa, no kuras ir jāizveido DataFrame. Tas var būt saraksts, vārdnīca, skalārā vērtība, sērijas un masīvi utt.
- rādītājs : tas nav obligāti, pēc noklusējuma DataFrame indekss sākas no 0 un beidzas ar pēdējo datu vērtību (n-1). Tas skaidri nosaka rindas etiķeti.
- kolonnas : Šis parametrs tiek izmantots, lai nodrošinātu kolonnu nosaukumus DataFrame. Ja kolonnas nosaukums pēc noklusējuma nav definēts, tā vērtība būs no 0 līdz n-1.
Atgriež:
- DataFrame objekts
Tagad, kad esam apsprieduši funkciju DataFrame(), apskatīsim dažādus veidus, kā izveidot DataFrame:
Dažādi veidi, kā izveidot datu rāmi Python
Ir vairāki veidi, kā izveidot a Pandas datu rāmis iekšā Python . Varat izveidot DataFrame, izmantojot šādas metodes:
- Izveidojiet Pandas DataFrame, izmantojot funkciju DataFrame().
- Izveidojiet Pandas DataFrame no sarakstu saraksta
- Izveidojiet Pandas DataFrame no vārdnīcas ndarray/list
- Izveidojiet Pandas DataFrame no vārdnīcu saraksta
- Izveidojiet Pandas DataFrame no sērijas vārdnīcas
- DataFrame izveide, izmantojot zip() funkciju
- DataFrame izveide, skaidri pierādot indeksa etiķeti
Izveidojiet tukšu datu rāmi, izmantojot metodi DataFrame().
DataFrame programmā Python var izveidot, izmantojot funkciju DataFrame(). Pandas bibliotēka . Vienkārši izsauciet funkciju ar DataFrame konstruktoru, lai izveidotu DataFrame.
Piemērs : tukša DataFrame izveide, izmantojot Python funkciju DataFrame().
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Izvade:
Empty DataFrame Columns: [] Index: []>
Izveidojiet DataFrame no sarakstu sarakstiem
Lai izveidotu Pandas DataFrame no a sarakstu sarakstu, varat izmantot funkciju pd.DataFrame(). Šī funkcija izmanto sarakstu sarakstu kā ievadi un izveido DataFrame ar tādu pašu rindu un kolonnu skaitu kā ievades sarakstā.
Piemērs : DataFrame izveide no sarakstu sarakstiem, izmantojot metodi DataFrame().
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
>
Izvade:
Name Age 0 tom 10 1 nick 15 2 juli 14>
Izveidojiet DataFrame no ndArray/Lists vārdnīcas
Lai izveidotu DataFrame no a vārdnīca no ndarrays /lists, visiem masīviem ir jābūt vienāda garuma. Ja indekss tiek nodots, garuma indeksam jābūt vienādam ar masīvu garumu.
Ja indekss netiek nodots, pēc noklusējuma indekss būs diapazons(n), kur n ir masīva garums.
Piemērs : DataFrame izveide no ndarray/lists vārdnīcas
Python3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
inurl:.git/head
>
>
Izvade:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Piezīme: Veidojot DataFrame, izmantojot vārdnīcu, vārdnīcas atslēgas pēc noklusējuma būs kolonnu nosaukumi. Mēs varam arī skaidri norādīt kolonnu nosaukumus, izmantojot kolonnas parametru.
Izveidojiet DataFrame no vārdnīcu saraksta
Pandas DataFrame var izveidot, nokārtojot vārdnīcu saraksti kā ievades dati. Pēc noklusējuma vārdnīcas atslēgas tiks uzskatītas par kolonnām.
Python3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
log4j
>
>
Izvade:
a b c 0 1 2 3 1 10 20 30>
Vēl viens piemērs ir izveidot Pandas DataFrame, nododot vārdnīcu sarakstus un rindu indeksi .
Python3
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Izvade:
b c a first 2 3 NaN second 20 30 10.0>
Izveidojiet DataFrame no sērijas vārdnīcas
Lai izveidotu DataFrame no vārdnīcas sērija , vārdnīcu var nodot, lai izveidotu DataFrame. Rezultātā iegūtais indekss ir visu apstiprināto indeksēto sēriju savienība.
Piemērs: DataFrame izveide no sēriju vārdnīcas.
Python3
stlc
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Izvade:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Izveidojiet DataFrame, izmantojot funkciju zip().
Divus sarakstus var apvienot, izmantojot zip() funkcija . Tagad izveidojiet Pandas DataFrame, izsaucot funkciju pd.DataFrame().
Piemērs: DataFrame izveide, izmantojot zip() funkciju.
Python3
java ir nākamais
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
Izvade:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Izveidojiet DataFrame, skaidri pierādot indeksa etiķeti
Lai izveidotu DataFrame, skaidri norādot indeksa etiķeti, varat izmantot konstruktora pd.DataFrame() indeksa parametru. Indeksa parametrs kā ievadi izmanto indeksa etiķešu sarakstu, un DataFrame izmantos šīs etiķetes DataFrame rindām.
Piemērs: DataFrame izveide, skaidri pierādot indeksa etiķeti
Python3
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
Izvade:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Secinājums
Python Pandas DataFrame ir līdzīgs tabulai ar rindām un kolonnām. Tā ir divdimensiju datu struktūra un ir ļoti noderīga datu analīzei un datu apstrādei.
Šajā apmācībā mēs esam apsprieduši vairākus veidus, kā izveidot Pandas DataFrame. Izmantojot šo pamācību, jūs varēsit izpildīt jebkuru sarežģītu DataFrame izveides prasību.