Šajā rakstā mēs apspriedīsim Pandas DataFrame.set_index() programmā Python. Python izceļas kā lieliska datu analīzes valoda, galvenokārt pateicoties tās izcilajai uz datiem orientētu pakotņu ekosistēmai. Starp šiem iepakojumiem Pandas ir nozīmīga loma datu importēšanas un analīzes vienkāršošanā.
Pandas DataFrame.set_index() Sintakse
Sintakse: DataFrame.set_index(keys, drop=true, append=false, inplace=false, verify_integrity=false)
Parametri:
- atslēgas: Kolonnas nosaukums vai kolonnu nosaukumu saraksts.
- piliens: Būla vērtība, kas, ja ir True, nolaiž indeksam izmantoto kolonnu.
- pievienot: Ja ir True, norādīto kolonnu pievieno esošajai indeksa kolonnai.
- vietā: Ja True, izmaiņas tiek veiktas pašā DataFrame.
- verify_integrity: Ja True, pārbauda, vai jaunajā indeksa kolonnā nav dublikātu.
Kas ir Pandas DataFrame.set_index()?
Pandas datu rāmis. set_index() metode tiek izmantota, lai piešķirtu sarakstu, sēriju vai citu datu rāmi kā norādītā datu rāmja indeksu. Tas ir īpaši noderīgi, apvienojot vairākus datu kadrus, ļaujot viegli modificēt indeksu. Lai gan indeksa kolonnu var norādīt datu rāmja izveides laikā, set_index() nodrošina elastīgu veidu, kā vēlāk mainīt indeksu. Būtībā tas ļauj iestatīt sarakstu, sēriju vai datu rāmi kā datu rāmja indeksu. Bet dažreiz datu rāmis tiek veidots no diviem vai vairākiem datu rāmjiem, un tādējādi vēlāku indeksu var mainīt, izmantojot šo metodi.
Lai lejupielādētu izmantoto CSV failu, noklikšķiniet uz Šeit.
Pandas DataFrame.set_index() Piemēri
Tālāk ir sniegti pareizi Pandas DataFrame.set_index() piemēru piemēri.
- Pandas Iestatīt indeksu uz kolonnu
- Vairāku indeksu kolonna
- Singla iestatīšana Pludiņa kolonna kā indekss
- Iestatījums trīs kolonnas kā MultiIndex
- Pandas Iestatiet noteiktas kolonnas indeksu
Pandas Iestatīt indeksu uz kolonnu
Šajā piemērā mēs mainām indeksa kolonnu, kolonna Vārds ir padarīta par datu rāmja indeksa kolonnu.
Python3
saraksts uz java
# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index(>'First Name'>, inplace>=> True>)> # display> data.head()> |
>
>
Izvade : Pirms ekspluatācijas -

Pēc operācijas -

Kā parādīts izvades attēlos, agrāk rādītāja kolonna bija skaitļu sērija, bet vēlāk tā tika aizstāta ar Vārdu.
Pandas Iestatīt indeksu uz vairāku indeksu kolonnu
Šajā piemērā divas kolonnas tiks izveidotas kā indeksa kolonna. Nomest parametru izmanto, lai nomestu kolonnu, un pievienošanas parametru izmanto, lai pievienotu nodotās kolonnas jau esošajai indeksa kolonnai.
Python3
# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index([>'First Name'>,>'Gender'>], inplace>=> True>,> >append>=> True>, drop>=> False>)> # display> data.head()> |
java virknes pievienošanās
>
>
Izvade:

Kā parādīts izvades attēlā, datiem ir 3 indeksa kolonnas.
Pandas Dataframe Index Vienuma iestatīšana Pludiņa kolonna kā indekss
Šajā piemērā tālāk norādītais koda fragments izmanto Pandas bibliotēku, lai izveidotu DataFrame ar nosaukumu “df” no ligzdota studentu datu saraksta. Tas iestata kolonnu “Agg_Marks” kā indeksu un parāda iegūto DataFrame ar kolonnām “Nosaukums”, “Vecums”, “Pilsēta” un “Valsts”.
Python3
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # here we set Float column 'Agg_Marks' as index of data frame> # using dataframe.set_index() function> df>=> df.set_index(>'Agg_Marks'>)> # Displaying the Data frame> df> |
>
>
Izvade:
Name Age City Country Agg_Marks 85.96 jack 34 Sydeny Australia 95.20 Riti 30 Delhi India 85.25 Vansh 31 Delhi India 74.21 Nanyu 32 Tokyo Japan 99.63 Maychan 16 New York US 47.28 Mike 17 las vegas US>
Iepriekš minētajā piemērā mēs iestatām kolonnu ' Agg_Marks ' kā datu rāmja indekss.
Pandas datu rāmja indeksa iestatījums trīs kolonnas kā MultiIndex
Šajā piemērā tālāk norādītais kods izmanto Pandas, lai izveidotu DataFrame “df” no skolēnu datiem ar kolonnām “Vārds”, “Vecums”, “Pilsēta”, “Valsts”, “Agg_Marks” un “ID”. Tas izmanto funkciju 'set_index()', lai izveidotu vairāku līmeņu indeksu, izmantojot 'Nosaukums', 'Pilsēta' un 'ID', un pēc tam tiek parādīts iegūtais DataFrame.
Python3
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>,>400>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>,>750>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>,>101>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>,>900>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>,>420>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>,>555>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>,>'ID'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # Here we pass list of 3 columns i.e 'Name', 'City' and 'ID'> # to dataframe.set_index() function> # to set them as multiIndex of dataframe> df>=> df.set_index([>'Name'>,>'City'>,>'ID'>])> # Displaying the Data frame> df> |
mylivecricket.in
>
>
Izvade:
Age Country Agg_Marks Name City ID jack Sydeny 400 34 Australia 85.96 Riti Delhi 750 30 India 95.20 Vansh Delhi 101 31 India 85.25 Nanyu Tokyo 900 32 Japan 74.21 Maychan New York 420 16 US 99.63 Mike las vegas 555 17 US 47.28>
Iepriekš minētajā piemērā mēs iestatām kolonnas ' Vārds ',' Pilsēta ', un ' ID ' kā datu rāmja vairāku indeksu.
Pandas Iestatiet noteiktas kolonnas indeksu
Šajā piemērā tālāk redzamais kods parāda, kā izmantot Pandas, lai izveidotu DataFrame, kā indeksu iestatīt noteiktu kolonnu (šajā gadījumā 'Nosaukums'), izmantojotset_index()>metodi un pēc tam parāda gan sākotnējo, gan modificēto DataFrames. Theinplace=True>parametrs nodrošina, ka izmaiņas tiek lietotas tieši DataFrame bez nepieciešamības tos atkārtoti piešķirt.
Python3
import> pandas as pd> # Creating a sample DataFrame> data>=> {>'Name'>: [>'Geek1'>,>'Geek2'>,>'Geek3'>],> >'Age'>: [>25>,>30>,>35>],> >'City'>: [>'New York'>,>'San Francisco'>,>'Los Angeles'>]}> df>=> pd.DataFrame(data)> # Displaying the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using set_index() to set 'Name' column as the index> df.set_index(>'Name'>, inplace>=>True>)> # Displaying the DataFrame after setting the index> print>(>'
DataFrame after set_index:'>)> print>(df)> |
>
>
Izvade:
Original DataFrame: Name Age City 0 Geek1 25 New York 1 Geek2 30 San Francisco 2 Geek3 35 Los Angeles DataFrame after set_index: Age City Name Geek1 25 New York Geek2 30 San Francisco Geek3 35 Los Angeles>