logo

Pandas DataFrame.loc[] metode

Pandas DataFrame ir divdimensiju izmēra mainīga, potenciāli neviendabīga tabulu datu struktūra ar marķētām asīm (rindām un kolonnām). Aritmētiskās darbības tiek izlīdzinātas gan rindu, gan kolonnu etiķetēs. To var uzskatīt par diktam līdzīgu konteineru sērijas objektiem. Šī ir primārā datu struktūra Pandas .

Pandas DataFrame loc[] Sintakse

Pandas DataFrame.loc atribūts piekļūst rindu un kolonnu grupai pēc etiķetes(-ēm) vai Būla masīva dotajā Pandas DataFrame .



Sintakse: DataFrame.loc

Parametrs: Nav

Atgriešanās: Skalārs, sērija, datu rāmis



Pandas DataFrame lokācijas īpašums

Tālāk ir sniegti daži piemēri, kā mēs varam izmantot Pandas DataFrame loc[]:

1. piemērs: Atlasiet vienu rindu un kolonnu pēc etiķetes, izmantojot loc[]

Izmantojiet DataFrame.loc atribūtu, lai piekļūtu noteiktai šūnai dotajā Pandas datu rāmis izmantojot indeksa un kolonnu etiķetes. Pēc tam mēs atlasām vienu rindu un kolonnu pēc etiķetes, izmantojot loc[].

Python3






# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'Weight'>: [>45>,>88>,>56>,>15>,>71>],> >'Name'>: [>'Sam'>,>'Andrea'>,>'Alex'>,>'Robin'>,>'Kia'>],> >'Age'>: [>14>,>25>,>55>,>8>,>21>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Corrected selection using loc for a specific cell> result>=> df.loc[>'Row_2'>,>'Name'>]> # Print the result> print>(>' Selected Value at Row_2, Column 'Name':'>)> print>(result)>

>

nejaušs skaitlis Java

>

Izvade

Original DataFrame:  Weight Name Age Row_1 45 Sam 14 Row_2 88 Andrea 25 Row_3 56 Alex 55 Row_4 15 Robin 8 Row_5 71 Kia 21 Selected Value at Row_2, Column 'Name': Andrea>

2. piemērs: Atlasiet vairākas rindas un kolonnas

Izmantojiet atribūtu DataFrame.loc, lai atgrieztu divas kolonnas dotajā Dataframe un pēc tam atlasītu vairākas rindas un kolonnas, kā tas izdarīts tālāk esošajā piemērā.

Python3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>:[>12>,>4>,>5>,>None>,>1>],> >'B'>:[>7>,>2>,>54>,>3>,>None>],> >'C'>:[>20>,>16>,>11>,>3>,>8>],> >'D'>:[>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Corrected column names ('A' and 'D') in the result> result>=> df.loc[:, [>'A'>,>'D'>]]> # Print the result> print>(>' Selected Columns 'A' and 'D':'>)> print>(result)>

virkne n java

>

>

Izvade

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Columns 'A' and 'D':  A D Row_1 12.0 14.0 Row_2 4.0 3.0 Row_3 5.0 NaN Row_4 NaN 2.0 Row_5 1.0 6.0>

3. piemērs: atlasiet starp divām rindām vai kolonnām

Šajā piemērā mēs izveidojam pandas DataFrame ar nosaukumu “df”, iestatām pielāgotus rindu indeksus un pēc tam izmantojamloc>Piekļuvējs, lai atlasītu rindas starp “Rinda_2” un “Rinda_4”, ieskaitot, un kolonnas “B” līdz “D”. Atlasītās rindas un kolonnas tiek izdrukātas, demonstrējot uz etiķetēm balstītas indeksācijas izmantošanu arloc>.

Python3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Select Rows Between 'Row_2' and 'Row_4'> selected_rows>=> df.loc[>'Row_2'>:>'Row_4'>]> print>(>' Selected Rows:'>)> print>(selected_rows)> # Select Columns 'B' through 'D'> selected_columns>=> df.loc[:,>'B'>:>'D'>]> print>(>' Selected Columns:'>)> print>(selected_columns)>

>

cp komanda Linux

>

Izvade

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Rows:  A B C D Row_2 4 2 16 3.0 Row_3 5 54 11 NaN Row_4 NaN 3 3 2.0 Selected Columns:  B C D Row_1 7 20 14.0 Row_2 2 16 3.0 Row_3 54 11 NaN Row_4 3 3 2.0 Row_5 NaN 8 6.0>

4. piemērs: atlasiet Alternatīvās rindas vai kolonnas

Šajā piemērā mēs izveidojam pandas DataFrame ar nosaukumu “df”, iestatām pielāgotus rindu indeksus un pēc tam izmantojamiloc>piekļuvējs, lai atlasītu alternatīvās rindas (katru otro rindu) un alternatīvās kolonnas (katru otro kolonnu). Iegūtās atlases tiek izdrukātas, demonstrējot uz veseliem skaitļiem balstītas indeksācijas izmantošanu ariloc>.

Python3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Select Alternate Rows> alternate_rows>=> df.iloc[::>2>]> print>(>' Alternate Rows:'>)> print>(alternate_rows)> # Select Alternate Columns> alternate_columns>=> df.iloc[:, ::>2>]> print>(>' Alternate Columns:'>)> print>(alternate_columns)>

>

>

Izvade

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Alternate Rows:  A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Row_5 1.0 NaN 8 6.0 Alternate Columns:  A C Row_1 12.0 20 Row_2 4.0 16 Row_3 5.0 11 Row_4 NaN 3 Row_5 1.0 8>

5. piemērs: Nosacījumu izmantošana ar Pandas loc

Šajā piemērā mēs izveidojam pandas DataFrame ar nosaukumu “df”, iestatām pielāgotus rindu indeksus un izmantojamloc>piekļuvējs, lai atlasītu rindas, pamatojoties uz nosacījumiem. Tas parāda rindu atlasi, kur kolonnas “A” vērtības ir lielākas par 5, un rindu atlasi, kurās kolonna “B” nav nulles vērtība. Pēc tam tiek izdrukātas iegūtās atlases, demonstrējot nosacītās filtrēšanas izmantošanu arloc>.

publiskā vs privātā java

Python3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using Conditions with loc> # Example: Select rows where column 'A' is greater than 5> selected_rows>=> df.loc[df[>'A'>]>>>]> print>(>' Rows where column 'A' is greater than 5:'>)> print>(selected_rows)> # Example: Select rows where column 'B' is not null> non_null_rows>=> df.loc[df[>'B'>].notnull()]> print>(>' Rows where column 'B' is not null:'>)> print>(non_null_rows)>

>

>

Izvade

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Rows where column 'A' is greater than 5:  A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Rows where column 'B' is not null:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0>