logo

Kā nomest vienu vai vairākas kolonnas Pandas Dataframe

Apspriedīsim, kā Pandas Dataframe nomest vienu vai vairākas kolonnas. Lai izdzēstu kolonnu no a Pandas DataFrame vai Pandas Dataframe vienu vai vairākas kolonnas var sasniegt vairākos veidos.

Pandas datu ietvarā nometiet vienu vai vairākas kolonnas

Ir dažādas metodes vienas vai vairāku kolonnu nomešanai Pandas Dataframe. Mēs apspriežam dažas vispārīgi izmantotās metodes vienas vai vairāku kolonnu nomešanai Pandas Dataframe, kas ir šādas:



  • Izmantojot df.drop() metodi
  • Izmantojot iloc[] Metode
  • Izmantojot df.ix() metodi
  • Izmantojot df.loc[] Metode
  • Iteratīvās metodes izmantošana
  • Izmantojot Dataframe.pop() Metode

Izveidojiet DataFrame

Vispirms mēs izveidojam vienkāršu Dataframe ar sarakstu vārdnīcu, teiksim, kolonnu nosaukumi ir A, B, C, D, E . Šajā rakstā mēs apskatīsim 6 dažādas metodes, kā izdzēst dažas kolonnas no Pandas DataFrame.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df>

Izvade:

 A B C D E   0   A1 B1 C1 D1 E1   1   A2 B2 C2 D2 E2   2   A3 B3 C3 D3 E3   3   A4 B4 C4 D4 E4   4   A5 B5 C5 D5 E5>



Datu rāmja nomešanas kolonna Pandas, izmantojot df.drop() metodi

1. piemērs: Šajā piemērā mēs noņemam noteiktas atsevišķas kolonnas, kā to izmanto tālāk norādītajā kodā Pandas lai izveidotu DataFrame no vārdnīcas, un pēc tam noņem kolonnu “A”, izmantojotdrop>metode araxis=1>. Tomēr ir svarīgi ņemt vērā, ka sākotnējais DataFrame (“df”) paliek nemainīgs, ja vieninplace=True>tiek izmantots parametrs vai rezultāts tiek piešķirts atpakaļ uz “df”.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove column name 'A' df.drop(['A'], axis=1)>

Izvade:

 B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>

2. piemērs: Šajā piemērā noņemiet noteiktas vairākas kolonnas, jo tālāk norādītais kods izmanto Pandas, lai izveidotu DataFrame no vārdnīcas, un pēc tam noņem kolonnas “C” un “D”, izmantojotdrop>metode araxis=1>. Tomēr ņemiet vērā, ka sākotnējais DataFrame (“df”) paliek nemainīgs, ja vien rezultāts netiek piešķirts atpakaļ vaiinplace=True>tiek izmantots. Alternatīvi to pašu darbību var veikt, izmantojotdf.drop(columns=['C', 'D'])>.



Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove two columns name is 'C' and 'D' df.drop(['C', 'D'], axis=1) # df.drop(columns =['C', 'D'])>

Izvade:

   A B E  0 A1 B1 E1 1 A2 B2 E2 2 A3 B3 E3 3 A4 B4 E4 4 A5 B5 E5>

3. piemērs: Šajā piemērā noņemiet kolonnas, pamatojoties uz kolonnu indeksu, jo tālāk norādītais kods izveido Pandas DataFrame no vārdnīcas un noņem trīs kolonnas ('A', 'E', 'C'), pamatojoties uz to indeksa pozīcijām, izmantojot metodi 'nomest' ar ' ass=1`. Tiek parādīts modificētais DataFrame, un izmaiņas tiek veiktas vietā (`inplace=True`).

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove three columns as index base df.drop(df.columns[[0, 4, 2]], axis=1, inplace=True) df>

Izvade:

   B D  0 B1 D1 1 B2 D2 2 B3 D3 3 B4 D4 4 B5 D5>

Datu rāmja nomešanas kolonnas Pandas, izmantojot df.iloc[] metodi

Šajā piemērā Dzēsiet kolonnas starp noteiktām sākuma un beigu kolonnām, jo ​​tālāk norādītajā kodā tiek izmantota Pandas, lai izveidotu DataFrame no vārdnīcas, un pēc tam noņem visas kolonnas starp kolonnu indeksiem 1–3, izmantojotdrop>metode araxis=1>. Izmaiņas tiek veiktas vietā (inplace=True>), un tiek parādīts modificētais DataFrame.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column index 1 to 3 df.drop(df.iloc[:, 1:3], inplace=True, axis=1) df>

Izvade:

 A D E 0 A1 D1 E1 1 A2 D2 E2 2 A3 D3 E3 3 A4 D4 E4 4 A5 D5 E5>

Pandas Drop Columns no Dataframe, izmantojot df.ix() metodi

Šajā piemērā Noņemiet kolonnas starp noteiktiem kolonnu nosaukumiem, kā tālāk norādītais kods, izmantojot Pandas, izveido DataFrame no vārdnīcas un noņem visas kolonnas starp kolonnu nosaukumiem “B” līdz “D”, izmantojotdrop>metode araxis=1>. Tomēr sākotnējais DataFrame (“df”) paliek nemainīgs, ja vien rezultāts netiek piešķirts atpakaļ vaiinplace=True>tiek izmantots.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.ix[:, 'B':'D'].columns, axis=1)>

Izvade:

 A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>

Pandas Drop Columns no Dataframe, izmantojot df.loc[] metodi

Šajā piemērā nometiet kolonnas starp noteiktiem kolonnu nosaukumiem kā zemāk koda lietojumi Pandas lai izveidotu DataFrame no vārdnīcas un pēc tam noņemtu visas kolonnas starp kolonnu nosaukumiem “B” un “D”, izmantojotdrop>metode araxis=1>. Modificētais DataFrame netiek piešķirts atpakaļ nevienam mainīgajam, un sākotnējais DataFrame paliek nemainīgs.

privāts pret publisko java
Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.loc[:, 'B':'D'].columns, axis=1)>

Izvade:

 A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>

Piezīme: Atšķirīgās loc() un iloc() ir iloc() izslēdz pēdējās kolonnas diapazona elementu.

Pandas nomet kolonnas no Datafram, izmantojot iteratīvo metodi

Šajā piemērā izdzēsiet kolonnas starp konkrētiem kolonnu nosaukumiem, jo ​​tālāk norādītais kods izveido Pandas DataFrame no a vārdnīca un atkārto tās kolonnas. Katrai kolonnai, ja kolonnas nosaukumā ir burts “A”, šī kolonna tiek dzēsta no DataFrame. Tiek parādīts iegūtais modificētais DataFrame.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) for col in df.columns: if 'A' in col: del df[col] df>

Izvade:

 B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>

Dataframe Drop Column Pandas, izmantojot Dataframe.pop() metodi

Šajā piemērā Noteiktas kolonnas noņemšana no DataFrame, jo kods parāda, kā noņemt konkrētu kolonnu (“B”) no Pandas DataFrame, kas izveidots no vārdnīcas. Tas izmanto pop> metodi, un tiek parādīts iegūtais modificētais DataFrame.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df.pop('B') df>

Izvade:

A C D E 0 A1 C1 D1 E1 1 A2 C2 D2 E2 2 A3 C3 D3 E3 3 A4 C4 D4 E4 4 A5 C5 D5 E5>