IEGŪSTIET UNIKĀLAS VĒRTĪBAS NO PANDAS DATAFRAME KOLONNAS

Unikālā () funkcija noņem visas kolonnas vērtību dublikātus un atgriež vienu vērtību vairākām vienādām vērtībām. Šajā rakstā mēs apspriedīsim, kā mēs varam iegūt unikālas vērtības no kolonnas Pandas DataFrame .

Pandas datu rāmja izveide ar dublētiem elementiem

Izveidojiet Pandas datu rāmja paraugu ar sarakstu vārdnīcu, piemēram, kolonnu nosaukumi A, B, C, D un E ar dublētiem elementiem.

Python3

# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)>

ja vēl bash čaulā

Tālāk ir sniegti daži piemēri, ar kuriem mēs varam iegūt unikālās kolonnas vērtības šajā datu rāmī.

Iegūstiet slejas “B” unikālās vērtības
Iegūstiet kolonnas “E” unikālās vērtības
Iegūstiet unikālo vērtību skaitu kolonnā
Set() izmantošana, lai no kolonnas noņemtu dublētās vērtības
Pandas.concat() un Unique() metožu izmantošana
Izmantojot Series.drop_duplicates()

Iegūstiet slejas “B” unikālās vērtības

Šajā piemērā mēs izgūstam un drukājam unikālās vērtības no kolonnas “B”, izmantojot unique()> metodi. Rezultātā iegūtās unikālās vērtības ir['B1', 'B2', 'B3', 'B4']>.

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()>

js daudzrindu virkne

Izvade

array(['B1', 'B2', 'B3', 'B4'], dtype=object)>

Iegūstiet pandu unikālās vērtības kolonnā “E”.

Šajā piemērā mēs izveidojam pandas DataFrame no vārdnīcas un pēc tam izgūst unikālās vērtības no kolonnas “E”, izmantojotunique()>metodi. Rezultātā iegūtās unikālās vērtības ir['E1']>.

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()>

Izvade

array(['E1'], dtype=object)>

Iegūstiet unikālo vērtību skaitu kolonnā

Šajā piemērā mēs izveidojam pandas DataFrame no vārdnīcas un pēc tam aprēķina un izdrukā unikālo vērtību skaitu kolonnā “C”, izņemot NaN vērtības. Rezultāts ir 3, kas norāda, ka kolonnā “C” ir trīs unikālas vērtības.

Python3

javascript globālais mainīgais

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)>

Izvade

3>

Noņemiet dublētās vērtības no kolonnas, izmantojot set()

Šajā piemērā mēs izveidojam pandas DataFrame no vārdnīcas un pēc tam izmanto set()>funkciju lai no kolonnas “C” iegūtu unikālas vērtības, novēršot dublikātus. Iegūtais komplekts,{'C1', 'C2', 'C3'}>, apzīmē unikālās vērtības kolonnā “C”.

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)>

Izvade

{'C1', 'C2', 'C3'}>

Pandas.concat() un Unique() metožu izmantošana

Šajā piemērā mēs izveidojam pandas DataFrame no vārdnīcas un pēc tam savienojam unikālas vērtības no visām kolonnām, izmantojot pd.concat()> . Iegūtais NumPy masīvs, kad tas ir izdrukāts, parāda visas unikālās vērtības no kolonnām “A” līdz “E”.

bloķēt youtube reklāmas operētājsistēmā Android

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)>

Izvade

['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>

Izmantojot Series.drop_duplicates()

Šajā piemērā mēs izveidojam pandas DataFrame no vārdnīcas un noņemam dublikātus no kolonnām “A” un “D”, izmantojot drop_duplicates()>metodi . Iegūtais DataFrame, kad tas ir izdrukāts, parāda unikālās vērtības kolonnās “A” un “D” ar NaN vērtībām, kurās no “D” tika noņemti dublikāti.

Python3

# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)>

int virknē java

Izvade

   A B C D E   0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>