Unikālā () funkcija noņem visas kolonnas vērtību dublikātus un atgriež vienu vērtību vairākām vienādām vērtībām. Šajā rakstā mēs apspriedīsim, kā mēs varam iegūt unikālas vērtības no kolonnas Pandas DataFrame .
Pandas datu rāmja izveide ar dublētiem elementiem
Izveidojiet Pandas datu rāmja paraugu ar sarakstu vārdnīcu, piemēram, kolonnu nosaukumi A, B, C, D un E ar dublētiem elementiem.
Python3
# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> |
>
ja vēl bash čaulā
>

Iegūstiet unikālas vērtības no Pandas DataFrame kolonnas
Tālāk ir sniegti daži piemēri, ar kuriem mēs varam iegūt unikālās kolonnas vērtības šajā datu rāmī.
- Iegūstiet slejas “B” unikālās vērtības
- Iegūstiet kolonnas “E” unikālās vērtības
- Iegūstiet unikālo vērtību skaitu kolonnā
- Set() izmantošana, lai no kolonnas noņemtu dublētās vērtības
- Pandas.concat() un Unique() metožu izmantošana
- Izmantojot Series.drop_duplicates()
Iegūstiet slejas “B” unikālās vērtības
Šajā piemērā mēs izgūstam un drukājam unikālās vērtības no kolonnas “B”, izmantojot unique()> metodi. Rezultātā iegūtās unikālās vērtības ir['B1', 'B2', 'B3', 'B4']>.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()> |
js daudzrindu virkne
>
>
Izvade
array(['B1', 'B2', 'B3', 'B4'], dtype=object)>
Iegūstiet pandu unikālās vērtības kolonnā “E”.
Šajā piemērā mēs izveidojam pandas DataFrame no vārdnīcas un pēc tam izgūst unikālās vērtības no kolonnas “E”, izmantojotunique()>metodi. Rezultātā iegūtās unikālās vērtības ir['E1']>.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()> |
>
>
Izvade
array(['E1'], dtype=object)>
Iegūstiet unikālo vērtību skaitu kolonnā
Šajā piemērā mēs izveidojam pandas DataFrame no vārdnīcas un pēc tam aprēķina un izdrukā unikālo vērtību skaitu kolonnā “C”, izņemot NaN vērtības. Rezultāts ir 3, kas norāda, ka kolonnā “C” ir trīs unikālas vērtības.
Python3
javascript globālais mainīgais
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)> |
>
>
Izvade
3>
Noņemiet dublētās vērtības no kolonnas, izmantojot set()
Šajā piemērā mēs izveidojam pandas DataFrame no vārdnīcas un pēc tam izmanto set()>funkciju lai no kolonnas “C” iegūtu unikālas vērtības, novēršot dublikātus. Iegūtais komplekts,{'C1', 'C2', 'C3'}>, apzīmē unikālās vērtības kolonnā “C”.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)> |
>
>
Izvade
{'C1', 'C2', 'C3'}> Pandas.concat() un Unique() metožu izmantošana
Šajā piemērā mēs izveidojam pandas DataFrame no vārdnīcas un pēc tam savienojam unikālas vērtības no visām kolonnām, izmantojot pd.concat()> . Iegūtais NumPy masīvs, kad tas ir izdrukāts, parāda visas unikālās vērtības no kolonnām “A” līdz “E”.
bloķēt youtube reklāmas operētājsistēmā Android
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)> |
>
>
Izvade
['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>
Izmantojot Series.drop_duplicates()
Šajā piemērā mēs izveidojam pandas DataFrame no vārdnīcas un noņemam dublikātus no kolonnām “A” un “D”, izmantojot drop_duplicates()>metodi . Iegūtais DataFrame, kad tas ir izdrukāts, parāda unikālās vērtības kolonnās “A” un “D” ar NaN vērtībām, kurās no “D” tika noņemti dublikāti.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)> |
>
int virknē java
>
Izvade
A B C D E 0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>