logo

Veidi, kā filtrēt Pandas DataFrame pēc kolonnu vērtībām

Pandas DataFrame filtrēšana, izmantojot kolonnu vērtības, ir parasta darbība, izmantojot Python informāciju. Lai to panāktu, varat izmantot dažādas metodes un paņēmienus. Šeit ir vairāki veidi, kā filtrēt Pandas DataFrame, izmantojot kolonnu vērtības.

Šajā ziņojumā mēs redzēsim dažādus veidus, kā filtrēt Pandas Dataframe pēc kolonnu vērtībām. Pirmkārt, izveidosim datu rāmi:



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Izvade:

Datu rāmis

Pandas Dataframe rindu atlase, pamatojoties uz konkrētu kolonnas vērtību, izmantojot operatoru “>”, “=”, “=”, “<=”, “!=”.

1. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā “Percentage” ir lielāka par 75, izmantojot [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Izvade:

izvades datu rāmis

2. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā procentuālā daļa ir lielāka par 70, izmantojot vieta [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Izvade:

izvades datu rāmis-1

Atlasot tās Pandas Dataframe rindas, kuru kolonnas vērtība ir sarakstā, izmantojot tu () datu rāmja metode.

1. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā opciju sarakstā atrodas “Stream”, izmantojot [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Izvade:

izvades datu rāmis-2

2. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā opciju sarakstā atrodas “Stream”, izmantojot vieta [ ] .

Python




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Izvade:

izvades datu rāmis-3

Pandas Dataframe rindu atlase, pamatojoties uz vairākiem kolonnu nosacījumiem, izmantojot operatoru “&”.

1. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā “Vecums” ir vienāds ar 22 un opciju sarakstā ir “Stream”, izmantojot [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Izvade:

izvades datu rāmis-4

2. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā 'Vecums' ir vienāds ar 22 un 'Straume' atrodas opciju sarakstā, izmantojot vieta [ ] .

Python3




javatable

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Izvade:

izvades datu rāmis-5