Pandas DataFrame filtrēšana, izmantojot kolonnu vērtības, ir parasta darbība, izmantojot Python informāciju. Lai to panāktu, varat izmantot dažādas metodes un paņēmienus. Šeit ir vairāki veidi, kā filtrēt Pandas DataFrame, izmantojot kolonnu vērtības.
Šajā ziņojumā mēs redzēsim dažādus veidus, kā filtrēt Pandas Dataframe pēc kolonnu vērtībām. Pirmkārt, izveidosim datu rāmi:
Python3
# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe :
'>, dataframe)> |
>
>
Izvade:

Pandas Dataframe rindu atlase, pamatojoties uz konkrētu kolonnas vērtību, izmantojot operatoru “>”, “=”, “=”, “<=”, “!=”.
1. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā “Percentage” ir lielāka par 75, izmantojot [ ] .
Python3
# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>> > print>(>'
Result dataframe :
'>, rslt_df)> |
>
>
Izvade:

2. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā procentuālā daļa ir lielāka par 70, izmantojot vieta [ ] .
Python3
# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Izvade:

Atlasot tās Pandas Dataframe rindas, kuru kolonnas vērtība ir sarakstā, izmantojot tu () datu rāmja metode.
1. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā opciju sarakstā atrodas “Stream”, izmantojot [ ] .
Python3
options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Izvade:

2. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā opciju sarakstā atrodas “Stream”, izmantojot vieta [ ] .
Python
options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Izvade:

Pandas Dataframe rindu atlase, pamatojoties uz vairākiem kolonnu nosacījumiem, izmantojot operatoru “&”.
1. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā “Vecums” ir vienāds ar 22 un opciju sarakstā ir “Stream”, izmantojot [ ] .
Python3
options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Izvade:

2. piemērs: Atlasot visas rindas no dotā datu rāmja, kurā 'Vecums' ir vienāds ar 22 un 'Straume' atrodas opciju sarakstā, izmantojot vieta [ ] .
Python3
javatable
options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Izvade:
