Jaunu kolonnu pievienošana esošajam DataFrame ir pamatuzdevums datu analīzē Pandas . Tas ļauj bagātināt datus ar papildu informāciju un atvieglot turpmāku analīzi un manipulācijas. Šajā rakstā tiks aplūkotas dažādas jaunu kolonnu pievienošanas metodes, tostarp vienkārša piešķiršanainsert()>metode,assign()>metodi. Apspriedīsim jaunu kolonnu pievienošanu Pandas esošajam DataFrame.
Kas ir Pandas DataFrame?
A Pandas DataFrame ir divdimensiju, izmēru mainīga, potenciāli neviendabīga tabulu datu struktūra ar iezīmētām asīm (rindām un kolonnām). Tā ir pamatdatu struktūra Python datu zinātnes ekosistēmā un nodrošina jaudīgu veidu, kā strādāt ar tabulas datiem.
Šeit ir dažas galvenās Pandas DataFrame funkcijas:
- Datu attēlojums: Saglabā datus tabulas formātā ar rindām un kolonnām.
- Heterogēni datu veidi: Var saturēt dažādus datu tipus dažādās kolonnās (piem., veseli skaitļi, pludiņi, virknes, Būla vērtības).
- Marķēšana: Katrai rindai un kolonnai ir etiķete (indeksa un kolonnu nosaukumi).
- Maināms: Ļauj apstrādāt un modificēt datus.
- Spēcīgas operācijas: Nodrošina dažādas funkcijas un metodes datu analīzei, manipulācijai un izpētei.
- Paplašināms: Var pielāgot un paplašināt ar papildu funkcijām, izmantojot bibliotēkas un lietotāja definētas funkcijas.
Ir vairāki veidi, kā pievienot jaunu kolonnu esošajam datu rāmim programmā Pandas Python :
- Datu rāmja parauga izveide
- Izmantojot Dataframe.insert() metodi
- Izmantojot Dataframe.assign() metodi
- Izmantojot vārdnīcu
- Izmantojot sarakstu
- Izmantojot .place()
- Vairāk nekā vienas kolonnas pievienošana esošajam datu kadram
Datu rāmja parauga izveide
Šeit mēs izveidojam datu rāmja paraugu:
Python3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> print>(df)> |
>
>
Izvade:
Name Height Qualification 0 Jai 5.1 Msc 1 Princi 6.2 MA 2 Gaurav 5.1 Msc 3 Anuj 5.2 Msc>
Ņemiet vērā, ka jūsu saraksta garumam ir jāatbilst indeksa kolonnas garumam, pretējā gadījumā tiks parādīta kļūda.
Pievienojiet jaunu kolonnu esošam datu kadram, izmantojot DataFrame.insert()
Tas dod brīvību pievienot kolonnu jebkurā vietā, kas mums patīk, nevis tikai beigās. Tas nodrošina arī dažādas kolonnu vērtību ievietošanas iespējas.
Python3
import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(>2>,>'Age'>, [>21>,>23>,>24>,>21>],>True>)> # Observe the result> print>(df)> |
>
>
Izvade:
Name Height Age Qualification 0 Jai 5.1 21 Msc 1 Princi 6.2 23 MA 2 Gaurav 5.1 24 Msc 3 Anuj 5.2 21 Msc>
Kolonnu pievienošana Pandas DataFrame, izmantojot Dataframe.assign()
Šī metode izveidos jaunu datu rāmi ar jaunu kolonnu, kas pievienota vecajam datu rāmis.
Python3
import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2>=> df.assign(address>=>[>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>])> print>(df2)> |
>
>
Izvade:
Name Height Qualification address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Pandas pievieno kolonnu DataFrame, izmantojot vārdnīcu
Mēs varam izmantot a Python vārdnīca lai pandas DataFrame pievienotu jaunu kolonnu. Izmantojiet esošu kolonnu kā galvenās vērtības, un to attiecīgās vērtības būs jaunas kolonnas vērtības.
Python3
# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address>=> {>'Delhi'>:>'Jai'>,>'Bangalore'>:>'Princi'>,> >'Patna'>:>'Gaurav'>,>'Chennai'>:>'Anuj'>}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Provide 'Address' as the column name> df[>'Address'>]>=> address> # Observe the output> print>(df)> |
>
java nemainīgs saraksts
>
Izvade:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Jaunas kolonnas pievienošana Pandas DataFrame, izmantojot sarakstu
Šajā piemērā Pandas pievieno jaunas kolonnas no saraksta Adrese esošam Pandas DataFrame, izmantojot vārdnīcu un sarakstu.
Python3
# Declare a list that is to be converted into a column> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Using 'Address' as the column name> # and equating it to the list> df[>'Address'>]>=> address> print>(df)> |
>
>
Izvade:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Pievienojiet jaunu kolonnu esošajam Pandas DataFrame, izmantojot Dataframe.loc()
Šajā piemērā tas izveido Pandas DataFrame ar nosaukumudf>ar kolonnām Vārds, Augums un Kvalifikācija un pievieno jaunu kolonnu Adrese, izmantojotloc>atribūts.
Python3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> # Create the list of new column values> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Add the new column using loc> df.loc[:,>'Address'>]>=> address> print>(df)> |
>
>
Izvade:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Vairāk nekā vienas kolonnas pievienošana esošajam datu kadram
Šajā piemērā tas paplašina esošu Pandas DataFramedf>ar divām jaunām kolonnām Vecums un Valsts, izmantojot attiecīgos datu sarakstus.
Python3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>],> >'Address'>: [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]}> df>=> pd.DataFrame(data)> # Define new data for additional columns> age>=> [>22>,>25>,>23>,>24>]> state>=> [>'NCT'>,>'Karnataka'>,>'Tamil Nadu'>,>'Bihar'>]> # Add multiple columns using dictionary assignment> new_data>=> {>'Age'>: age,>'State'>: state }> df>=> df.assign(>*>*>new_data)> print>(df)> |
>
>
Izvade:
Name Height Qualification Address Age State 0 Jai 5.1 Msc Delhi 22 NCT 1 Princi 6.2 MA Bangalore 25 Karnataka 2 Gaurav 5.1 Msc Chennai 23 Tamil Nadu 3 Anuj 5.2 Msc Patna 24 Bihar>
Secinājums
Izpratne par to, kā DataFrames pievienot jaunas kolonnas, ir būtiska datu izpētei un manipulācijām Pandas. Piemērotas metodes izvēle ir atkarīga no konkrētā konteksta un vēlamā rezultāta. Apgūstot šīs metodes, varat efektīvi manipulēt, analizēt un gūt vērtīgu ieskatu no saviem datiem.