PANDAS SAPLUDINĀT - PANDAS APMĀCĪBA

Pandas sapludināt () tiek definēts kā process, kurā divas datu kopas tiek apvienotas vienā un rindu izlīdzināšana, pamatojoties uz kopējiem atribūtiem vai kolonnām. Tas ir ieejas punkts visām standarta datu bāzes savienošanas darbībām starp DataFrame objektiem:

Sintakse:

 pd.merge(left, right, how=&apos;inner&apos;, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)

Parametri:

DataFrame vai ar nosaukumu Series

{'left', 'right', 'outer', 'inner'}, noklusējuma 'inner'

pa kreisi:Tas izmanto tikai atslēgas no kreisā rāmja, līdzīgi kā SQL kreisais ārējais savienojums; saglabāt atslēgu secību.pa labi:Tas izmanto tikai atslēgas no labā kadra, līdzīgi kā SQL labās puses ārējais savienojums; saglabāt atslēgu secību.ārējais:Tas izmantoja abu kadru atslēgu savienojumu, kas ir līdzīgs SQL pilnam ārējam savienojumam; kārtot atslēgas leksikogrāfiski.iekšējais:Tas izmanto abu kadru taustiņu krustojumu, līdzīgi kā SQL iekšējais savienojums; saglabāt kreiso taustiņu secību.

etiķete vai saraksts

left_on:

etiķete vai saraksts, vai masīvs

bool, noklusējuma False

Korpuss no (str, str), noklusējuma ('_x', '_y')

bool, noklusējuma True

bool vai str, noklusējuma False

_apvienot

'left_only'novērojumiem, kuru sapludināšanas atslēga parādās tikai DataFrame “kreisajā pusē”, turpretī'tikai_pareizi'ir definēts novērojumiem, kuros sapludināšanas atslēga parādās tikai DataFrame “pa labi”,'abi'ja novērojuma sapludināšanas atslēga ir atrasta abos.

str, pēc izvēles

“one_to_one” vai “1:1”: tiek pārbaudīts, vai sapludināšanas atslēgas ir unikālas gan kreisajā, gan labajā datu kopā.
'one_to_many' vai '1:m': tā pārbauda, vai sapludināšanas atslēgas ir unikālas tikai kreisajā datu kopā.
'many_to_one' vai 'm:1': tā pārbauda, vai sapludināšanas atslēgas ir unikālas tikai pareizajā datu kopā.
'many_to_many' vai 'm:m': tas ir atļauts, bet neveicina pārbaudes.

1. piemērs: sapludiniet divus DataFrame uz atslēgas

 # import the pandas library import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;John&apos;, &apos;Parker&apos;, &apos;Smith&apos;, &apos;Parker&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;William&apos;, &apos;Albert&apos;, &apos;Tony&apos;, &apos;Allen&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;]}) print (left) print (right)

Izvade

 id Name subject_id 0 1 John sub1 1 2 Parker sub2 2 3 Smith sub4 3 4 Parker sub6 id Name subject_id 0 1 William sub2 1 2 Albert sub4 2 3 Tony sub3 3 4 Allen sub6

2. piemērs. Apvienojiet divus DataFrame vairākās atslēgās:

 import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Alex&apos;, &apos;Amy&apos;, &apos;Allen&apos;, &apos;Alice&apos;, &apos;Ayoung&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Billy&apos;, &apos;Brian&apos;, &apos;Bran&apos;, &apos;Bryce&apos;, &apos;Betty&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) print pd.merge(left,right,on=&apos;id&apos;)

Izvade

 id Name_x subject_id_x Name_y subject_id_y 0 1 John sub1 William sub2 1 2 Parker sub2 Albert sub4 2 3 Smith sub4 Tony sub3 3 4 Parker sub6 Allen sub6

TechCodeview

Pandas DataFrame.merge()

Sintakse:

Parametri:

1. piemērs: sapludiniet divus DataFrame uz atslēgas

2. piemērs. Apvienojiet divus DataFrame vairākās atslēgās: