Pandas dataframe.corr() tiek izmantots, lai Python programmā Pandas Dataframe atrastu visu kolonnu pāru korelāciju. Jebkurš NaN vērtības tiek automātiski izslēgtas. Lai ignorētu vērtības, kas nav skaitliskas, izmantojiet parametru numeric_only = True. Šajā rakstā mēs uzzināsim par DataFrame.corr() metodi Python .
Pandas DataFrame corr() Metodes sintakse
Sintakse: DataFrame.corr(self, metode='pearson', min_periods=1, numeric_only = False)
Parametri:
- metode:
- Pearson: standarta korelācijas koeficients
- Kendall: Kendall Tau korelācijas koeficients
- spearman: Spīrmena ranga korelācija
- min_periods : Minimālais novērojumu skaits vienam kolonnu pārim, lai iegūtu derīgu rezultātu. Pašlaik pieejama tikai Pīrsona un Spīrmena korelācijai
- numeric_only: neatkarīgi no tā, vai ir jādarbojas tikai ar skaitliskām vērtībām. Pēc noklusējuma tas ir iestatīts uz False.
Atgriež: skaits :y : DataFrame
Pandas datu korelācijas corr() metode
Laba korelācija ir atkarīga no lietojuma, taču var droši teikt, ka jums ir vismaz 0,6 (vai -0,6), lai to nosauktu par labu korelāciju. Vienkāršs piemērs, lai parādītu, kā korelācija darbojas Python .
Python3
import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())> |
>
>
Izvade
cik liels ir mans monitors
Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>
Datu rāmja parauga izveide
Pirmo 10 datu rāmja rindu drukāšana.
Piezīme: Mainīgā korelācija ar sevi ir 1. Lai iegūtu saiti uz CSV failu, ko izmanto kodā, noklikšķiniet uz šeit
Python3
# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]> |
>
>
Izvade

Python Pandas DataFrame corr() metodes piemēri
Atrodiet korelāciju starp kolonnām, izmantojot Pīrsona metodi
Šeit mēs izmantojam funkciju corr (), lai atrastu korelāciju starp kolonnām Dataframe, izmantojot metodi “Pearson”. Mums datu ietvarā ir tikai četras ciparu kolonnas. Izvades Dataframe var interpretēt kā jebkurai šūnai, rindas mainīgā korelācija ar kolonnas mainīgo ir šūnas vērtība. Kā minēts iepriekš, mainīgā korelācija ar sevi ir 1. Šī iemesla dēļ visas diagonāles vērtības ir 1,00.
Python3
# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)> |
>
>
Izvade

Atrodiet korelāciju starp kolonnām, izmantojot Kendall metodi
Izmantojiet funkciju Pandas df.corr(), lai atrastu korelāciju starp kolonnām Dataframe, izmantojot 'kendall' metodi. Izvades Dataframe var interpretēt kā jebkurai šūnai, rindas mainīgā korelācija ar kolonnas mainīgo ir šūnas vērtība. Kā minēts iepriekš, mainīgā korelācija ar sevi ir 1. Šī iemesla dēļ visas diagonāles vērtības ir 1,00.
Python3
Linux kura komanda
# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)> |
>
>
Izvade
