logo

Pandas DataFrame corr() metode

Pandas dataframe.corr() tiek izmantots, lai Python programmā Pandas Dataframe atrastu visu kolonnu pāru korelāciju. Jebkurš NaN vērtības tiek automātiski izslēgtas. Lai ignorētu vērtības, kas nav skaitliskas, izmantojiet parametru numeric_only = True. Šajā rakstā mēs uzzināsim par DataFrame.corr() metodi Python .

Pandas DataFrame corr() Metodes sintakse

Sintakse: DataFrame.corr(self, metode='pearson', min_periods=1, numeric_only = False)



Parametri:

  • metode:
    • Pearson: standarta korelācijas koeficients
    • Kendall: Kendall Tau korelācijas koeficients
    • spearman: Spīrmena ranga korelācija
  • min_periods : Minimālais novērojumu skaits vienam kolonnu pārim, lai iegūtu derīgu rezultātu. Pašlaik pieejama tikai Pīrsona un Spīrmena korelācijai
  • numeric_only: neatkarīgi no tā, vai ir jādarbojas tikai ar skaitliskām vērtībām. Pēc noklusējuma tas ir iestatīts uz False.

Atgriež: skaits :y : DataFrame

Pandas datu korelācijas corr() metode

Laba korelācija ir atkarīga no lietojuma, taču var droši teikt, ka jums ir vismaz 0,6 (vai -0,6), lai to nosauktu par labu korelāciju. Vienkāršs piemērs, lai parādītu, kā korelācija darbojas Python .



Python3






import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

>

>

Izvade

cik liels ir mans monitors
 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Datu rāmja parauga izveide

Pirmo 10 datu rāmja rindu drukāšana.

Piezīme: Mainīgā korelācija ar sevi ir 1. Lai iegūtu saiti uz CSV failu, ko izmanto kodā, noklikšķiniet uz šeit

Python3




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

>

>

Izvade

Pandas datu korelācijas

Python Pandas DataFrame corr() metodes piemēri

Atrodiet korelāciju starp kolonnām, izmantojot Pīrsona metodi

Šeit mēs izmantojam funkciju corr (), lai atrastu korelāciju starp kolonnām Dataframe, izmantojot metodi “Pearson”. Mums datu ietvarā ir tikai četras ciparu kolonnas. Izvades Dataframe var interpretēt kā jebkurai šūnai, rindas mainīgā korelācija ar kolonnas mainīgo ir šūnas vērtība. Kā minēts iepriekš, mainīgā korelācija ar sevi ir 1. Šī iemesla dēļ visas diagonāles vērtības ir 1,00.

Python3




# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

>

>

Izvade

Pandas datu korelācijas

Atrodiet korelāciju starp kolonnām, izmantojot Kendall metodi

Izmantojiet funkciju Pandas df.corr(), lai atrastu korelāciju starp kolonnām Dataframe, izmantojot 'kendall' metodi. Izvades Dataframe var interpretēt kā jebkurai šūnai, rindas mainīgā korelācija ar kolonnas mainīgo ir šūnas vērtība. Kā minēts iepriekš, mainīgā korelācija ar sevi ir 1. Šī iemesla dēļ visas diagonāles vērtības ir 1,00.

Python3

Linux kura komanda




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

>

>

Izvade

dataframe.corr