logo

Python Pandas sērija

Pandas sēriju var definēt kā viendimensionālu masīvu, kas spēj uzglabāt dažādus datu tipus. Mēs varam viegli pārvērst sarakstu, virkni un vārdnīcu sērijās, izmantojot sērija ' metode. Sēriju rindu etiķetes sauc par indeksu. Sērijā nedrīkst būt vairākas kolonnas. Tam ir šāds parametrs:

    dati:Tas var būt jebkurš saraksts, vārdnīca vai skalāra vērtība.indekss:Indeksa vērtībai jābūt unikālai un jaukšanai. Tam jābūt tādam pašam kā datiem. Ja mēs neizturam nevienu indeksu, noklusējuma np.arrange(n) tiks izmantots.dtype:Tas attiecas uz sērijas datu tipu.kopija:To izmanto datu kopēšanai.

Sērijas izveide:

Mēs varam izveidot sēriju divos veidos:

  1. Izveidojiet tukšu sēriju
  2. Izveidojiet sēriju, izmantojot ievades.

Izveidojiet tukšu sēriju:

Pandas var viegli izveidot tukšu sēriju, kas nozīmē, ka tai nebūs nekādas vērtības.

Sintakse, kas tiek izmantota tukšas sērijas izveidošanai:

 = pandas.Series() 

Tālāk sniegtajā piemērā tiek izveidots tukšas sērijas tipa objekts, kuram nav vērtību un kuram ir noklusējuma datu tips, t.i., pludiņš64 .

javascript virknes apgriešana

Piemērs

 import pandas as pd x = pd.Series() print (x) 

Izvade

 Series([], dtype: float64) 

Sērijas izveide, izmantojot ievades:

Mēs varam izveidot sēriju, izmantojot dažādas ievades:

  • Masīvs
  • Dikts
  • Skalārā vērtība

Sērijas izveide no masīva:

java metodes

Pirms sērijas izveides, pirmkārt, mums ir jāimportē nejutīgs moduli un pēc tam programmā izmantojiet funkciju array(). Ja dati ir ndarray, tad nodotajam indeksam ir jābūt vienāda garuma.

Ja mēs neizturam indeksu, tad pēc noklusējuma indekss diapazons(n) tiek nodots, kur n nosaka masīva garumu, t.i., [0,1,2,.... diapazons(len(masīvs))-1 ].

Piemērs

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Izvade

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Izveidojiet sēriju no dikta

Varam izveidot arī sēriju no dikta. Ja vārdnīcas objekts tiek nodots kā ievade un indekss nav norādīts, vārdnīcas atslēgas tiek ņemtas sakārtotā secībā, lai izveidotu indeksu .

Ja indekss ir nodots, vērtības, kas atbilst noteiktai etiķetei, indeksā tiks iegūtas no vārdnīca .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Izvade

 x 0.0 y 1.0 z 2.0 dtype: float64 

Izveidojiet sēriju, izmantojot skalāru:

Ja ņemam skalārās vērtības, tad ir jānorāda indekss. Skalārā vērtība tiks atkārtota, lai atbilstu indeksa garumam.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Izvade

 0 4 1 4 2 4 3 4 dtype: int64 

Piekļuve datiem no sērijas ar pozīciju:

Kad esat izveidojis sērijas tipa objektu, varat piekļūt tā indeksiem, datiem un pat atsevišķiem elementiem.

strep c

Sērijas datiem var piekļūt līdzīgi kā ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Izvade

 1 

Sērijas objektu atribūti

Atribūts Series tiek definēts kā jebkura informācija, kas saistīta ar Series objektu, piemēram, izmērs, datu tips. utt. Tālāk ir norādīti daži atribūti, kurus varat izmantot, lai iegūtu informāciju par sērijas objektu:

Atribūti Apraksts
Series.index Definē sērijas indeksu.
Sērija.forma Tas atgriež datu formas virkni.
Series.dtype Tas atgriež datu datu tipu.
Sērija.izmērs Tas atgriež datu lielumu.
Sērija.tukša Tas atgriež True, ja sērijas objekts ir tukšs, pretējā gadījumā atgriež false.
Sērija.hasnans Tas atgriež True, ja ir kādas NaN vērtības, pretējā gadījumā atgriež false.
Series.nbytes Tas atgriež baitu skaitu datos.
Seriāls esmu Tas atgriež dimensiju skaitu datos.
Series.itemsize Tas atgriež vienuma datu tipa lielumu.

Sērijas objekta indeksu masīva un datu masīva izguve

Mēs varam izgūt esoša sērijas objekta indeksu masīvu un datu masīvu, izmantojot atribūtu indeksu un vērtības.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Izvade

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Izguves veidi (dtype) un veida lielums (vienuma izmērs)

Varat izmantot atribūtu dtype ar Series objektu kā dtype, lai izgūtu sērijas objekta atsevišķa elementa datu tipu, varat izmantot vienumus atribūts, lai parādītu katram datu vienumam piešķirto baitu skaitu.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Izvade

javascript daudzrindu virkne
 int64 8 float64 8 

Formas izgūšana

Sērijas objekta forma nosaka kopējo elementu skaitu, tostarp trūkstošās vai tukšās vērtības (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Izvade

 (4,) (3,) 

Dimensijas, lieluma un baitu skaita izgūšana:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Izvade

 1 1 4 3 32 24 

NaN tukšuma un klātbūtnes pārbaude

Lai pārbaudītu, vai sērijas objekts ir tukšs, varat izmantot tukšs atribūts . Tāpat, lai pārbaudītu, vai sērijas objekts satur dažas NaN vērtības, varat izmantot hasans atribūts.

testēšanas veidi

Piemērs

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Izvade

 False False True True False False 4 3 3 3 

Sērijas funkcijas

Sērijā tiek izmantotas dažas funkcijas, kas ir šādas:

Funkcijas Apraksts
Pandas Series.map() Kartē vērtības no divām sērijām, kurām ir kopīga kolonna.
Pandas Series.std() Aprēķiniet noteiktās skaitļu kopas, DataFrame, kolonnas un rindu standarta novirzi.
Pandas Series.to_frame() Konvertējiet sērijas objektu par datu rāmi.
Pandas Series.value_counts() Atgriež sēriju, kas satur unikālu vērtību skaitu.