Pandas sēriju var definēt kā viendimensionālu masīvu, kas spēj uzglabāt dažādus datu tipus. Mēs varam viegli pārvērst sarakstu, virkni un vārdnīcu sērijās, izmantojot sērija ' metode. Sēriju rindu etiķetes sauc par indeksu. Sērijā nedrīkst būt vairākas kolonnas. Tam ir šāds parametrs:
Sērijas izveide:
Mēs varam izveidot sēriju divos veidos:
- Izveidojiet tukšu sēriju
- Izveidojiet sēriju, izmantojot ievades.
Izveidojiet tukšu sēriju:
Pandas var viegli izveidot tukšu sēriju, kas nozīmē, ka tai nebūs nekādas vērtības.
Sintakse, kas tiek izmantota tukšas sērijas izveidošanai:
= pandas.Series()
Tālāk sniegtajā piemērā tiek izveidots tukšas sērijas tipa objekts, kuram nav vērtību un kuram ir noklusējuma datu tips, t.i., pludiņš64 .
javascript virknes apgriešana
Piemērs
import pandas as pd x = pd.Series() print (x)
Izvade
Series([], dtype: float64)
Sērijas izveide, izmantojot ievades:
Mēs varam izveidot sēriju, izmantojot dažādas ievades:
- Masīvs
- Dikts
- Skalārā vērtība
Sērijas izveide no masīva:
java metodes
Pirms sērijas izveides, pirmkārt, mums ir jāimportē nejutīgs moduli un pēc tam programmā izmantojiet funkciju array(). Ja dati ir ndarray, tad nodotajam indeksam ir jābūt vienāda garuma.
Ja mēs neizturam indeksu, tad pēc noklusējuma indekss diapazons(n) tiek nodots, kur n nosaka masīva garumu, t.i., [0,1,2,.... diapazons(len(masīvs))-1 ].
Piemērs
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Izvade
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Izveidojiet sēriju no dikta
Varam izveidot arī sēriju no dikta. Ja vārdnīcas objekts tiek nodots kā ievade un indekss nav norādīts, vārdnīcas atslēgas tiek ņemtas sakārtotā secībā, lai izveidotu indeksu .
Ja indekss ir nodots, vērtības, kas atbilst noteiktai etiķetei, indeksā tiks iegūtas no vārdnīca .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Izvade
x 0.0 y 1.0 z 2.0 dtype: float64
Izveidojiet sēriju, izmantojot skalāru:
Ja ņemam skalārās vērtības, tad ir jānorāda indekss. Skalārā vērtība tiks atkārtota, lai atbilstu indeksa garumam.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Izvade
0 4 1 4 2 4 3 4 dtype: int64
Piekļuve datiem no sērijas ar pozīciju:
Kad esat izveidojis sērijas tipa objektu, varat piekļūt tā indeksiem, datiem un pat atsevišķiem elementiem.
strep c
Sērijas datiem var piekļūt līdzīgi kā ndarray.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Izvade
1
Sērijas objektu atribūti
Atribūts Series tiek definēts kā jebkura informācija, kas saistīta ar Series objektu, piemēram, izmērs, datu tips. utt. Tālāk ir norādīti daži atribūti, kurus varat izmantot, lai iegūtu informāciju par sērijas objektu:
Atribūti | Apraksts |
---|---|
Series.index | Definē sērijas indeksu. |
Sērija.forma | Tas atgriež datu formas virkni. |
Series.dtype | Tas atgriež datu datu tipu. |
Sērija.izmērs | Tas atgriež datu lielumu. |
Sērija.tukša | Tas atgriež True, ja sērijas objekts ir tukšs, pretējā gadījumā atgriež false. |
Sērija.hasnans | Tas atgriež True, ja ir kādas NaN vērtības, pretējā gadījumā atgriež false. |
Series.nbytes | Tas atgriež baitu skaitu datos. |
Seriāls esmu | Tas atgriež dimensiju skaitu datos. |
Series.itemsize | Tas atgriež vienuma datu tipa lielumu. |
Sērijas objekta indeksu masīva un datu masīva izguve
Mēs varam izgūt esoša sērijas objekta indeksu masīvu un datu masīvu, izmantojot atribūtu indeksu un vērtības.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Izvade
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Izguves veidi (dtype) un veida lielums (vienuma izmērs)
Varat izmantot atribūtu dtype ar Series objektu kā dtype, lai izgūtu sērijas objekta atsevišķa elementa datu tipu, varat izmantot vienumus atribūts, lai parādītu katram datu vienumam piešķirto baitu skaitu.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Izvade
javascript daudzrindu virkne
int64 8 float64 8
Formas izgūšana
Sērijas objekta forma nosaka kopējo elementu skaitu, tostarp trūkstošās vai tukšās vērtības (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Izvade
(4,) (3,)
Dimensijas, lieluma un baitu skaita izgūšana:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Izvade
1 1 4 3 32 24
NaN tukšuma un klātbūtnes pārbaude
Lai pārbaudītu, vai sērijas objekts ir tukšs, varat izmantot tukšs atribūts . Tāpat, lai pārbaudītu, vai sērijas objekts satur dažas NaN vērtības, varat izmantot hasans atribūts.
testēšanas veidi
Piemērs
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Izvade
False False True True False False 4 3 3 3
Sērijas funkcijas
Sērijā tiek izmantotas dažas funkcijas, kas ir šādas:
Funkcijas | Apraksts |
---|---|
Pandas Series.map() | Kartē vērtības no divām sērijām, kurām ir kopīga kolonna. |
Pandas Series.std() | Aprēķiniet noteiktās skaitļu kopas, DataFrame, kolonnas un rindu standarta novirzi. |
Pandas Series.to_frame() | Konvertējiet sērijas objektu par datu rāmi. |
Pandas Series.value_counts() | Atgriež sēriju, kas satur unikālu vērtību skaitu. |