logo

CSV failu lasīšana programmā Python

A CSV (komatatdalītās vērtības) fails ir vienkārša teksta dokumenta forma, kurā tabulas informācijas kārtošanai tiek izmantots noteikts formāts. CSV faila formāts ir ierobežots teksta dokuments, kas izmanto komatu, lai atšķirtu vērtības. Katra dokumenta rinda ir datu žurnāls. Katrs žurnāls sastāv no viena vai vairākiem laukiem, kas dalīti ar komatiem. Tas ir vispopulārākais failu formāts izklājlapu un datu bāzu importēšanai un eksportēšanai.

CSV faila lasīšana

Ir dažādi veidi, kā lasīt CSV failu Python kas izmanto vai nu CSV moduli, vai pandas bibliotēku.



  • csv modulis: CSV modulis ir viens no Python moduļiem, kas nodrošina klases tabulas informācijas lasīšanai un rakstīšanai CSV faila formātā.
  • pandu bibliotēka: Pandas bibliotēka ir viena no atvērtā pirmkoda Python bibliotēkām, kas nodrošina augstas veiktspējas, ērtas datu struktūras un datu analīzes rīkus un metodes Python programmēšanai.

CSV faila formāta lasīšana programmā Python:
Apsveriet tālāk norādīto CSV failu ar nosaukumu “Giants.CSV” :

Izmantojot csv.reader()

Sākumā CSV fails tiek atvērts, izmantojot atvērt () metode “r” režīmā (norāda lasīšanas režīmu, atverot failu), kas atgriež faila objektu, pēc tam tas tiek nolasīts, izmantojot CSV moduļa lasītāja () metodi, kas atgriež lasītāja objektu, kas atkārtojas visās norādītā CSV dokumenta rindās.
Piezīme: The 'ar' atslēgvārds tiek izmantots kopā ar metodi open(), jo tas vienkāršo izņēmumu apstrādi un automātiski aizver CSV failu.



mapes pārdēvēšana operētājsistēmā Linux

Piemērs: Šis kods nolasa un izdrukā CSV faila saturu ar nosaukumu ‘Giants.csv’ izmantojotcsv>modulis Python. Tas atver failu lasīšanas režīmā, nolasa rindiņas un izdrukā tās pa vienai, izmantojot afor>cilpa. The csv.reader()> funkcija tiek izmantota, lai nolasītu CSV failu, un dati no katras rindas tiek izdrukāti konsolē.

Python3






import> csv> with>open>(>'Giants.csv'>, mode>=>'r'>)as>file>:> >csvFile>=> csv.reader(>file>)> >for> lines>in> csvFile:> >print>(lines)>

iphone emocijzīmes Android tālrunī
>

>

Izvade:

['Organization', 'CEO', 'Established'] ['Alphabet', 'Sundar Pichai', '02-Oct-15'] ['Microsoft', 'Satya Nadella', '04-Apr-75'] ['Amazon', 'Jeff Bezos', '05-Jul-94']>

Izmantojot csv.DictReader() klasi

Tas ir līdzīgs iepriekšējai metodei, CSV fails vispirms tiek atvērts, izmantojot open() metode pēc tam to nolasa, izmantojot csv moduļa DictReader klasi, kas darbojas kā parasts lasītājs, bet CSV failā esošo informāciju attēlo vārdnīcā. Pati pirmā faila rinda sastāv no vārdnīcas taustiņiem.

Piemērs: Šis kods nolasa un izdrukā CSV faila ar nosaukumu “Giants.csv” saturu, izmantojotcsv>modulis arDictReader>. Tas atver failu lasīšanas režīmā, nolasa rindiņas un izdrukā tās pa vienai.csv.DictReader()>nolasa CSV failu un apstrādā pirmo rindu kā galvenes, izveidojot vārdnīcu katrai rindai, kurā galvenes vērtības ir atslēgas. Kods katru rindu izdrukā kā vārdnīcu, atvieglojot darbu ar strukturētiem CSV datiem.

Python3




kruskals algoritms

import> csv> with>open>(>'Giants.csv'>, mode>=>'r'>) as>file>:> >csvFile>=> csv.DictReader(>file>)> >for> lines>in> csvFile:> >print>(lines)>

>

>

Izvade:

OrderedDict ([('Organizācija', 'Alfabēts'), ('CEO', 'Sundar Pichai'), ('Dibināts', '02-15-15')])
OrderedDict ([('Organizācija', 'Microsoft'), ('CEO', 'Satya Nadella'), ('Dibināts', '04-Apr-75')])
OrderedDict ([('Organization', 'Amazon'), ('CEO', 'Jeff Bezos'), ('Established', '05-Jul-94')])

Izmantojot metodi pandas.read_csv().

Ir ļoti viegli un vienkārši lasīt CSV failu, izmantojot pandas bibliotēkas funkcijas. Šeit lasīt_csv() metodi Pandas bibliotēka tiek izmantota, lai nolasītu datus no CSV failiem.

Piemērs: Šis kods izmantopandas>bibliotēka, lai lasītu un parādītu CSV faila saturu ar nosaukumu ‘Giants.csv.’ Tas nolasa CSV failu un saglabā to kā DataFrame, izmantojot pandas.read_csv()> funkciju. Visbeidzot, tas izdrukā visu DataFrame, kas nodrošina strukturētu un tabulu CSV datu attēlojumu. Šī ir izplatīta pieeja, strādājot ar tabulu datiem programmā Python, kāpandas>piedāvā jaudīgus rīkus datu apstrādei un analīzei.

Python3

xdxd nozīme




import> pandas> csvFile>=> pandas.read_csv(>'Giants.csv'>)> print>(csvFile)>

>

string split bash
>

Izvade:

Organization CEO Established 0 Alphabet Sundar Pichai 02-Oct-15 1 Microsoft Satya Nadella 04-Apr-75 2 Amazon Jeff Bezos 05-Jul-94>

Piezīme: Lai uzzinātu vairāk par pandas.csv_read() noklikšķiniet šeit .