# Manejo de archivos CSV

El archivo CSV es un estándar ampliamente usado para exportar información, como por ejemplo desde una base de datos o un archivo Excel, CSV traduce comma separated values (valores separados por comas) y su estructura consiste en que cada línea representa un registro y cada valor despues de una coma es una columna.

para poder operar con archivos CSV vamos a usar el módulo de Python que nos permite manipular y crear objetos que son capces abstraer todo el proceso de manipualr estos archivos por nostros.

el modulo se llama **csv** y debe de ser importado para poder usarlo, por defecto viene en el core de Python, y este módulo pone a nuestra disposición funciones que nos permiten crear un escritor o lector según sea el caso. estas funciones son

- ``csv.reader (csvfile, dialect='excel', **fmtparams)``
- ``csv.writer (csvfile, dialect='excel', **fmtparams)``
- ``csv.list_dialects()``

en donde ``csvfile`` es el path o archivo en donde se escribira/leera el contenido, el ``dialect`` es una variable que le permite al archivo saber en que formato esta trabajando, por defecto esta **excel** pero este puede ser cambiado por uno dentro de la lista que entrega ``list_dialects()``.

In [2]:
import csv

csv.list_dialects()


['excel', 'excel-tab', 'unix']

# CSV Writer

esta función nos retornara un Objeto que nos permite escribir archivos CSV, ya sea creadolos o editando algunos ya creados, y esta clase tiene los siguientes métodos

- ``csvwriter.writerow(row)`` = Write the row parameter to the writer’s file object, formatted according to the current dialect.
- ``csvwriter.writerows(rows)`` = Write all elements in rows (an iterable of row objects as described above) to the writer’s file object, formatted according to the current dialect.
- ``csvwriter.dialect`` = A read-only description of the dialect in use by the writer.}

Veamos el uso de esta función

In [3]:
print('Crearting CSV file')
with open('sample.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(['She Loves You', 'Sept 1963'])
    writer.writerow(['I Want to Hold Your Hand', 'Dec 1963'])
    writer.writerow(['Cant Buy Me Love', 'Apr 1964'])
    writer.writerow(['A Hard Days Night', 'July 1964'])

Crearting CSV file


# Writer CSV 

Para escribir un archivo CSV debemos de usar la función ``csv.reader()`` la cual pone a nuestra disposición los siguientes métodos y atributos

- `csvreader.dialect` = A read-only description of the dialect in use by the parser.
- `csvreader.line_num` = The number of lines read from the source iterator. This is not the same as the number of records returned, as records can span multiple lines.

veamos un ejemplo de uso

In [4]:
print('Starting to read csv file')
with open('sample.csv', newline='') as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        print(*row, sep=', ')
print('Done Reading')


Starting to read csv file
She Loves You, Sept 1963
I Want to Hold Your Hand, Dec 1963
Cant Buy Me Love, Apr 1964
A Hard Days Night, July 1964
Done Reading


# Crear archivos CSV con ayuda de diccionarios

Por lo general los archivos CSV deben de registrar datos relacionados con algo, por lo general esta relación se especifica con las llaves que son los encabezados del archivo, afortunadamente **csv** nos permite manipular los archivos en función de estas llaves, y es con ayuda de las clases **CSV DictWriter** y **CSV DictReader** que se crean con ayuda de

- ``csv.DictWriter()``
- ``csv.DictReader()``

veamos como usar estos dos objetos

In [8]:
import csv
with open('names.csv', 'w', newline='') as csvfile:
    fieldnames = ['first_name', 'last_name', 'result']
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerow(
        {'first_name': 'John', 'last_name': 'Smith', 'result': 54}
    )
    writer.writerow(
        {'first_name': 'Jane', 'last_name': 'Lewis', 'result': 63}
    )
    writer.writerow(
        {'first_name': 'Chris', 'last_name': 'Davies', 'result': 72}
    )


en el código anterior podemos observar las diferencias de usar esta clase, y es que nos permite definir los encabezados del archivo siendo una lista de strings, los estrigns son los nombres de cada columna , en este caso 3 columnas, dicha lista se envia dentro del parámetro **fieldname** y se escriben en el archivo con el método ``writeheader()`` y al escribir una nueva columna podemos usar el mismo método ``writerow()`` pero esta vez pasamos como valor un diccionario y dentro del archivo solo se escribirán los datos que estan en las llaves definidas

> si una llave faltase, esta la dejaria vacia

de igual manera si queremos leer un archivo CSV con este tipo de estructura podemos usar la clase ``DictReader()`` cuyo único parámetro es el apth del archivo, veamos su uso

In [14]:
import csv

print('Starting to read dict CSV example')
with open('names.csv', newline='') as csvfile:
    reader = csv.DictReader(csvfile)
    
    for heading in reader.fieldnames:
        print(heading, end=' ')

    print('\n', '-'* 30, sep='')
    for row in reader:
        print(row['first_name'], row['last_name'], row['result'])
    print('-'* 30)
    
print('Done')

Starting to read dict CSV example
first_name last_name result 
------------------------------
John Smith 54
Jane Lewis 63
Chris Davies 72
------------------------------
Done
