# Manejo de archivos CSV

Los archivos CSV ("Comma Separated Values", que significa "Valores separados por comas") es un formato de archivo utilizado para almacenar datos tabulares (organizado por columnas) en forma te texto plano. En un archivo CSV, cada línea representa una fila de datos y los valores de cada fila están separados por comas (por lo general, el delimitador es una coma pero es posible usar otros delimitadores como punto y coma o tabulación).

Es un tipo de archivo fácil de manejar, tanto para lectura como escritura, por lo que su uso es muy común. Existen muchas librerías científicas y de ingeniería en Python que retornan sus resultados en este formato.

Dentro de esta carpeta, tenemos un archivo csv llamado `data.csv`:

<img src="images/data.jpg" alt="Notas" width="700"/>

La primera línea, indica el nombre de cada columna. Las siguientes líneas son los datos.

## Lectura de archivos CSV

Para leer un archivo CSV, primro abriremos el archivo con el método `open()` y luego usaremos la librería `csv` para su lectura y escritura.

In [1]:
# Importamos la librería csv
import csv

In [2]:
with open('data.csv', 'r', newline='') as csv_file: # Abrimos el archivo CSV con el nombre csv_file
    # Usaremos el método 'reader' de la librería csv para la lectura del archivo
    # Pasamos como parámetro el archivo
    # Definimos el delimitador (para este caso, una coma)
    csv_reader = csv.reader(csv_file, delimiter=',', quotechar='|')

    # csv_reader es un objeto iterable donde cada elemento es una fila
    for row in csv_reader:
        print(row)

['Nombre', 'Apellido', 'Edad', 'Nota1', 'Nota2']
['Albert', 'Einstein', '22', '19', '20']
['Nikola', 'Testa', '20', '17', '20']
['Ada', 'Lovelace', '23', '20', '18']
['Alan', 'Turing', '19', '18', '19']


Observamos que cada fila está guardada en una lista.

En nuestro archivo, sabemos que la primera fila es el nombre de cada columna. La librería csv nos permite leer de una manerá más cómoda para estos casos usando la clase `DictReader()`:

In [3]:
with open('data.csv', 'r', newline='') as csv_file:
    csv_reader = csv.DictReader(csv_file)

    for row in csv_reader:
        print(row)

{'Nombre': 'Albert', 'Apellido': 'Einstein', 'Edad': '22', 'Nota1': '19', 'Nota2': '20'}
{'Nombre': 'Nikola', 'Apellido': 'Testa', 'Edad': '20', 'Nota1': '17', 'Nota2': '20'}
{'Nombre': 'Ada', 'Apellido': 'Lovelace', 'Edad': '23', 'Nota1': '20', 'Nota2': '18'}
{'Nombre': 'Alan', 'Apellido': 'Turing', 'Edad': '19', 'Nota1': '18', 'Nota2': '19'}


Ahora, cada fila está guardada en un diccionario, donde las llaves son los nombres de las columnas con sus valores correspondientes.

## Escritura de archivos

Ahora usaremos el método `writer` de la librería `csv` para escribir sobre un archivo CSV.

In [5]:
with open('output.csv', 'w', newline='') as csv_file:
    csv_writer = csv.writer(csv_file, delimiter=',')

    csv_writer.writerow(['Español', 'Inglés'])
    csv_writer.writerow(['Manzana', 'Apple'])
    csv_writer.writerow(['Naranja', 'Orange'])
    csv_writer.writerow(['Plátano', 'Banana'])

Para escribir una nueva fila dentro del archivo CSV, usamos el método `writerow()` y le pasamos como parámetro una lista.

El resultado obtenido es:

<img src="images/outputcsv.jpg" alt="Notas" width="700"/>

De manera similar a `DictReader()` tenemos otra clase llamada `DictWriter()` que nos permitirá escribir filas en forma de diccionarios dentro de un archivo CSV.

Imaginemos que queremos dar un reporte de promedio de notas de los estudiantes que se encuentran en el archivo `data.csv`. Primero guardamos los datos en una lista:

In [7]:
students = []

with open('data.csv', 'r', newline='') as csv_file:
    # Guardaremos los datos en forma de diccionario
    csv_reader = csv.DictReader(csv_file)

    for row in csv_reader:
        students.append(row)

students

[{'Nombre': 'Albert',
  'Apellido': 'Einstein',
  'Edad': '22',
  'Nota1': '19',
  'Nota2': '20'},
 {'Nombre': 'Nikola',
  'Apellido': 'Testa',
  'Edad': '20',
  'Nota1': '17',
  'Nota2': '20'},
 {'Nombre': 'Ada',
  'Apellido': 'Lovelace',
  'Edad': '23',
  'Nota1': '20',
  'Nota2': '18'},
 {'Nombre': 'Alan',
  'Apellido': 'Turing',
  'Edad': '19',
  'Nota1': '18',
  'Nota2': '19'}]

Ahora tenemos una lista de diccionarios. Añadiremos una llave a cada diccionario, llamado `Promedio`:

In [13]:
for student in students:
    # Obtenemos el promedio de notas del estudiante
    grade_average = (int(student['Nota1']) + int(student['Nota2'])) / 2

    # Lo añadimos al diccionario
    student['Promedio'] = grade_average

    # Eliminamos Nota1 y Nota2 del diccionario
    student.pop('Nota1')
    student.pop('Nota2')

students

[{'Nombre': 'Albert', 'Apellido': 'Einstein', 'Edad': '22', 'Promedio': 19.5},
 {'Nombre': 'Nikola', 'Apellido': 'Testa', 'Edad': '20', 'Promedio': 18.5},
 {'Nombre': 'Ada', 'Apellido': 'Lovelace', 'Edad': '23', 'Promedio': 19.0},
 {'Nombre': 'Alan', 'Apellido': 'Turing', 'Edad': '19', 'Promedio': 18.5}]

Ahora escribiremos los resultados en un archivo `resultados.csv` usando la clase `DictWriter()`:

In [14]:
with open('resultados.csv', 'w', newline='') as csv_file:
    # Especificamos el nombre de las columnas que contendrá nuestro archivo CSV
    fieldnames = ['Nombre', 'Apellido', 'Edad', 'Promedio']

    csv_writer = csv.DictWriter(csv_file, fieldnames=fieldnames)

    # Primero escribimos el nombre de las columnas
    csv_writer.writeheader()

    for student in students:
        # usamos writerow y le pasamos como parámetro a student (es un diccionario de Python)
        csv_writer.writerow(student)

Nuestro archivo `resultados.csv` quedaría de la siguiente manera:

<img src="images/resultadoscsv.jpg" alt="Notas" width="700"/>