[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/algoritmos-poli/sesiones_presenciales/blob/main/clase8/csv-python.ipynb)   ![Built with AI](https://img.shields.io/badge/Built%20with-AI-blue.svg)

# Manejo de Archivos CSV en Python

## Tabla de Contenidos

- [¿Qué es un Archivo CSV?](#qué-es-un-archivo-csv)
- [Procesamiento de Archivos CSV en Python: El Módulo `csv`](#procesamiento-de-archivos-csv-en-python-el-módulo-csv)
- [Principales Funciones de Python para Procesar Archivos CSV](#principales-funciones-de-python-para-procesar-archivos-csv)
- [0. Preparación: Creación de un Archivo de Ejemplo](#0-preparación-creación-de-un-archivo-de-ejemplo)
- [1. Lectura de Archivos CSV](#1-lectura-de-archivos-csv)
- [2. Escritura en Archivos CSV](#2-escritura-en-archivos-csv)
- [3. Ejercicios Prácticos](#3-ejercicios-prácticos)

## ¿Qué es un Archivo CSV? 

Un archivo **CSV** (del inglés *Comma-Separated Values*, o Valores Separados por Comas) es un formato de texto plano utilizado para almacenar datos en forma de tabla. Su simplicidad y compatibilidad lo convierten en uno de los formatos más populares para el intercambio de datos entre diferentes aplicaciones, como hojas de cálculo (Excel, Google Sheets) y bases de datos.

**Características principales:**

* Cada línea del archivo representa una **fila** de la tabla.
* Dentro de una fila, las columnas se separan por un **delimitador**, que comúnmente es una coma (`,`).
* La primera fila suele contener los **encabezados** (nombres de las columnas).

Aunque el nombre sugiere comas, se puede usar cualquier carácter como delimitador (punto y coma `;`, tabulador `\t`, etc.), lo que hace que el formato sea muy flexible.

## Procesamiento de Archivos CSV en Python: El Módulo `csv`

Para manipular archivos CSV de manera eficiente y segura en Python, se utiliza el módulo incorporado `csv`. Este módulo interpreta los datos del archivo, gestionando automáticamente los delimitadores y el entrecomillado de los campos, lo que simplifica enormemente la lectura y escritura.

El flujo de trabajo estándar sigue estos pasos:

1.  **Importar el módulo**: Siempre se comienza con `import csv`.
2.  **Abrir el archivo**: Se utiliza la declaración `with open('nombre_archivo.csv', mode='...') as archivo:` para abrir el archivo.
    * El uso de `with` garantiza que el archivo se cierre automáticamente al finalizar, incluso si ocurren errores.
    * El `mode` puede ser `'r'` para leer, `'w'` para escribir (sobrescribiendo el contenido) o `'a'` para añadir al final.
    * Al escribir, es crucial incluir el parámetro `newline=''` para evitar que se inserten filas en blanco entre los datos.
3.  **Crear un objeto Lector o Escritor**:
    * Para leer, se crea un objeto `csv.reader` (devuelve listas) o `csv.DictReader` (devuelve diccionarios).
    * Para escribir, se crea un objeto `csv.writer` (para escribir listas) o `csv.DictWriter` (para escribir diccionarios).
4.  **Iterar y procesar**: Se utiliza un bucle para leer o escribir los datos fila por fila a través del objeto creado.

Este proceso proporciona una capa de abstracción que nos permite trabajar con los datos de forma estructurada sin preocuparnos por los detalles de bajo nivel del formato del archivo.

## Principales Funciones de Python para Procesar Archivos CSV

| **Función/Clase**       | **Descripción**                                                                                   | **Ejemplo de Uso**                          |
|--------------------------|---------------------------------------------------------------------------------------------------|---------------------------------------------|
| `csv.reader`            | Lee un archivo CSV y devuelve cada fila como una lista de cadenas.                                | `lector = csv.reader(archivo)`             |
| `csv.DictReader`        | Lee un archivo CSV y devuelve cada fila como un diccionario, usando los encabezados como claves.  | `lector = csv.DictReader(archivo)`         |
| `csv.writer`            | Escribe datos en un archivo CSV a partir de listas anidadas.                                      | `escritor = csv.writer(archivo)`           |
| `csv.DictWriter`        | Escribe datos en un archivo CSV a partir de diccionarios, usando claves como encabezados.         | `escritor = csv.DictWriter(archivo)`       |
| `writerow`              | Escribe una sola fila en un archivo CSV.                                                         | `escritor.writerow(['col1', 'col2'])`      |
| `writerows`             | Escribe múltiples filas en un archivo CSV.                                                       | `escritor.writerows(lista_de_filas)`       |
| `writeheader`           | Escribe los encabezados en un archivo CSV (usado con `DictWriter`).                               | `escritor.writeheader()`                   |

Estas funciones y clases del módulo `csv` permiten manejar archivos CSV de manera eficiente y estructurada, ya sea para lectura o escritura.

## 0. Preparación: Creación de un Archivo de Ejemplo

Para esta práctica, primero crearemos nuestro propio archivo CSV llamado `estudiantes.csv`. Este archivo contendrá información básica sobre estudiantes y sus calificaciones. Ejecute la siguiente celda para crearlo en su directorio de trabajo.

In [None]:
import csv

# Datos de ejemplo que escribiremos en el archivo
datos_ejemplo = [
    ['id', 'nombre', 'carrera', 'calificacion'],
    ['101', 'Ana Torres', 'Ingeniería de Sistemas', '95'],
    ['102', 'Luis Vera', 'Ciencia de Datos', '88'],
    ['103', 'Sofía Castro', 'Ingeniería de Software', '100'],
    ['104', 'Carlos Mora, Jr.', 'Ingeniería de Sistemas', '78']
]

# Nombre del archivo que vamos a crear
nombre_archivo = 'estudiantes.csv'

# Usamos 'with open' para escribir el archivo
with open(nombre_archivo, mode='w', newline='', encoding='utf-8') as archivo_csv:
    escritor_csv = csv.writer(archivo_csv)
    escritor_csv.writerows(datos_ejemplo)

print(f"Archivo '{nombre_archivo}' creado exitosamente.")

## 1. Lectura de Archivos CSV

Python ofrece el módulo `csv`, una herramienta robusta diseñada específicamente para manejar estos archivos, evitando problemas comunes como comas dentro de los datos.

### Lectura con `csv.reader`
El objeto `csv.reader` permite iterar sobre las filas del archivo, donde cada fila es representada como una **lista de cadenas de texto**.

In [None]:
import csv

with open('estudiantes.csv', mode='r', encoding='utf-8') as archivo_csv:
    lector_csv = csv.reader(archivo_csv)
    
    # El objeto lector_csv es un iterador, podemos recorrerlo con un bucle
    print("Leyendo el archivo fila por fila (cada fila es una lista):")
    for fila in lector_csv:
        print(fila)

### Lectura con `csv.DictReader` (Método Recomendado)
Una forma más intuitiva de trabajar con datos tabulares es `csv.DictReader`. Este objeto también itera sobre las filas, pero representa cada una como un **diccionario**. Las llaves del diccionario son los encabezados de las columnas (la primera fila), lo que facilita el acceso a los datos por su nombre.

In [None]:
import csv

with open('estudiantes.csv', mode='r', encoding='utf-8') as archivo_csv:
    lector_dict = csv.DictReader(archivo_csv)
    
    print("\nLeyendo el archivo (cada fila es un diccionario):")
    for fila_dict in lector_dict:
        # Ahora podemos acceder a los datos por el nombre de la columna
        nombre = fila_dict['nombre']
        calificacion = fila_dict['calificacion']
        print(f"Estudiante: {nombre}, Calificación: {calificacion}")

## 2. Escritura en Archivos CSV

Para escribir datos, abrimos el archivo en modo escritura (`'w'`) y utilizamos `csv.writer` o `csv.DictWriter`.

### Escritura con `csv.writer`
Este método requiere que los datos estén en formato de **listas anidadas** (una lista de listas).

In [None]:
import csv

# Datos de nuevos estudiantes para agregar
nuevos_datos = [
    ['105', 'Maria Paz', 'Ingeniería Industrial', '91'],
    ['106', 'Juan Rios', 'Ciencia de Datos', '85']
]

# Escribimos en un nuevo archivo llamado 'estudiantes_actualizado.csv'
with open('estudiantes_actualizado.csv', mode='w', newline='', encoding='utf-8') as archivo_csv:
    escritor_csv = csv.writer(archivo_csv)
    
    # Escribimos el encabezado primero
    escritor_csv.writerow(['id', 'nombre', 'carrera', 'calificacion'])
    
    # Escribimos todas las filas de datos
    escritor_csv.writerows(nuevos_datos)

print("Archivo 'estudiantes_actualizado.csv' escrito exitosamente.")

# Verificación (opcional): leemos el archivo que acabamos de crear
print("\nContenido del nuevo archivo:")
with open('estudiantes_actualizado.csv', mode='r', encoding='utf-8') as f:
    print(f.read())

## 3. Ejercicios Prácticos 

Es tu turno de aplicar lo aprendido.

### Ejercicio 1: Calcular el Promedio
Lee el archivo `estudiantes.csv` y calcula la calificación promedio de todos los estudiantes.

**Pista:** Recuerda convertir la calificación (que es una cadena de texto) a un número (`int` o `float`) antes de sumarla.

In [None]:
import csv

total_calificaciones = 0
numero_estudiantes = 0

with open('estudiantes.csv', mode='r', encoding='utf-8') as archivo_csv:
    lector_dict = csv.DictReader(archivo_csv)
    
    # Su código aquí
    for fila in lector_dict:
        total_calificaciones += int(fila['calificacion'])
        numero_estudiantes += 1

if numero_estudiantes > 0:
    promedio = total_calificaciones / numero_estudiantes
    print(f"El promedio de calificación de los {numero_estudiantes} estudiantes es: {promedio:.2f}")
else:
    print("No se encontraron estudiantes para calcular el promedio.")

# Salida Esperada: El promedio de calificación de los 4 estudiantes es: 90.25

### Ejercicio 2: Filtrar Datos y Escribir un Nuevo Archivo
Crea un nuevo archivo CSV llamado `estudiantes_destacados.csv` que contenga únicamente a los estudiantes del archivo `estudiantes.csv` cuya calificación sea **mayor o igual a 90**. El nuevo archivo debe tener los mismos encabezados.

In [None]:
import csv

estudiantes_destacados = []

# Primero, leemos y filtramos los datos
with open('estudiantes.csv', mode='r', encoding='utf-8') as archivo_lectura:
    lector_dict = csv.DictReader(archivo_lectura)
    
    # Su código de lectura y filtrado aquí
    for fila in lector_dict:
        if int(fila['calificacion']) >= 90:
            estudiantes_destacados.append(fila)

# Ahora, escribimos los datos filtrados en un nuevo archivo
nombre_archivo_nuevo = 'estudiantes_destacados.csv'
encabezados = ['id', 'nombre', 'carrera', 'calificacion']

if estudiantes_destacados:
    with open(nombre_archivo_nuevo, mode='w', newline='', encoding='utf-8') as archivo_escritura:
        escritor_dict = csv.DictWriter(archivo_escritura, fieldnames=encabezados)
        
        # Su código de escritura aquí
        escritor_dict.writeheader()
        escritor_dict.writerows(estudiantes_destacados)
        
    print(f"Archivo '{nombre_archivo_nuevo}' creado con {len(estudiantes_destacados)} estudiantes destacados.")
else:
    print("No se encontraron estudiantes destacados.")

# Salida Esperada: Archivo 'estudiantes_destacados.csv' creado con 3 estudiantes destacados.