# Manejo de Archivos: Leyendo y Escribiendo Datos

Hasta ahora, hemos trabajado con datos que viven dentro de nuestro código. El siguiente paso es aprender a interactuar con el mundo exterior: los archivos. Esta es una habilidad fundamental para cualquier científico de datos, ya que los datasets casi siempre provienen de archivos externos.

Exploraremos dos de los formatos más comunes:
1.  **Archivos de Texto Plano (`.txt`)**: Para datos no estructurados.
2.  **Archivos CSV (`.csv`)**: El estándar para datos tabulares.

## 1. Archivos de Texto Plano (.txt)

Los archivos de texto son la forma más simple de almacenar información.

### El Contexto: `with open()`
La forma correcta y segura de abrir archivos en Python es usando la sentencia `with open()`.

**¿Por qué es la mejor práctica?** Porque se encarga de **cerrar el archivo automáticamente** por ti, incluso si ocurren errores en el proceso. Esto previene fugas de memoria y corrupción de datos.

La sintaxis es: `with open("nombre_del_archivo.txt", "modo") as variable_de_archivo:`

Los **modos** más importantes son:
* **`'r'`**: **Read** (Leer). El modo por defecto. Da un error si el archivo no existe.
* **`'w'`**: **Write** (Escribir). **¡Cuidado!** Si el archivo existe, **borra todo su contenido**. Si no existe, lo crea.
* **`'a'`**: **Append** (Añadir). Añade nuevo contenido al **final** del archivo. Si no existe, lo crea.

In [16]:
# Para que este notebook funcione, primero vamos a crear un archivo de ejemplo.
cuento = """Caperucita Roja visitaba a su abuela.
El lobo feroz la esperaba en el camino.
El cazador salvó a ambas al final."""

with open("caperucita.txt", "w") as file:
    file.write(cuento)

print("Archivo 'caperucita.txt' creado con éxito.")

Archivo 'caperucita.txt' creado con éxito.


### Lectura de Archivos de Texto

Podemos leer el contenido de un archivo de dos maneras principales.

In [17]:
# MÉTODO 1: Iterar línea por línea (eficiente con la memoria)
print("--- Leyendo línea por línea ---")
with open("caperucita.txt", "r") as file:
    for line in file:
        # Usamos .strip() para quitar los saltos de línea invisibles (\n)
        print(line.strip())

# MÉTODO 2: Cargar todas las líneas en una lista
print("\n--- Cargando todo en una lista ---")
with open("caperucita.txt", "r") as file:
    lines = file.readlines()
    print(lines)

--- Leyendo línea por línea ---
Caperucita Roja visitaba a su abuela.
El lobo feroz la esperaba en el camino.
El cazador salvó a ambas al final.

--- Cargando todo en una lista ---
['Caperucita Roja visitaba a su abuela.\n', 'El lobo feroz la esperaba en el camino.\n', 'El cazador salvó a ambas al final.']


### Escritura y Modificación de Archivos de Texto

In [None]:
# Usando el modo 'a' (Append) para AÑADIR al final
with open("caperucita.txt", "a") as file:
    # \n asegura que la nueva línea empiece abajo
    file.write("\n\nFIN.")

# Leemos el archivo de nuevo para ver el cambio
print("--- Archivo con texto añadido ---")
with open("caperucita.txt", "r") as file:
    print(file.read())

## 2. Archivos CSV: El Estándar para Datos Tabulares

Un archivo CSV (Comma-Separated Values) es un archivo de texto donde las comas separan los valores, creando una estructura de tabla. Para manejarlos correctamente, usamos el módulo `csv` de Python.

In [18]:
# Primero, importamos el módulo y creamos un archivo CSV de ejemplo
import csv

datos_productos = [
    {'nombre': 'Laptop', 'precio': '1200', 'cantidad': '20'},
    {'nombre': 'Mouse', 'precio': '25', 'cantidad': '150'},
    {'nombre': 'Teclado', 'precio': '80', 'cantidad': '75'}
]
fieldnames = ['nombre', 'precio', 'cantidad']

with open('products_v2.csv', 'w', newline='') as csvfile:
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerows(datos_productos)

print("Archivo 'products_v2.csv' creado con éxito.")

Archivo 'products_v2.csv' creado con éxito.


### Lectura de CSV con `csv.DictReader`

Esta es la forma recomendada. Convierte cada fila en un **diccionario**, usando la primera fila (el encabezado) como las claves. Esto hace que tu código sea mucho más legible.

In [20]:
with open('products_v2.csv', mode='r') as file:
    csv_reader = csv.DictReader(file)
    for row in csv_reader:
        # Ahora podemos acceder a los datos por el nombre de la columna
        print(f"Producto: {row['nombre']}, Precio: ${row['precio']}")

Producto: Laptop, Precio: $1200
Producto: Mouse, Precio: $25
Producto: Teclado, Precio: $80


### Caso Práctico: Añadir una Columna Calculada

Una tarea muy común es leer un archivo, realizar algún cálculo y guardar el resultado en un archivo nuevo. Aquí, calcularemos el valor total del inventario para cada producto.

In [23]:
# Abrimos el archivo original para leer y el nuevo para escribir
with open('products.csv', mode='r', newline='') as read_file, \
     open('products_updated.csv', mode='w', newline='') as write_file:

    # Creamos el lector para el archivo original
    csv_reader = csv.DictReader(read_file)

    # Definimos las columnas para el nuevo archivo, añadiendo la nuestra
    fieldnames = csv_reader.fieldnames + ['valor_total']

    # Creamos el escritor para el nuevo archivo
    csv_writer = csv.DictWriter(write_file, fieldnames=fieldnames)

    # Escribimos el encabezado en el nuevo archivo
    csv_writer.writeheader()

    # Iteramos sobre el archivo original
    for row in csv_reader:
        # Calculamos el nuevo valor (¡recordar convertir a números!)
        row['valor_total'] = float(row['price']) * int(row['quantity'])
        # Escribimos la fila modificada en el nuevo archivo
        csv_writer.writerow(row)

print("Archivo 'products_updated.csv' creado con la nueva columna.")

Archivo 'products_updated.csv' creado con la nueva columna.
