<a href="https://colab.research.google.com/github/culiacanai/Aprende_Python_con_GoogleColab/blob/main/notebooks/06_Manejo_de_Archivos_CSV_y_Excel.ipynb" target="_parent">
  <img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/>
</a>

# üìÅ Manejo de Archivos: CSV y Excel

### Aprende Python con Google Colab ‚Äî por [Culiacan.AI](https://culiacan.ai)

**Nivel:** üü° Intermedio  
**Duraci√≥n estimada:** 60 minutos  
**Requisitos:** Haber completado el [Notebook 05 ‚Äî Funciones](05_Funciones.ipynb)

---

En este notebook vas a:
- Leer y escribir archivos CSV con el m√≥dulo `csv` de Python
- Leer y escribir archivos Excel con `openpyxl`
- Manipular datos tabulares sin necesidad de Pandas (eso viene en el notebook 07)
- Trabajar con datos reales de una cadena de √≥pticas
- Generar reportes en Excel con formato profesional

> üí° Este notebook incluye archivos de ejemplo que se generan autom√°ticamente. ¬°Solo ejecuta las celdas en orden!

---

## 0. Preparaci√≥n: instalar librer√≠as y generar datos de ejemplo

Ejecuta esta celda primero para preparar todo:


In [None]:
# Instalar openpyxl para trabajar con Excel
!pip install openpyxl -q

import csv
import os
from datetime import datetime, timedelta
import random

# Crear carpeta para los datos de ejemplo
os.makedirs("datos", exist_ok=True)

print("‚úÖ Librer√≠as instaladas y carpeta creada")

### Generar archivos de ejemplo

Vamos a crear datos realistas de una cadena de √≥pticas para practicar:


In [None]:
# --- Generar CSV: ventas diarias ---
random.seed(42)  # Para resultados reproducibles

sucursales = ["Centro", "Tres R√≠os", "Plaza Fiesta", "Forum", "Galer√≠as",
              "Mazatl√°n Centro", "Mazatl√°n Dorado", "Los Mochis", "Guasave"]

productos = [
    ("Lentes monofocales", 890),
    ("Lentes bifocales", 1490),
    ("Lentes progresivos", 2490),
    ("Armaz√≥n b√°sico", 350),
    ("Armaz√≥n premium", 890),
    ("Armaz√≥n de dise√±ador", 1650),
    ("Soluci√≥n 360ml", 120),
    ("Estuche r√≠gido", 80),
    ("Microfibra", 45),
    ("Gotas lubricantes", 95),
    ("Consulta visual", 99),
]

# Generar 200 ventas del √∫ltimo mes
ventas = []
fecha_inicio = datetime(2025, 1, 1)

for i in range(200):
    fecha = fecha_inicio + timedelta(days=random.randint(0, 30))
    sucursal = random.choice(sucursales)
    producto, precio_base = random.choice(productos)
    cantidad = random.randint(1, 3)
    descuento = random.choice([0, 0, 0, 0.05, 0.10, 0.15])  # Mayor√≠a sin descuento
    total = round(precio_base * cantidad * (1 - descuento), 2)

    ventas.append({
        "fecha": fecha.strftime("%Y-%m-%d"),
        "sucursal": sucursal,
        "producto": producto,
        "cantidad": cantidad,
        "precio_unitario": precio_base,
        "descuento": descuento,
        "total": total,
    })

# Ordenar por fecha
ventas.sort(key=lambda x: x["fecha"])

# Escribir CSV
with open("datos/ventas.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=ventas[0].keys())
    writer.writeheader()
    writer.writerows(ventas)

print(f"‚úÖ ventas.csv creado ‚Äî {len(ventas)} registros")

# Mostrar primeras l√≠neas
print("\nPrimeras 5 filas:")
for v in ventas[:5]:
    print(f"  {v['fecha']} | {v['sucursal']:<18} | {v['producto']:<22} | ${v['total']:>8,}")

In [None]:
# --- Generar CSV: empleados ---
puestos = ["Optometrista", "Vendedor", "Cajero", "Gerente", "Asistente"]

empleados = []
nombres = [
    ("Ana", "Garc√≠a"), ("Luis", "Hern√°ndez"), ("Mar√≠a", "L√≥pez"), ("Carlos", "Mart√≠nez"),
    ("Sof√≠a", "Rodr√≠guez"), ("Pedro", "S√°nchez"), ("Laura", "Ram√≠rez"), ("Diego", "Torres"),
    ("Valentina", "Flores"), ("Miguel", "D√≠az"), ("Fernanda", "Morales"), ("Andr√©s", "Jim√©nez"),
    ("Camila", "Reyes"), ("Roberto", "Cruz"), ("Isabella", "Ortiz"), ("Javier", "Guti√©rrez"),
    ("Daniela", "Mendoza"), ("Ricardo", "Ruiz"), ("Paulina", "Alvarez"), ("Emilio", "Romero"),
    ("Andrea", "Vargas"), ("Tom√°s", "Castillo"), ("Luc√≠a", "Herrera"), ("Gabriel", "Medina"),
    ("Mariana", "Castro"), ("Sergio", "R√≠os"), ("Natalia", "Pe√±a"), ("Oscar", "Aguilar"),
    ("Regina", "Ch√°vez"), ("Alejandro", "Navarro"), ("Valeria", "Guerrero"), ("Francisco", "C√≥rdova"),
    ("Paula", "Soto"), ("Eduardo", "Delgado"), ("Renata", "Molina"), ("H√©ctor", "Dom√≠nguez"),
]

for i, (nombre, apellido) in enumerate(nombres):
    sucursal = sucursales[i % len(sucursales)]
    puesto = random.choice(puestos)
    sueldo = {
        "Gerente": random.randint(18000, 25000),
        "Optometrista": random.randint(15000, 22000),
        "Vendedor": random.randint(9000, 14000),
        "Cajero": random.randint(8000, 12000),
        "Asistente": random.randint(7000, 10000),
    }[puesto]
    ingreso = fecha_inicio - timedelta(days=random.randint(30, 1500))

    empleados.append({
        "id": f"EMP{i+1:03d}",
        "nombre": nombre,
        "apellido": apellido,
        "puesto": puesto,
        "sucursal": sucursal,
        "sueldo_mensual": sueldo,
        "fecha_ingreso": ingreso.strftime("%Y-%m-%d"),
    })

with open("datos/empleados.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=empleados[0].keys())
    writer.writeheader()
    writer.writerows(empleados)

print(f"‚úÖ empleados.csv creado ‚Äî {len(empleados)} registros")

In [None]:
# --- Generar Excel: inventario ---
import openpyxl
from openpyxl.styles import Font, PatternFill, Alignment, Border, Side

wb = openpyxl.Workbook()

# Hoja 1: Inventario
ws = wb.active
ws.title = "Inventario"

# Encabezados
encabezados = ["C√≥digo", "Producto", "Categor√≠a", "Precio", "Stock", "Stock M√≠nimo", "Proveedor"]
for col, enc in enumerate(encabezados, 1):
    celda = ws.cell(row=1, column=col, value=enc)
    celda.font = Font(bold=True, color="FFFFFF")
    celda.fill = PatternFill(start_color="2E86AB", end_color="2E86AB", fill_type="solid")
    celda.alignment = Alignment(horizontal="center")

# Datos
inventario_data = [
    ("PRD001", "Lentes monofocales CR39", "Lentes", 890, 45, 20, "Essilor"),
    ("PRD002", "Lentes bifocales", "Lentes", 1490, 30, 15, "Essilor"),
    ("PRD003", "Lentes progresivos", "Lentes", 2490, 20, 10, "Varilux"),
    ("PRD004", "Lentes transitions", "Lentes", 1890, 25, 10, "Transitions"),
    ("PRD005", "Armaz√≥n b√°sico", "Armazones", 350, 80, 30, "Nacional"),
    ("PRD006", "Armaz√≥n premium", "Armazones", 890, 35, 15, "Ray-Ban"),
    ("PRD007", "Armaz√≥n de dise√±ador", "Armazones", 1650, 15, 8, "Oakley"),
    ("PRD008", "Armaz√≥n infantil", "Armazones", 280, 40, 20, "Nacional"),
    ("PRD009", "Soluci√≥n multiusos 360ml", "Accesorios", 120, 100, 40, "Renu"),
    ("PRD010", "Soluci√≥n multiusos 120ml", "Accesorios", 65, 80, 30, "Renu"),
    ("PRD011", "Estuche r√≠gido", "Accesorios", 80, 60, 25, "Nacional"),
    ("PRD012", "Estuche blando", "Accesorios", 45, 90, 30, "Nacional"),
    ("PRD013", "Microfibra", "Accesorios", 45, 150, 50, "Nacional"),
    ("PRD014", "Gotas lubricantes", "Accesorios", 95, 70, 30, "Systane"),
    ("PRD015", "Kit de limpieza", "Accesorios", 150, 40, 15, "Nacional"),
]

for row_idx, datos in enumerate(inventario_data, 2):
    for col_idx, valor in enumerate(datos, 1):
        celda = ws.cell(row=row_idx, column=col_idx, value=valor)
        if col_idx == 4:  # Precio
            celda.number_format = '$#,##0'
        celda.alignment = Alignment(horizontal="center" if col_idx != 2 else "left")

# Ajustar anchos
anchos = [10, 30, 15, 10, 8, 12, 12]
for i, ancho in enumerate(anchos, 1):
    ws.column_dimensions[openpyxl.utils.get_column_letter(i)].width = ancho

# Hoja 2: Sucursales
ws2 = wb.create_sheet("Sucursales")
enc2 = ["C√≥digo", "Sucursal", "Ciudad", "Direcci√≥n", "Tel√©fono", "Gerente", "Meta Mensual"]
for col, enc in enumerate(enc2, 1):
    celda = ws2.cell(row=1, column=col, value=enc)
    celda.font = Font(bold=True, color="FFFFFF")
    celda.fill = PatternFill(start_color="A23B72", end_color="A23B72", fill_type="solid")
    celda.alignment = Alignment(horizontal="center")

sucursales_data = [
    ("SUC001", "Centro", "Culiac√°n", "Av. Obreg√≥n #450", "667-111-0001", "Ana Garc√≠a", 200000),
    ("SUC002", "Tres R√≠os", "Culiac√°n", "Blvd. Tres R√≠os #120", "667-111-0002", "Carlos Mart√≠nez", 180000),
    ("SUC003", "Plaza Fiesta", "Culiac√°n", "Plaza Fiesta Local 23", "667-111-0003", "Roberto Cruz", 220000),
    ("SUC004", "Forum", "Culiac√°n", "Forum Culiac√°n Local 45", "667-111-0004", "Laura Ram√≠rez", 170000),
    ("SUC005", "Galer√≠as", "Culiac√°n", "Galer√≠as Culiac√°n Local 12", "667-111-0005", "Diego Torres", 190000),
    ("SUC006", "Mazatl√°n Centro", "Mazatl√°n", "Av. Camar√≥n S√°balo #890", "669-222-0001", "Sof√≠a Rodr√≠guez", 175000),
    ("SUC007", "Mazatl√°n Dorado", "Mazatl√°n", "Centro Comercial Dorado", "669-222-0002", "Miguel D√≠az", 160000),
    ("SUC008", "Los Mochis", "Los Mochis", "Blvd. Rosales #234", "668-333-0001", "Fernanda Morales", 150000),
    ("SUC009", "Guasave", "Guasave", "Av. L√≥pez Mateos #567", "687-444-0001", "Andr√©s Jim√©nez", 130000),
]

for row_idx, datos in enumerate(sucursales_data, 2):
    for col_idx, valor in enumerate(datos, 1):
        celda = ws2.cell(row=row_idx, column=col_idx, value=valor)
        if col_idx == 7:
            celda.number_format = '$#,##0'

anchos2 = [10, 20, 14, 30, 16, 20, 14]
for i, ancho in enumerate(anchos2, 1):
    ws2.column_dimensions[openpyxl.utils.get_column_letter(i)].width = ancho

wb.save("datos/inventario_sucursales.xlsx")
print("‚úÖ inventario_sucursales.xlsx creado ‚Äî 2 hojas (Inventario + Sucursales)")
print("\nüìÇ Archivos generados:")
for f in os.listdir("datos"):
    size = os.path.getsize(f"datos/{f}")
    print(f"  üìÑ datos/{f} ({size:,} bytes)")

---

## 1. Leer archivos CSV

CSV (Comma-Separated Values) es el formato m√°s simple y universal para datos tabulares. Es un archivo de texto donde cada l√≠nea es una fila y las columnas se separan por comas.

### 1.1 Leer con csv.reader (por filas)


In [None]:
import csv

# Leer como lista de listas
with open("datos/ventas.csv", "r", encoding="utf-8") as f:
    reader = csv.reader(f)
    encabezados = next(reader)  # Primera fila = encabezados
    filas = list(reader)

print(f"Encabezados: {encabezados}")
print(f"Total filas: {len(filas)}")
print(f"\nPrimera fila: {filas[0]}")
print(f"√öltima fila:  {filas[-1]}")

### 1.2 Leer con csv.DictReader (como diccionarios)

Esta es la forma m√°s c√≥moda ‚Äî cada fila se convierte en un diccionario:


In [None]:
import csv

with open("datos/ventas.csv", "r", encoding="utf-8") as f:
    reader = csv.DictReader(f)
    ventas = list(reader)

# Cada fila es un diccionario
print(f"Total ventas: {len(ventas)}")
print(f"\nPrimera venta:")
for clave, valor in ventas[0].items():
    print(f"  {clave}: {valor}")

# Acceder a campos espec√≠ficos
print(f"\n√öltimas 5 ventas:")
for v in ventas[-5:]:
    print(f"  {v['fecha']} | {v['sucursal']:<18} | {v['producto']:<22} | ${float(v['total']):>8,.0f}")

### 1.3 Analizar datos de un CSV


In [None]:
import csv

with open("datos/ventas.csv", "r", encoding="utf-8") as f:
    ventas = list(csv.DictReader(f))

# ‚ö†Ô∏è Recuerda: csv lee TODO como string, hay que convertir n√∫meros
# Convertir tipos
for v in ventas:
    v["cantidad"] = int(v["cantidad"])
    v["precio_unitario"] = float(v["precio_unitario"])
    v["descuento"] = float(v["descuento"])
    v["total"] = float(v["total"])

# --- An√°lisis ---

# Total de ventas
total_ventas = sum(v["total"] for v in ventas)
print(f"üí∞ Total ventas: ${total_ventas:,.0f}")

# Ventas por sucursal
ventas_por_sucursal = {}
for v in ventas:
    suc = v["sucursal"]
    ventas_por_sucursal[suc] = ventas_por_sucursal.get(suc, 0) + v["total"]

print(f"\nüìä Ventas por sucursal:")
for suc, total in sorted(ventas_por_sucursal.items(), key=lambda x: x[1], reverse=True):
    barra = "‚ñà" * int(total / 5000)
    print(f"  {suc:<18} ${total:>10,.0f} {barra}")

# Producto m√°s vendido (por cantidad)
ventas_por_producto = {}
for v in ventas:
    prod = v["producto"]
    ventas_por_producto[prod] = ventas_por_producto.get(prod, 0) + v["cantidad"]

print(f"\nüèÜ Top 5 productos (por cantidad):")
top5 = sorted(ventas_por_producto.items(), key=lambda x: x[1], reverse=True)[:5]
for prod, cant in top5:
    print(f"  {prod:<25} {cant} unidades")

In [None]:
# An√°lisis de empleados
with open("datos/empleados.csv", "r", encoding="utf-8") as f:
    empleados = list(csv.DictReader(f))

for e in empleados:
    e["sueldo_mensual"] = int(e["sueldo_mensual"])

# N√≥mina por sucursal
nomina = {}
for e in empleados:
    suc = e["sucursal"]
    nomina[suc] = nomina.get(suc, 0) + e["sueldo_mensual"]

print("üìã N√≥mina mensual por sucursal:")
total_nomina = 0
for suc, monto in sorted(nomina.items(), key=lambda x: x[1], reverse=True):
    total_nomina += monto
    empleados_suc = sum(1 for e in empleados if e["sucursal"] == suc)
    print(f"  {suc:<18} ${monto:>10,} ({empleados_suc} empleados)")

print(f"\n  {'TOTAL':<18} ${total_nomina:>10,} ({len(empleados)} empleados)")

# Sueldo promedio por puesto
sueldos_puesto = {}
for e in empleados:
    puesto = e["puesto"]
    if puesto not in sueldos_puesto:
        sueldos_puesto[puesto] = []
    sueldos_puesto[puesto].append(e["sueldo_mensual"])

print(f"\nüíº Sueldo promedio por puesto:")
for puesto, sueldos in sorted(sueldos_puesto.items(), key=lambda x: sum(x[1])/len(x[1]), reverse=True):
    promedio = sum(sueldos) / len(sueldos)
    print(f"  {puesto:<15} ${promedio:>10,.0f} ({len(sueldos)} personas)")

---

## 2. Escribir archivos CSV

### 2.1 Escribir con csv.writer


In [None]:
import csv

# Crear un reporte resumido
reporte = [
    ["Sucursal", "Ventas Totales", "Transacciones", "Ticket Promedio"],
]

with open("datos/ventas.csv", "r", encoding="utf-8") as f:
    ventas = list(csv.DictReader(f))

# Calcular resumen por sucursal
resumen = {}
for v in ventas:
    suc = v["sucursal"]
    if suc not in resumen:
        resumen[suc] = {"total": 0, "transacciones": 0}
    resumen[suc]["total"] += float(v["total"])
    resumen[suc]["transacciones"] += 1

for suc, datos in sorted(resumen.items(), key=lambda x: x[1]["total"], reverse=True):
    ticket_promedio = datos["total"] / datos["transacciones"]
    reporte.append([suc, round(datos["total"], 2), datos["transacciones"], round(ticket_promedio, 2)])

# Escribir CSV
with open("datos/reporte_sucursales.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.writer(f)
    writer.writerows(reporte)

print("‚úÖ reporte_sucursales.csv creado")
print("\nContenido:")
for fila in reporte:
    if fila[0] == "Sucursal":
        print(f"  {fila[0]:<18} {fila[1]:>15} {fila[2]:>15} {fila[3]:>16}")
    else:
        print(f"  {fila[0]:<18} ${fila[1]:>14,.0f} {fila[2]:>15} ${fila[3]:>15,.0f}")

### 2.2 Escribir con csv.DictWriter


In [None]:
import csv

# Generar reporte de empleados con antig√ºedad
from datetime import datetime

with open("datos/empleados.csv", "r", encoding="utf-8") as f:
    empleados = list(csv.DictReader(f))

hoy = datetime(2025, 2, 1)
reporte_empleados = []

for e in empleados:
    ingreso = datetime.strptime(e["fecha_ingreso"], "%Y-%m-%d")
    antiguedad_dias = (hoy - ingreso).days
    antiguedad_anios = round(antiguedad_dias / 365, 1)

    reporte_empleados.append({
        "nombre_completo": f"{e['nombre']} {e['apellido']}",
        "puesto": e["puesto"],
        "sucursal": e["sucursal"],
        "sueldo": int(e["sueldo_mensual"]),
        "fecha_ingreso": e["fecha_ingreso"],
        "antiguedad_anios": antiguedad_anios,
    })

# Ordenar por antig√ºedad
reporte_empleados.sort(key=lambda x: x["antiguedad_anios"], reverse=True)

# Escribir
campos = reporte_empleados[0].keys()
with open("datos/reporte_empleados.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=campos)
    writer.writeheader()
    writer.writerows(reporte_empleados)

print("‚úÖ reporte_empleados.csv creado")
print("\nTop 5 por antig√ºedad:")
for e in reporte_empleados[:5]:
    print(f"  {e['nombre_completo']:<25} {e['puesto']:<15} {e['antiguedad_anios']} a√±os")

---

## 3. Leer archivos Excel

Para Excel usamos la librer√≠a `openpyxl`. A diferencia de CSV, Excel soporta m√∫ltiples hojas, formatos, f√≥rmulas y m√°s.

### 3.1 Abrir y explorar un archivo Excel


In [None]:
import openpyxl

# Abrir el archivo
wb = openpyxl.load_workbook("datos/inventario_sucursales.xlsx")

# Ver las hojas disponibles
print(f"Hojas: {wb.sheetnames}")

# Seleccionar una hoja
ws = wb["Inventario"]

# Informaci√≥n b√°sica
print(f"\nHoja: {ws.title}")
print(f"Filas: {ws.max_row}")
print(f"Columnas: {ws.max_column}")

In [None]:
# Leer celdas espec√≠ficas
ws = wb["Inventario"]

# Por coordenada
print(f"A1: {ws['A1'].value}")
print(f"B2: {ws['B2'].value}")
print(f"D2: {ws['D2'].value}")

# Por fila y columna (1-indexed)
print(f"\nFila 2, Col 2: {ws.cell(row=2, column=2).value}")

### 3.2 Recorrer filas de Excel


In [None]:
ws = wb["Inventario"]

# Leer todas las filas como listas
print("üì¶ INVENTARIO COMPLETO:")
print(f"{'C√≥digo':<10} {'Producto':<30} {'Categor√≠a':<15} {'Precio':>8} {'Stock':>6}")
print("-" * 75)

for fila in ws.iter_rows(min_row=2, values_only=True):  # min_row=2 salta el encabezado
    codigo, producto, categoria, precio, stock, stock_min, proveedor = fila
    # Alerta de stock bajo
    alerta = " ‚ö†Ô∏è" if stock <= stock_min else ""
    print(f"{codigo:<10} {producto:<30} {categoria:<15} ${precio:>7,} {stock:>5}{alerta}")

In [None]:
# Convertir hoja de Excel a lista de diccionarios (muy √∫til)
def excel_a_diccionarios(ws):
    """Convierte una hoja de Excel a lista de diccionarios."""
    filas = list(ws.iter_rows(values_only=True))
    encabezados = filas[0]
    return [dict(zip(encabezados, fila)) for fila in filas[1:]]

# Inventario como diccionarios
inventario = excel_a_diccionarios(wb["Inventario"])
print(f"Productos: {len(inventario)}")
print(f"\nPrimer producto: {inventario[0]}")

# Sucursales como diccionarios
sucursales = excel_a_diccionarios(wb["Sucursales"])
print(f"\nSucursales: {len(sucursales)}")
print(f"Primera sucursal: {sucursales[0]}")

In [None]:
# An√°lisis del inventario
inventario = excel_a_diccionarios(wb["Inventario"])

# Valor total del inventario
valor_total = sum(p["Precio"] * p["Stock"] for p in inventario)
print(f"üí∞ Valor total del inventario: ${valor_total:,}")

# Productos con stock bajo
print("\n‚ö†Ô∏è Productos con stock bajo (‚â§ m√≠nimo):")
for p in inventario:
    if p["Stock"] <= p["Stock M√≠nimo"]:
        print(f"  {p['Producto']}: {p['Stock']} unidades (m√≠nimo: {p['Stock M√≠nimo']})")

# Por categor√≠a
categorias = {}
for p in inventario:
    cat = p["Categor√≠a"]
    if cat not in categorias:
        categorias[cat] = {"productos": 0, "valor": 0}
    categorias[cat]["productos"] += 1
    categorias[cat]["valor"] += p["Precio"] * p["Stock"]

print("\nüìÇ Resumen por categor√≠a:")
for cat, datos in categorias.items():
    print(f"  {cat:<15} {datos['productos']} productos ‚Äî Valor: ${datos['valor']:,}")

---

## 4. Escribir archivos Excel con formato

Aqu√≠ es donde Excel brilla sobre CSV ‚Äî podemos agregar colores, bordes, f√≥rmulas y m√°s.

### 4.1 Crear un Excel desde cero con formato


In [None]:
import openpyxl
from openpyxl.styles import Font, PatternFill, Alignment, Border, Side, numbers
from openpyxl.utils import get_column_letter
import csv

# Leer datos de ventas
with open("datos/ventas.csv", "r", encoding="utf-8") as f:
    ventas = list(csv.DictReader(f))

for v in ventas:
    v["total"] = float(v["total"])
    v["cantidad"] = int(v["cantidad"])

# --- Crear workbook ---
wb = openpyxl.Workbook()

# === HOJA 1: Resumen por sucursal ===
ws1 = wb.active
ws1.title = "Resumen Sucursales"

# Estilos
header_font = Font(bold=True, color="FFFFFF", size=12)
header_fill = PatternFill(start_color="2E86AB", end_color="2E86AB", fill_type="solid")
titulo_font = Font(bold=True, size=16, color="2E86AB")
border = Border(
    left=Side(style="thin"),
    right=Side(style="thin"),
    top=Side(style="thin"),
    bottom=Side(style="thin"),
)

# T√≠tulo
ws1.merge_cells("A1:E1")
ws1["A1"] = "üìä Reporte de Ventas ‚Äî Ver de Verdad"
ws1["A1"].font = titulo_font
ws1["A1"].alignment = Alignment(horizontal="center")
ws1.row_dimensions[1].height = 35

# Subt√≠tulo
ws1.merge_cells("A2:E2")
ws1["A2"] = "Enero 2025"
ws1["A2"].font = Font(size=11, color="666666")
ws1["A2"].alignment = Alignment(horizontal="center")

# Encabezados (fila 4)
encabezados = ["Sucursal", "Ventas Totales", "Transacciones", "Ticket Promedio", "% del Total"]
for col, enc in enumerate(encabezados, 1):
    celda = ws1.cell(row=4, column=col, value=enc)
    celda.font = header_font
    celda.fill = header_fill
    celda.alignment = Alignment(horizontal="center")
    celda.border = border

# Calcular datos
resumen = {}
for v in ventas:
    suc = v["sucursal"]
    if suc not in resumen:
        resumen[suc] = {"total": 0, "transacciones": 0}
    resumen[suc]["total"] += v["total"]
    resumen[suc]["transacciones"] += 1

gran_total = sum(d["total"] for d in resumen.values())

# Escribir datos
fila = 5
for suc, datos in sorted(resumen.items(), key=lambda x: x[1]["total"], reverse=True):
    ticket_prom = datos["total"] / datos["transacciones"]
    pct = datos["total"] / gran_total

    ws1.cell(row=fila, column=1, value=suc).border = border
    ws1.cell(row=fila, column=2, value=round(datos["total"], 2)).border = border
    ws1.cell(row=fila, column=2).number_format = '$#,##0.00'
    ws1.cell(row=fila, column=3, value=datos["transacciones"]).border = border
    ws1.cell(row=fila, column=3).alignment = Alignment(horizontal="center")
    ws1.cell(row=fila, column=4, value=round(ticket_prom, 2)).border = border
    ws1.cell(row=fila, column=4).number_format = '$#,##0.00'
    ws1.cell(row=fila, column=5, value=round(pct, 4)).border = border
    ws1.cell(row=fila, column=5).number_format = '0.0%'
    fila += 1

# Fila de totales
fila_total = fila
ws1.cell(row=fila_total, column=1, value="TOTAL").font = Font(bold=True)
ws1.cell(row=fila_total, column=2, value=round(gran_total, 2)).font = Font(bold=True)
ws1.cell(row=fila_total, column=2).number_format = '$#,##0.00'
total_trans = sum(d["transacciones"] for d in resumen.values())
ws1.cell(row=fila_total, column=3, value=total_trans).font = Font(bold=True)
ws1.cell(row=fila_total, column=3).alignment = Alignment(horizontal="center")
ws1.cell(row=fila_total, column=5, value=1).number_format = '0.0%'
ws1.cell(row=fila_total, column=5).font = Font(bold=True)

for col in range(1, 6):
    ws1.cell(row=fila_total, column=col).border = Border(top=Side(style="double"), bottom=Side(style="double"))

# Ajustar anchos
anchos = [22, 18, 16, 18, 14]
for i, ancho in enumerate(anchos, 1):
    ws1.column_dimensions[get_column_letter(i)].width = ancho

# === HOJA 2: Detalle de ventas ===
ws2 = wb.create_sheet("Detalle Ventas")

enc_detalle = ["Fecha", "Sucursal", "Producto", "Cantidad", "Precio Unit.", "Descuento", "Total"]
for col, enc in enumerate(enc_detalle, 1):
    celda = ws2.cell(row=1, column=col, value=enc)
    celda.font = Font(bold=True, color="FFFFFF")
    celda.fill = PatternFill(start_color="A23B72", end_color="A23B72", fill_type="solid")

for row_idx, v in enumerate(ventas, 2):
    ws2.cell(row=row_idx, column=1, value=v["fecha"])
    ws2.cell(row=row_idx, column=2, value=v["sucursal"])
    ws2.cell(row=row_idx, column=3, value=v["producto"])
    ws2.cell(row=row_idx, column=4, value=v["cantidad"]).alignment = Alignment(horizontal="center")
    ws2.cell(row=row_idx, column=5, value=float(v["precio_unitario"]))
    ws2.cell(row=row_idx, column=5).number_format = '$#,##0'
    ws2.cell(row=row_idx, column=6, value=float(v["descuento"]))
    ws2.cell(row=row_idx, column=6).number_format = '0%'
    ws2.cell(row=row_idx, column=7, value=v["total"])
    ws2.cell(row=row_idx, column=7).number_format = '$#,##0.00'

anchos2 = [12, 20, 25, 10, 12, 12, 12]
for i, ancho in enumerate(anchos2, 1):
    ws2.column_dimensions[get_column_letter(i)].width = ancho

# Guardar
wb.save("datos/reporte_ventas.xlsx")
print("‚úÖ reporte_ventas.xlsx creado con 2 hojas formateadas")
print("   üìä Hoja 1: Resumen por sucursal")
print(f"   üìã Hoja 2: Detalle ({len(ventas)} ventas)")

### 4.2 Agregar f√≥rmulas de Excel


In [None]:
import openpyxl
from openpyxl.styles import Font

wb = openpyxl.Workbook()
ws = wb.active
ws.title = "Presupuesto"

# Encabezados
ws["A1"] = "Concepto"
ws["B1"] = "Monto Mensual"
ws["C1"] = "Monto Anual"

# Datos
gastos = [
    ("N√≥mina", 450000),
    ("Renta de locales", 180000),
    ("Inventario", 350000),
    ("Marketing", 50000),
    ("Servicios", 25000),
    ("Seguros", 15000),
    ("Mantenimiento", 20000),
]

for i, (concepto, monto) in enumerate(gastos, 2):
    ws.cell(row=i, column=1, value=concepto)
    ws.cell(row=i, column=2, value=monto)
    ws.cell(row=i, column=2).number_format = '$#,##0'
    # F√≥rmula: anual = mensual * 12
    ws.cell(row=i, column=3, value=f"=B{i}*12")
    ws.cell(row=i, column=3).number_format = '$#,##0'

# Fila de totales con f√≥rmulas SUM
fila_total = len(gastos) + 2
ws.cell(row=fila_total, column=1, value="TOTAL").font = Font(bold=True)
ws.cell(row=fila_total, column=2, value=f"=SUM(B2:B{fila_total-1})")
ws.cell(row=fila_total, column=2).number_format = '$#,##0'
ws.cell(row=fila_total, column=2).font = Font(bold=True)
ws.cell(row=fila_total, column=3, value=f"=SUM(C2:C{fila_total-1})")
ws.cell(row=fila_total, column=3).number_format = '$#,##0'
ws.cell(row=fila_total, column=3).font = Font(bold=True)

# Ajustar anchos
ws.column_dimensions["A"].width = 20
ws.column_dimensions["B"].width = 18
ws.column_dimensions["C"].width = 18

# Formatear encabezados
from openpyxl.styles import PatternFill
for col in range(1, 4):
    ws.cell(row=1, column=col).font = Font(bold=True, color="FFFFFF")
    ws.cell(row=1, column=col).fill = PatternFill(start_color="333333", end_color="333333", fill_type="solid")

wb.save("datos/presupuesto.xlsx")
print("‚úÖ presupuesto.xlsx creado con f√≥rmulas de Excel")
print("   Las f√≥rmulas se calcular√°n al abrir en Excel/Google Sheets")

---

## 5. Modificar un archivo Excel existente


In [None]:
import openpyxl
from openpyxl.styles import PatternFill

# Abrir archivo existente
wb = openpyxl.load_workbook("datos/inventario_sucursales.xlsx")
ws = wb["Inventario"]

# Agregar columna de "Valor en Stock"
ws.cell(row=1, column=8, value="Valor en Stock")
ws.cell(row=1, column=8).font = Font(bold=True, color="FFFFFF")
ws.cell(row=1, column=8).fill = PatternFill(start_color="2E86AB", end_color="2E86AB", fill_type="solid")

# Colores para alertas
rojo = PatternFill(start_color="FFD6D6", end_color="FFD6D6", fill_type="solid")
amarillo = PatternFill(start_color="FFF3CD", end_color="FFF3CD", fill_type="solid")

for fila in range(2, ws.max_row + 1):
    precio = ws.cell(row=fila, column=4).value
    stock = ws.cell(row=fila, column=5).value
    stock_min = ws.cell(row=fila, column=6).value

    # Calcular valor en stock
    valor = precio * stock
    ws.cell(row=fila, column=8, value=valor)
    ws.cell(row=fila, column=8).number_format = '$#,##0'

    # Colorear filas seg√∫n nivel de stock
    if stock <= stock_min:
        for col in range(1, 9):
            ws.cell(row=fila, column=col).fill = rojo
    elif stock <= stock_min * 1.5:
        for col in range(1, 9):
            ws.cell(row=fila, column=col).fill = amarillo

ws.column_dimensions["H"].width = 15

wb.save("datos/inventario_sucursales.xlsx")
print("‚úÖ inventario_sucursales.xlsx actualizado")
print("   - Nueva columna: Valor en Stock")
print("   - Filas rojas: stock ‚â§ m√≠nimo")
print("   - Filas amarillas: stock cerca del m√≠nimo")

---

## 6. Convertir entre CSV y Excel


In [None]:
import csv
import openpyxl
from openpyxl.styles import Font, PatternFill

# --- CSV a Excel ---
def csv_a_excel(ruta_csv: str, ruta_excel: str, nombre_hoja: str = "Datos"):
    """Convierte un archivo CSV a Excel con formato b√°sico."""
    with open(ruta_csv, "r", encoding="utf-8") as f:
        datos = list(csv.reader(f))

    wb = openpyxl.Workbook()
    ws = wb.active
    ws.title = nombre_hoja

    for fila_idx, fila in enumerate(datos, 1):
        for col_idx, valor in enumerate(fila, 1):
            # Intentar convertir a n√∫mero
            try:
                valor = float(valor)
                if valor == int(valor):
                    valor = int(valor)
            except (ValueError, TypeError):
                pass
            ws.cell(row=fila_idx, column=col_idx, value=valor)

    # Formato del encabezado
    for col in range(1, len(datos[0]) + 1):
        ws.cell(row=1, column=col).font = Font(bold=True, color="FFFFFF")
        ws.cell(row=1, column=col).fill = PatternFill(start_color="2E86AB", end_color="2E86AB", fill_type="solid")

    wb.save(ruta_excel)
    print(f"‚úÖ {ruta_csv} ‚Üí {ruta_excel} ({len(datos)-1} filas)")

# --- Excel a CSV ---
def excel_a_csv(ruta_excel: str, ruta_csv: str, hoja: str = None):
    """Convierte una hoja de Excel a CSV."""
    wb = openpyxl.load_workbook(ruta_excel)
    ws = wb[hoja] if hoja else wb.active

    with open(ruta_csv, "w", newline="", encoding="utf-8") as f:
        writer = csv.writer(f)
        for fila in ws.iter_rows(values_only=True):
            writer.writerow(fila)

    print(f"‚úÖ {ruta_excel}[{ws.title}] ‚Üí {ruta_csv} ({ws.max_row-1} filas)")

# Convertir
csv_a_excel("datos/ventas.csv", "datos/ventas.xlsx", "Ventas Enero")
excel_a_csv("datos/inventario_sucursales.xlsx", "datos/inventario.csv", "Inventario")

---

## 7. üèÜ Mini Proyecto: Generador de reporte ejecutivo

Vamos a generar un reporte completo en Excel combinando datos de ventas, empleados e inventario:


In [None]:
# üèÜ Mini Proyecto: Reporte Ejecutivo en Excel
import csv
import openpyxl
from openpyxl.styles import Font, PatternFill, Alignment, Border, Side
from openpyxl.utils import get_column_letter

# --- Cargar datos ---
with open("datos/ventas.csv", "r", encoding="utf-8") as f:
    ventas = list(csv.DictReader(f))
for v in ventas:
    v["total"] = float(v["total"])
    v["cantidad"] = int(v["cantidad"])

with open("datos/empleados.csv", "r", encoding="utf-8") as f:
    empleados = list(csv.DictReader(f))
for e in empleados:
    e["sueldo_mensual"] = int(e["sueldo_mensual"])

# --- Crear workbook ---
wb = openpyxl.Workbook()

# Estilos globales
azul = PatternFill(start_color="2E86AB", end_color="2E86AB", fill_type="solid")
verde = PatternFill(start_color="27AE60", end_color="27AE60", fill_type="solid")
morado = PatternFill(start_color="8E44AD", end_color="8E44AD", fill_type="solid")
gris = PatternFill(start_color="F5F5F5", end_color="F5F5F5", fill_type="solid")
header_font = Font(bold=True, color="FFFFFF", size=11)
titulo_font = Font(bold=True, size=14)
borde = Border(
    left=Side(style="thin", color="CCCCCC"),
    right=Side(style="thin", color="CCCCCC"),
    top=Side(style="thin", color="CCCCCC"),
    bottom=Side(style="thin", color="CCCCCC"),
)

# ====== HOJA 1: DASHBOARD ======
ws1 = wb.active
ws1.title = "Dashboard"

# T√≠tulo
ws1.merge_cells("A1:F1")
ws1["A1"] = "VER DE VERDAD ‚Äî Reporte Ejecutivo Enero 2025"
ws1["A1"].font = Font(bold=True, size=16, color="2E86AB")
ws1["A1"].alignment = Alignment(horizontal="center")
ws1.row_dimensions[1].height = 40

# KPIs
total_ventas = sum(v["total"] for v in ventas)
total_transacciones = len(ventas)
ticket_promedio = total_ventas / total_transacciones
total_nomina = sum(e["sueldo_mensual"] for e in empleados)
margen = total_ventas - total_nomina

kpis = [
    ("Ventas Totales", f"${total_ventas:,.0f}"),
    ("Transacciones", f"{total_transacciones}"),
    ("Ticket Promedio", f"${ticket_promedio:,.0f}"),
    ("N√≥mina", f"${total_nomina:,}"),
    ("Margen", f"${margen:,.0f}"),
    ("Empleados", f"{len(empleados)}"),
]

for i, (titulo, valor) in enumerate(kpis):
    col = i + 1
    ws1.cell(row=3, column=col, value=titulo).font = Font(bold=True, size=9, color="666666")
    ws1.cell(row=3, column=col).alignment = Alignment(horizontal="center")
    ws1.cell(row=4, column=col, value=valor).font = Font(bold=True, size=14, color="2E86AB")
    ws1.cell(row=4, column=col).alignment = Alignment(horizontal="center")

# Top sucursales
ws1.cell(row=6, column=1, value="Top Sucursales por Ventas").font = titulo_font
enc = ["#", "Sucursal", "Ventas", "Transacciones", "Ticket Prom.", "% Total"]
for col, e in enumerate(enc, 1):
    ws1.cell(row=7, column=col, value=e).font = header_font
    ws1.cell(row=7, column=col).fill = azul
    ws1.cell(row=7, column=col).border = borde

resumen_suc = {}
for v in ventas:
    s = v["sucursal"]
    if s not in resumen_suc:
        resumen_suc[s] = {"total": 0, "trans": 0}
    resumen_suc[s]["total"] += v["total"]
    resumen_suc[s]["trans"] += 1

fila = 8
for rank, (suc, d) in enumerate(sorted(resumen_suc.items(), key=lambda x: x[1]["total"], reverse=True), 1):
    ticket = d["total"] / d["trans"]
    pct = d["total"] / total_ventas
    ws1.cell(row=fila, column=1, value=rank).border = borde
    ws1.cell(row=fila, column=1).alignment = Alignment(horizontal="center")
    ws1.cell(row=fila, column=2, value=suc).border = borde
    ws1.cell(row=fila, column=3, value=round(d["total"])).border = borde
    ws1.cell(row=fila, column=3).number_format = '$#,##0'
    ws1.cell(row=fila, column=4, value=d["trans"]).border = borde
    ws1.cell(row=fila, column=4).alignment = Alignment(horizontal="center")
    ws1.cell(row=fila, column=5, value=round(ticket)).border = borde
    ws1.cell(row=fila, column=5).number_format = '$#,##0'
    ws1.cell(row=fila, column=6, value=round(pct, 4)).border = borde
    ws1.cell(row=fila, column=6).number_format = '0.0%'

    if fila % 2 == 0:
        for c in range(1, 7):
            ws1.cell(row=fila, column=c).fill = gris
    fila += 1

anchos1 = [5, 22, 14, 16, 14, 10]
for i, a in enumerate(anchos1, 1):
    ws1.column_dimensions[get_column_letter(i)].width = a

# ====== HOJA 2: N√ìMINA ======
ws2 = wb.create_sheet("N√≥mina")

enc2 = ["ID", "Nombre", "Puesto", "Sucursal", "Sueldo Mensual"]
for col, e in enumerate(enc2, 1):
    ws2.cell(row=1, column=col, value=e).font = header_font
    ws2.cell(row=1, column=col).fill = verde

for i, e in enumerate(sorted(empleados, key=lambda x: x["sueldo_mensual"], reverse=True), 2):
    ws2.cell(row=i, column=1, value=e["id"])
    ws2.cell(row=i, column=2, value=f"{e['nombre']} {e['apellido']}")
    ws2.cell(row=i, column=3, value=e["puesto"])
    ws2.cell(row=i, column=4, value=e["sucursal"])
    ws2.cell(row=i, column=5, value=e["sueldo_mensual"])
    ws2.cell(row=i, column=5).number_format = '$#,##0'

anchos2 = [10, 25, 16, 20, 16]
for i, a in enumerate(anchos2, 1):
    ws2.column_dimensions[get_column_letter(i)].width = a

# ====== HOJA 3: PRODUCTOS ======
ws3 = wb.create_sheet("Productos Top")

ventas_prod = {}
for v in ventas:
    p = v["producto"]
    if p not in ventas_prod:
        ventas_prod[p] = {"ingreso": 0, "cantidad": 0}
    ventas_prod[p]["ingreso"] += v["total"]
    ventas_prod[p]["cantidad"] += v["cantidad"]

enc3 = ["#", "Producto", "Ingresos", "Unidades", "Ingreso Promedio"]
for col, e in enumerate(enc3, 1):
    ws3.cell(row=1, column=col, value=e).font = header_font
    ws3.cell(row=1, column=col).fill = morado

for rank, (prod, d) in enumerate(sorted(ventas_prod.items(), key=lambda x: x[1]["ingreso"], reverse=True), 1):
    fila = rank + 1
    prom = d["ingreso"] / d["cantidad"]
    ws3.cell(row=fila, column=1, value=rank).alignment = Alignment(horizontal="center")
    ws3.cell(row=fila, column=2, value=prod)
    ws3.cell(row=fila, column=3, value=round(d["ingreso"])).number_format = '$#,##0'
    ws3.cell(row=fila, column=4, value=d["cantidad"]).alignment = Alignment(horizontal="center")
    ws3.cell(row=fila, column=5, value=round(prom)).number_format = '$#,##0'

anchos3 = [5, 28, 14, 12, 16]
for i, a in enumerate(anchos3, 1):
    ws3.column_dimensions[get_column_letter(i)].width = a

# Guardar
wb.save("datos/reporte_ejecutivo.xlsx")
print("‚úÖ reporte_ejecutivo.xlsx creado")
print("   üìä Hoja 1: Dashboard con KPIs y ranking de sucursales")
print(f"   üíº Hoja 2: N√≥mina ({len(empleados)} empleados)")
print(f"   üèÜ Hoja 3: Productos Top ({len(ventas_prod)} productos)")

---

## üî• Retos

1. **Filtrador de ventas:** Crea una funci√≥n que reciba la ruta del CSV de ventas y permita filtrar por sucursal, producto o rango de fechas. Guarda el resultado filtrado en un nuevo CSV.

2. **Comparador mensual:** Lee el CSV de ventas, agrupa por semana (semana 1: d√≠as 1-7, semana 2: d√≠as 8-14, etc.) y genera un Excel con una hoja por semana mostrando el detalle de ventas.

3. **Reporte de n√≥mina:** Lee empleados.csv, calcula deducciones (ISR 12%, IMSS 3%), genera un Excel con el recibo de n√≥mina de cada empleado y una hoja resumen con el costo total por sucursal.


In [None]:
# Reto 1: Filtrador de ventas
# Tu c√≥digo aqu√≠ üëá


In [None]:
# Reto 2: Comparador mensual
# Tu c√≥digo aqu√≠ üëá


In [None]:
# Reto 3: Reporte de n√≥mina
# Tu c√≥digo aqu√≠ üëá


---

## üìã Resumen

### CSV
| Operaci√≥n | C√≥digo |
|-----------|--------|
| Leer como listas | `csv.reader(f)` |
| Leer como diccionarios | `csv.DictReader(f)` |
| Escribir listas | `csv.writer(f).writerows(datos)` |
| Escribir diccionarios | `csv.DictWriter(f, fieldnames).writerows(datos)` |

### Excel (openpyxl)
| Operaci√≥n | C√≥digo |
|-----------|--------|
| Abrir archivo | `openpyxl.load_workbook("archivo.xlsx")` |
| Crear nuevo | `openpyxl.Workbook()` |
| Seleccionar hoja | `wb["NombreHoja"]` o `wb.active` |
| Leer celda | `ws["A1"].value` o `ws.cell(row, col).value` |
| Escribir celda | `ws["A1"] = valor` |
| Recorrer filas | `ws.iter_rows(min_row=2, values_only=True)` |
| Formato | `Font()`, `PatternFill()`, `Alignment()`, `Border()` |
| F√≥rmulas | `ws["A1"] = "=SUM(B2:B10)"` |
| Guardar | `wb.save("archivo.xlsx")` |

---

## ‚è≠Ô∏è ¬øQu√© sigue?

En el siguiente notebook aprender√°s **Pandas** ‚Äî la librer√≠a m√°s poderosa de Python para an√°lisis de datos. Todo lo que hicimos aqu√≠ con CSV y openpyxl se puede hacer en 2-3 l√≠neas con Pandas.

üëâ [07 ‚Äî Pandas B√°sico](07_Pandas_Basico.ipynb)

---

<p align="center">
  Hecho con ‚ù§Ô∏è por <a href="https://culiacan.ai">Culiacan.AI</a> ‚Äî Culiac√°n reconocida en el mundo por su talento y emprendimiento en Inteligencia Artificial
</p>
