# 13 - Formatos JSON y CSV: datos estructurados

## Objetivos de Aprendizaje

En esta sesion aprenderas:

1. Diferenciar JSON y CSV y cuando usar cada uno.
2. Convertir entre objetos Python y JSON con `json`.
3. Leer y escribir JSON en archivos de forma segura.
4. Trabajar con CSV usando `csv.reader` y `csv.DictReader`.
5. Escribir CSV con `csv.writer` y `csv.DictWriter`.
6. Transformar datos entre CSV y JSON.
7. Validar estructura y manejar errores comunes.
8. Resolver ejercicios practicos con datos reales.

---

## Ruta de la sesion (secuencia ideal)

1. Que es JSON y CSV.
2. JSON en Python: `dumps` y `loads`.
3. JSON en archivos: `dump` y `load`.
4. CSV basico: filas y columnas.
5. `reader` y `writer`.
6. `DictReader` y `DictWriter`.
7. Conversion CSV a JSON.
8. Ejercicios.
9. Resumen y errores comunes.


## 1. Que es JSON y CSV

- **JSON**: formato estructurado por claves y valores. Ideal para APIs, configuracion y datos anidados.
- **CSV**: texto tabular con filas y columnas. Ideal para hojas de calculo y datos simples.

Piensa en JSON como un arbol de datos; CSV como una tabla.


In [None]:
import json

persona = {
    "nombre": "Ana",
    "edad": 21,
    "skills": ["python", "sql"],
    "activo": True,
}

texto = json.dumps(persona, ensure_ascii=True)
print(texto)


## 2. JSON en Python: `dumps()` y `loads()`

- `json.dumps(obj)`: convierte un objeto Python a string JSON.
- `json.loads(texto)`: convierte un string JSON a objeto Python.

Usa `indent=2` para que sea legible.


In [None]:
import json

producto = {"id": 10, "nombre": "Teclado", "precio": 399.9}

texto = json.dumps(producto, ensure_ascii=True, indent=2)
print(texto)

copia = json.loads(texto)
print(copia["nombre"], copia["precio"])


## 3. Leer y escribir JSON en archivos

Puedes usar `json.dump()` y `json.load()` junto con `Path`.


In [None]:
import json
from pathlib import Path
from tempfile import TemporaryDirectory

with TemporaryDirectory() as tmp:
    ruta = Path(tmp) / "config.json"
    config = {"tema": "claro", "idioma": "es", "version": 3}

    ruta.write_text(json.dumps(config, ensure_ascii=True, indent=2), encoding="utf-8")

    data = json.loads(ruta.read_text(encoding="utf-8"))
    print(data)


## 4. Validacion basica de JSON

Si esperas claves especificas, valida antes de usar los datos. Tambien maneja errores con `try/except`.


In [None]:
import json

def cargar_config(texto):
    try:
        data = json.loads(texto)
    except json.JSONDecodeError:
        return None

    claves = {"tema", "idioma"}
    if not claves.issubset(data):
        return None

    return data

print(cargar_config('{"tema": "oscuro", "idioma": "es"}'))
print(cargar_config('{"tema": "oscuro"}'))


## 5. CSV: filas y columnas

Un archivo CSV es una tabla simple. En Python lo manejas con el modulo `csv`.


In [None]:
import csv
from io import StringIO

texto = '''nombre,edad,ciudad
Ana,21,CDMX
Luis,20,Guadalajara
'''

f = StringIO(texto)
reader = csv.reader(f)

for fila in reader:
    print(fila)


## 6. `csv.reader` y `csv.writer`

`reader` produce listas por fila. `writer` escribe filas usando listas.


In [None]:
import csv
from io import StringIO

salida = StringIO()
writer = csv.writer(salida)

writer.writerow(["producto", "precio"])
writer.writerow(["mouse", 250])
writer.writerow(["teclado", 399])

print(salida.getvalue())


## 7. `DictReader` y `DictWriter`

Con diccionarios es mas comodo cuando hay encabezados.


In [None]:
import csv
from io import StringIO

texto = '''id,nombre,precio
1,mouse,250
2,teclado,399
'''

f = StringIO(texto)
reader = csv.DictReader(f)

for fila in reader:
    print(fila["nombre"], fila["precio"])


## 8. CSV a JSON

Una forma comun es convertir filas CSV a una lista de diccionarios y luego a JSON.


In [None]:
import csv
import json
from io import StringIO

texto = '''id,nombre,precio
1,mouse,250
2,teclado,399
'''

f = StringIO(texto)
reader = csv.DictReader(f)

filas = list(reader)
texto_json = json.dumps(filas, ensure_ascii=True, indent=2)
print(texto_json)


## 9. Buenas practicas

- Especifica `encoding="utf-8"` al leer/escribir archivos.
- Usa `newline=""` al abrir CSV para evitar filas vacias extra.
- Convierte tipos: todo llega como texto en CSV.
- Valida claves y estructura antes de asumir.


## 10. Ejercicios Practicos

Resuelve los siguientes ejercicios. Cada uno incluye una propuesta de solucion.


### Ejercicio 1: Total de ventas en JSON
**Tarea**: Dado el JSON `ventas_json`, calcula el total de ventas solo de las que tienen `estado == "pagado"`.


In [None]:
# Tu codigo aqui:
# ventas_json = '[{"id":1,"monto":120,"estado":"pagado"},{"id":2,"monto":80,"estado":"pendiente"},{"id":3,"monto":50,"estado":"pagado"}]'
# ...

# SOLUCION:
import json

ventas_json = '[{"id":1,"monto":120,"estado":"pagado"},{"id":2,"monto":80,"estado":"pendiente"},{"id":3,"monto":50,"estado":"pagado"}]'
ventas = json.loads(ventas_json)

total = sum(v["monto"] for v in ventas if v["estado"] == "pagado")
print(total)


### Ejercicio 2: Registros incompletos
**Tarea**: Dada una lista de usuarios, devuelve los `id` que NO tengan `email`.


In [None]:
# Tu codigo aqui:
# usuarios = [
#     {"id": 1, "nombre": "Ana", "email": "ana@mail.com"},
#     {"id": 2, "nombre": "Luis"},
#     {"id": 3, "nombre": "Sofia", "email": "sofia@mail.com"},
# ]
# ...

# SOLUCION:
usuarios = [
    {"id": 1, "nombre": "Ana", "email": "ana@mail.com"},
    {"id": 2, "nombre": "Luis"},
    {"id": 3, "nombre": "Sofia", "email": "sofia@mail.com"},
]

faltantes = [u["id"] for u in usuarios if "email" not in u]
print(faltantes)


### Ejercicio 3: JSON bonito a archivo
**Tarea**: Guarda `datos` como JSON con indentacion en un archivo temporal y luego leelo.


In [None]:
# Tu codigo aqui:
# datos = {"curso": "Python", "nivel": "basico", "temas": ["json", "csv"]}
# ...

# SOLUCION:
import json
from pathlib import Path
from tempfile import TemporaryDirectory

with TemporaryDirectory() as tmp:
    ruta = Path(tmp) / "curso.json"
    datos = {"curso": "Python", "nivel": "basico", "temas": ["json", "csv"]}

    ruta.write_text(json.dumps(datos, ensure_ascii=True, indent=2), encoding="utf-8")
    leido = json.loads(ruta.read_text(encoding="utf-8"))
    print(leido)


### Ejercicio 4: CSV a lista de diccionarios
**Tarea**: Convierte el CSV `texto` a una lista de diccionarios usando `DictReader`.


In [None]:
# Tu codigo aqui:
# texto = '''id,nombre,puntos
# 1,Ana,90
# 2,Luis,75
# 3,Sofia,88
# '''
# ...

# SOLUCION:
import csv
from io import StringIO

texto = '''id,nombre,puntos
1,Ana,90
2,Luis,75
3,Sofia,88
'''

f = StringIO(texto)
filas = list(csv.DictReader(f))
print(filas)


### Ejercicio 5: Escribir CSV desde diccionarios
**Tarea**: A partir de `productos`, genera un CSV en memoria con encabezados.


In [None]:
# Tu codigo aqui:
# productos = [
#     {"id": 1, "nombre": "mouse", "precio": 250},
#     {"id": 2, "nombre": "teclado", "precio": 399},
# ]
# ...

# SOLUCION:
import csv
from io import StringIO

productos = [
    {"id": 1, "nombre": "mouse", "precio": 250},
    {"id": 2, "nombre": "teclado", "precio": 399},
]

salida = StringIO()
writer = csv.DictWriter(salida, fieldnames=["id", "nombre", "precio"])
writer.writeheader()
writer.writerows(productos)

print(salida.getvalue())


### Ejercicio 6: Conversion de tipos en CSV
**Tarea**: Calcula el promedio de `precio` convirtiendo los valores a `float`.


In [None]:
# Tu codigo aqui:
# texto = '''producto,precio
# mouse,250
# teclado,399.5
# cable,not_available
# '''
# ...

# SOLUCION:
import csv
from io import StringIO

texto = '''producto,precio
mouse,250
teclado,399.5
cable,not_available
'''

f = StringIO(texto)
reader = csv.DictReader(f)

precios = []
for fila in reader:
    try:
        precios.append(float(fila["precio"]))
    except ValueError:
        continue

promedio = sum(precios) / len(precios)
print(promedio)


### Ejercicio 7: CSV a JSON con tipado
**Tarea**: Convierte el CSV a JSON y transforma `edad` a entero.


In [None]:
# Tu codigo aqui:
# texto = '''id,nombre,edad
# 1,Ana,21
# 2,Luis,20
# '''
# ...

# SOLUCION:
import csv
import json
from io import StringIO

texto = '''id,nombre,edad
1,Ana,21
2,Luis,20
'''

f = StringIO(texto)
reader = csv.DictReader(f)

filas = []
for fila in reader:
    fila["id"] = int(fila["id"])
    fila["edad"] = int(fila["edad"])
    filas.append(fila)

print(json.dumps(filas, ensure_ascii=True, indent=2))


### Ejercicio 8: Validacion minima de estructura
**Tarea**: Dado `datos`, valida que cada elemento tenga `id`, `nombre` y `precio`.
Devuelve una lista con los indices invalidos.


In [None]:
# Tu codigo aqui:
# datos = [
#     {"id": 1, "nombre": "mouse", "precio": 250},
#     {"id": 2, "nombre": "teclado"},
#     {"id": 3, "nombre": "monitor", "precio": 3200},
# ]
# ...

# SOLUCION:
datos = [
    {"id": 1, "nombre": "mouse", "precio": 250},
    {"id": 2, "nombre": "teclado"},
    {"id": 3, "nombre": "monitor", "precio": 3200},
]

requeridas = {"id", "nombre", "precio"}
invalidos = [i for i, d in enumerate(datos) if not requeridas.issubset(d)]
print(invalidos)


## 11. Resumen de conceptos clave

| Concepto | Que es | Ejemplo |
|----------|--------|---------|
| `json.dumps` | Objeto a texto JSON | `json.dumps(data)` |
| `json.loads` | Texto JSON a objeto | `json.loads(texto)` |
| `csv.reader` | Filas como listas | `csv.reader(f)` |
| `csv.DictReader` | Filas como dicts | `csv.DictReader(f)` |
| `csv.writer` | Escribir filas | `writer.writerow([...])` |
| `csv.DictWriter` | Escribir dicts | `writer.writeheader()` |


## 12. Errores comunes y buenas practicas

1. Olvidar que CSV siempre llega como texto.
2. No usar `newline=""` al escribir CSV en archivos.
3. No validar claves antes de usar un JSON.
4. Asumir que el JSON siempre esta bien formado.
5. Mezclar formatos (intentar leer JSON con `csv`).
