# Dossier de Aprendizaje de Python: Fundamentos, Buenas Prácticas, Analytics y Visualización

Este dossier resume los contenidos de los cuadernos (variables, funciones, clases, buenas prácticas, analytics y visualización) y los organiza como una guía integral para estudiar y repasar.

## Índice
1. Introducción y entorno
2. Fundamentos de Python (variables, tipos, listas, dicts)
3. Funciones y control de flujo (if/elif/else, for/while)
4. Programación Orientada a Objetos (clases, métodos, herencia)
5. Buenas prácticas de programación (docstrings, PEP 8, pathlib, .env, errores, estructura, testing)
6. Análisis de datos con pandas
7. Visualización con matplotlib y seaborn
8. Buenas prácticas de visualización (colores, accesibilidad, storytelling, checklist)
9. Recursos y próximos pasos

## 1. Introducción y entorno
- Python 3: lenguaje multiparadigma, tipado dinámico.
- Entorno recomendado: venv/uv, gestión de dependencias con `pyproject.toml`.
- Notebooks Jupyter para aprendizaje interactivo.
- Librerías clave: pandas, numpy, matplotlib, seaborn.

Ejemplo mínimo de `pyproject.toml` (formateo y estilo):
- tool.black: longitud de línea 88.
- tool.isort: profile 'black'.

## 2. Fundamentos de Python
Tipos básicos: int, float, str, bool. Estructuras: list, dict, tuple, set.
- Variables y buenas nomenclaturas: `snake_case`, nombres descriptivos.
- Listas: indexación, slicing, métodos (`append`, `extend`, `sort`).
- Diccionarios: claves/valores, `get`, `keys`, `items`.
- Mutabilidad y tipado dinámico.

Ejemplo breve:
- Lista de precios (list + dict).
- Cálculo simple con control de errores.

In [None]:
# Fundamentos: listas y diccionarios
precios = {"manzana": 0.8, "banana": 0.5, "pera": 1.1}
compra = ["manzana", "pera", "banana"]
total = sum(precios.get(item, 0) for item in compra)
print(f'Total: ${total:.2f}')

## 3. Funciones y control de flujo
- Definición de funciones, argumentos (posicionales, keyword, default, `*args`, `**kwargs`).
- Condicionales `if/elif/else`.
- Bucles `for` y `while`, patrones comunes (acumuladores, filtros).
- Comprehensions y expresiones generadoras.

In [None]:
def es_aprobado(nota: int) -> bool:
    return nota >= 60

notas = [45, 70, 85, 55]
aprobados = [n for n in notas si := es_aprobado(n)]  # comprensión + función
print('Aprobados:', aprobados)

## 4. Programación Orientada a Objetos (POO)
- Clases, atributos, métodos, `__init__`.
- Encapsulamiento (convenciones), herencia y polimorfismo.
- Representación (`__repr__`) y métodos especiales.

In [None]:
class Persona:
    def __init__(self, nombre: str, edad: int):
        self.nombre = nombre
        self.edad = edad
    def saludar(self) -> str:
        return f'Hola, soy {self.nombre} y tengo {self.edad} años.'

print(Persona('Ana', 30).saludar())

## 5. Buenas prácticas de programación
### Docstrings y tipos
- Usa docstrings (triple comilla) con Args/Returns/Raises/Examples.
- Type hints para mejorar legibilidad y tooling.

### Estilo (PEP 8)
- `snake_case` para funciones/variables, `PascalCase` para clases.
- Longitud de línea razonable, imports ordenados (stdlib, terceros, local).

### Rutas con `pathlib`
- Evita concatenación de strings; usa `Path` y operadores `/`.

### Configuración con 
- Variables sensibles en `.env` (no subir a git).

### Manejo de errores
- `try/except/else/finally`.
- Excepciones personalizadas para validación de dominio.

### Estructura de proyecto
- `src/` para código, `tests/` para pruebas, `docs/`, `scripts/`.
- `pyproject.toml` para dependencias y herramientas.

### Testing
- Pytest/unittest, AAA (Arrange-Act-Assert), TDD.

In [None]:
from pathlib import Path
import json

def leer_config(ruta: str) -> dict:
    """Lee un JSON de configuración con manejo de errores.
    Args: ruta (str): ruta del archivo.
    Returns: dict
    Raises: FileNotFoundError, json.JSONDecodeError
    """
    p = Path(ruta)
    with p.open('r', encoding='utf-8') as f:
        return json.load(f)

# Ejemplo (el archivo puede no existir en este entorno)
print('Ejemplo función con docstring y pathlib definida.')

## 6. Análisis de datos con pandas
- DataFrames: carga, inspección (`head`, `info`, `describe`).
- Limpieza: valores faltantes, tipos, duplicados.
- Transformaciones: `assign`, `groupby`, `merge`, `pivot`.
- Métricas y KPIs: tasas, medias, percentiles.

Ejemplo (resumen inspirado en Titanic simulado):
- Tasa de supervivencia por sexo y clase.
- Distribuciones (edad, tarifa).

In [None]:
import pandas as pd, numpy as np
np.random.seed(42)
df = pd.DataFrame({
    'Survived': np.random.choice([0,1], 500, p=[0.62,0.38]),
    'Pclass': np.random.choice([1,2,3], 500, p=[0.24,0.21,0.55]),
    'Sex': np.random.choice(['male','female'], 500, p=[0.65,0.35])
})
resumen = df.groupby(['Sex','Pclass'])['Survived'].mean().round(2)
print(resumen)

## 7. Visualización con matplotlib y seaborn
- Gráficos básicos: barras, líneas, histograma, pie (con moderación).
- Dashboard con subplots y títulos/leyendas claros.
- Seaborn para gráficos estadísticos (boxplot, violin, heatmap, FacetGrid).

## 8. Buenas prácticas de visualización
### Principios
- Claridad > complejidad; una idea principal por gráfico.
- Elección del gráfico adecuada al objetivo (comparación, distribución, tendencia, correlación).
- Diseño: títulos específicos, ejes etiquetados, leyenda necesaria, formato numérico.
- Honestidad: escalas apropiadas y contexto.

### Colores y accesibilidad
- Paletas: secuencial, divergente, cualitativa.
- Evita combinaciones rojo/verde; usa paletas seguras (Viridis, Cividis, Tol, IBM).
- No depender solo del color: añadir etiquetas/formas.

### Storytelling con datos
- Contexto → Conflicto → Resolución; anota y resalta lo clave.

### Checklist final
- Objetivo claro, audiencia definida, gráfico correcto, accesible, mensaje accionable.

## 9. Recursos y próximos pasos
- Documentación oficial: Python, pandas, matplotlib, seaborn.
- Guías de estilo: PEP 8, Google Python Style.
- Práctica: ejercicios incrementales, TDD en funciones puras, microproyectos.
- Mejora continua: revisar código con linters/formatters y pruebas automáticas.