# D√≠a 3: Funciones Limpias\n\n## Descripci√≥n General\n\nLas funciones son los bloques fundamentales de construcci√≥n en la programaci√≥n. Escribir funciones limpias y bien dise√±adas es esencial para crear c√≥digo mantenible, legible y f√°cil de probar. En este notebook, aprender√°s los principios clave para escribir funciones que sean peque√±as, enfocadas y f√°ciles de entender.\n\nUna funci√≥n limpia hace una cosa y la hace bien. Tiene un nombre descriptivo, pocos par√°metros, y es f√°cil de leer de arriba a abajo como una narrativa.

## Objetivos de Aprendizaje\n\nAl finalizar este notebook, ser√°s capaz de:\n\n1. Aplicar el principio de responsabilidad √∫nica (SRP) a funciones\n2. Escribir funciones peque√±as y enfocadas que hagan una sola cosa\n3. Limitar el n√∫mero de par√°metros en funciones para mejorar la legibilidad\n4. Identificar y refactorizar funciones que hacen demasiado\n5. Organizar c√≥digo en niveles de abstracci√≥n apropiados

## 1. El Principio de Responsabilidad √önica (SRP)\n\n### üéØ Contexto: Por Qu√© Importa\n\n**Problema real en Data/IA**: \n\nEst√°s construyendo un pipeline de ML. Tienes una funci√≥n `train_model()` que: carga datos, limpia datos, entrena modelo, eval√∫a modelo, guarda modelo, env√≠a m√©tricas a dashboard, y notifica por email. Cuando falla, ¬ød√≥nde est√° el bug? ¬øEn la carga? ¬øEn el entrenamiento? ¬øEn el guardado? **Imposible saber sin debuggear todo** üí•\n\nCuando necesitas cambiar c√≥mo guardas el modelo, tienes que tocar una funci√≥n de 200 l√≠neas que hace 7 cosas diferentes. **Alto riesgo de romper algo** üí•\n\n**Ejemplo concreto para juniors**:\n\nTienes funci√≥n `process_user_data()` que valida email, normaliza nombre, guarda en DB, y env√≠a email de bienvenida. Cuando el email falla, toda la funci√≥n falla. Cuando quieres cambiar la validaci√≥n, tienes que entender toda la l√≥gica de guardado y env√≠o de emails.\n\n**Consecuencias de NO usarlo**:\n- **Debugging dif√≠cil** ‚Üí no sabes qu√© parte fall√≥\n- **Testing imposible** ‚Üí no puedes testear validaci√≥n sin DB y email\n- **Cambios riesgosos** ‚Üí modificar una parte puede romper otra\n- **No reutilizable** ‚Üí no puedes usar solo la validaci√≥n en otro lugar\n- **Code reviews lentos** ‚Üí revisor debe entender 7 cosas a la vez\n\n### üìö El Concepto\n\n**Definici√≥n t√©cnica**:\n\nUna funci√≥n debe tener **una sola raz√≥n para cambiar**. Debe hacer **una cosa** y hacerla bien. Si puedes describir lo que hace con \"Y\" u \"O\", hace demasiado.\n\n**C√≥mo identificar violaciones**:\n1. Nombre de funci√≥n usa \"and\" o \"or\": `validate_and_save()` ‚ùå\n2. Funci√≥n tiene m√∫ltiples secciones con comentarios: `# Validate`, `# Transform`, `# Save` ‚ùå\n3. Funci√≥n tiene m√∫ltiples niveles de indentaci√≥n (>3) ‚ùå\n4. No puedes testear una parte sin las otras ‚ùå\n5. Cambiar una cosa requiere entender toda la funci√≥n ‚ùå\n\n**Terminolog√≠a clave**:\n- **Single Responsibility**: Una sola raz√≥n para cambiar\n- **Cohesi√≥n**: Qu√© tan relacionadas est√°n las operaciones\n- **Acoplamiento**: Qu√© tan dependientes son las partes\n- **Separation of Concerns**: Separar diferentes preocupaciones

In [None]:
# BAD: Function doing too many things\ndef process_user_data(user_dict):\n    \"\"\"Process user data - validates, transforms, saves, and sends email.\"\"\"\n    # Validate\n    if not user_dict.get('email'):\n        raise ValueError('Email required')\n    if '@' not in user_dict['email']:\n        raise ValueError('Invalid email')\n    \n    # Transform\n    user_dict['email'] = user_dict['email'].lower().strip()\n    user_dict['name'] = user_dict.get('name', '').title()\n    \n    # Save to database\n    db_connection = get_database_connection()\n    db_connection.execute('INSERT INTO users VALUES (?)', user_dict)\n    \n    # Send welcome email\n    email_client = get_email_client()\n    email_client.send(user_dict['email'], 'Welcome!')\n    \n    return user_dict

In [None]:
# GOOD: Each function has a single responsibility\ndef validate_user_email(email: str) -> str:\n    \"\"\"\n    Validate and normalize email address.\n    \n    :param email: Email address to validate\n    :type email: str\n    :return: Normalized email address\n    :rtype: str\n    :raises ValueError: If email is invalid\n    \"\"\"\n    if not email:\n        raise ValueError('Email required')\n    if '@' not in email:\n        raise ValueError('Invalid email')\n    return email.lower().strip()\n\n\ndef normalize_user_name(name: str) -> str:\n    \"\"\"\n    Normalize user name to title case.\n    \n    :param name: User name\n    :type name: str\n    :return: Normalized name\n    :rtype: str\n    \"\"\"\n    return name.title() if name else ''\n\n\ndef save_user_to_database(user_data: dict) -> None:\n    \"\"\"\n    Save user data to database.\n    \n    :param user_data: User information\n    :type user_data: dict\n    \"\"\"\n    db_connection = get_database_connection()\n    db_connection.execute('INSERT INTO users VALUES (?)', user_data)\n\n\ndef send_welcome_email(email: str) -> None:\n    \"\"\"\n    Send welcome email to new user.\n    \n    :param email: User email address\n    :type email: str\n    \"\"\"\n    email_client = get_email_client()\n    email_client.send(email, 'Welcome!')\n\n\ndef process_user_data(user_dict: dict) -> dict:\n    \"\"\"\n    Process new user registration.\n    \n    :param user_dict: Raw user data\n    :type user_dict: dict\n    :return: Processed user data\n    :rtype: dict\n    \"\"\"\n    user_dict['email'] = validate_user_email(user_dict.get('email', ''))\n    user_dict['name'] = normalize_user_name(user_dict.get('name', ''))\n    save_user_to_database(user_dict)\n    send_welcome_email(user_dict['email'])\n    return user_dict

### üí° Aprendizaje Clave\n\n**Puntos cr√≠ticos a recordar**:\n1. Una funci√≥n = **una raz√≥n para cambiar** (no 7 razones)\n2. Si usas \"Y\" u \"O\" para describir ‚Üí **divide la funci√≥n**\n3. Comentarios que separan secciones ‚Üí **cada secci√≥n es una funci√≥n**\n4. No puedes testear una parte sin las otras ‚Üí **mal dise√±o**\n\n**C√≥mo desarrollar intuici√≥n**:\n- **Preg√∫ntate**: \"¬øCu√°ntas razones tiene esta funci√≥n para cambiar?\"\n  - 1 raz√≥n ‚Üí perfecto ‚úÖ\n  - 2+ razones ‚Üí divide en funciones ‚ùå\n\n- **Preg√∫ntate**: \"¬øPuedo testear cada parte independientemente?\"\n  - S√ç ‚Üí buen dise√±o ‚úÖ\n  - NO ‚Üí funciones acopladas ‚ùå\n\n**Cu√°ndo usar / NO usar**:\n- ‚úÖ **SIEMPRE aplica SRP**:\n  - Funciones de negocio\n  - Funciones de procesamiento\n  - Funciones de validaci√≥n\n  - Funciones de transformaci√≥n\n  \n- ‚ö†Ô∏è **Excepci√≥n rara**:\n  - Scripts one-off muy simples\n  - Prototipos r√°pidos (pero refactoriza despu√©s)\n\n**Patr√≥n de refactorizaci√≥n**:\n```python\n# Antes: 1 funci√≥n hace 4 cosas\ndef process_data(data):\n    # Validate (raz√≥n 1)\n    # Transform (raz√≥n 2)\n    # Save (raz√≥n 3)\n    # Notify (raz√≥n 4)\n    pass\n\n# Despu√©s: 4 funciones, cada una hace 1 cosa\ndef validate_data(data): ...\ndef transform_data(data): ...\ndef save_data(data): ...\ndef notify_completion(data): ...\n\ndef process_data(data):\n    validated = validate_data(data)\n    transformed = transform_data(validated)\n    save_data(transformed)\n    notify_completion(transformed)\n```\n\n**Beneficios medibles**:\n- **Testing**: 4 tests simples vs 1 test complejo\n- **Debugging**: Sabes exactamente qu√© funci√≥n fall√≥\n- **Reutilizaci√≥n**: Puedes usar `validate_data()` en otro lugar\n- **Cambios**: Modificar validaci√≥n no afecta guardado\n\n**Referencia oficial:** [PEP 8 - Style Guide for Python Code](https://peps.python.org/pep-0008/)

## 2. Funciones Peque√±as\n\n### üéØ Contexto: Por Qu√© Importa\n\n**Problema real en Data/IA**: \n\nEst√°s revisando c√≥digo de un colega. Encuentras funci√≥n `preprocess_dataset()` de **150 l√≠neas**. Tiene 8 niveles de indentaci√≥n, 15 variables locales, y hace: carga datos, maneja missing values, normaliza features, hace encoding, split train/test, aplica transformaciones, valida resultados, y guarda outputs. **Tardas 30 minutos en entender qu√© hace** üí•\n\nHay un bug en la normalizaci√≥n. Para arreglarlo, tienes que entender toda la funci√≥n porque las variables se reutilizan. **Alto riesgo de romper algo** üí•\n\n**Ejemplo concreto para juniors**:\n\nFunci√≥n `generate_report()` de 80 l√≠neas: parsea datos, calcula estad√≠sticas, agrupa por categor√≠a, formatea output, genera gr√°ficos, y guarda archivo. Cuando necesitas cambiar el formato, tienes que leer 80 l√≠neas para encontrar las 5 l√≠neas relevantes.\n\n**Consecuencias de NO usarlo**:\n- **Comprensi√≥n lenta** ‚Üí 30 min para entender vs 2 min\n- **Bugs ocultos** ‚Üí dif√≠cil ver la l√≥gica completa\n- **Testing imposible** ‚Üí no puedes testear partes individuales\n- **Reutilizaci√≥n cero** ‚Üí no puedes extraer partes √∫tiles\n- **Onboarding lento** ‚Üí nuevos devs tardan d√≠as en entender\n\n### üìö El Concepto\n\n**Definici√≥n t√©cnica**:\n\nFunciones deben ser **peque√±as**. Idealmente **< 20 l√≠neas**, m√°ximo **< 50 l√≠neas**. Si es m√°s larga, probablemente hace m√∫ltiples cosas y debe dividirse.\n\n**Reglas de tama√±o**:\n1. **Ideal**: 5-20 l√≠neas\n2. **Aceptable**: 20-50 l√≠neas\n3. **Refactorizar**: > 50 l√≠neas\n4. **Alerta roja**: > 100 l√≠neas\n\n**Se√±ales de funci√≥n demasiado larga**:\n- M√°s de 3 niveles de indentaci√≥n\n- M√∫ltiples secciones con comentarios\n- Scroll necesario para ver toda la funci√≥n\n- M√∫ltiples variables temporales\n- Dif√≠cil nombrar sin usar \"and\"\n\n**Terminolog√≠a clave**:\n- **Funci√≥n peque√±a**: < 20 l√≠neas, hace una cosa\n- **Funci√≥n grande**: > 50 l√≠neas, probablemente hace m√∫ltiples cosas\n- **Complejidad ciclom√°tica**: N√∫mero de caminos de ejecuci√≥n\n- **Niveles de indentaci√≥n**: Profundidad de anidamiento

In [None]:
# BAD: Long function with multiple levels of abstraction\ndef generate_report(data):\n    \"\"\"Generate a comprehensive report from data.\"\"\"\n    # Parse data\n    parsed = []\n    for item in data:\n        if item.get('valid'):\n            parsed.append({\n                'id': item['id'],\n                'value': float(item['value']),\n                'category': item.get('category', 'unknown')\n            })\n    \n    # Calculate statistics\n    total = sum(item['value'] for item in parsed)\n    average = total / len(parsed) if parsed else 0\n    by_category = {}\n    for item in parsed:\n        cat = item['category']\n        if cat not in by_category:\n            by_category[cat] = []\n        by_category[cat].append(item['value'])\n    \n    # Format output\n    report = f\"Total: {total}\\n\"\n    report += f\"Average: {average:.2f}\\n\"\n    report += \"\\nBy Category:\\n\"\n    for cat, values in by_category.items():\n        cat_avg = sum(values) / len(values)\n        report += f\"  {cat}: {cat_avg:.2f}\\n\"\n    \n    return report

In [None]:
# GOOD: Small, focused functions\ndef parse_valid_items(data: list[dict]) -> list[dict]:\n    \"\"\"\n    Extract and normalize valid items from raw data.\n    \n    :param data: Raw data items\n    :type data: list[dict]\n    :return: Parsed valid items\n    :rtype: list[dict]\n    \"\"\"\n    return [\n        {\n            'id': item['id'],\n            'value': float(item['value']),\n            'category': item.get('category', 'unknown')\n        }\n        for item in data\n        if item.get('valid')\n    ]\n\n\ndef calculate_statistics(items: list[dict]) -> dict:\n    \"\"\"\n    Calculate total and average from items.\n    \n    :param items: Parsed items\n    :type items: list[dict]\n    :return: Statistics dictionary\n    :rtype: dict\n    \"\"\"\n    values = [item['value'] for item in items]\n    total = sum(values)\n    average = total / len(values) if values else 0\n    return {'total': total, 'average': average}\n\n\ndef group_by_category(items: list[dict]) -> dict[str, list[float]]:\n    \"\"\"\n    Group item values by category.\n    \n    :param items: Parsed items\n    :type items: list[dict]\n    :return: Values grouped by category\n    :rtype: dict[str, list[float]]\n    \"\"\"\n    by_category = {}\n    for item in items:\n        category = item['category']\n        by_category.setdefault(category, []).append(item['value'])\n    return by_category\n\n\ndef format_report(stats: dict, by_category: dict[str, list[float]]) -> str:\n    \"\"\"\n    Format statistics into a readable report.\n    \n    :param stats: Overall statistics\n    :type stats: dict\n    :param by_category: Values by category\n    :type by_category: dict[str, list[float]]\n    :return: Formatted report\n    :rtype: str\n    \"\"\"\n    lines = [\n        f\"Total: {stats['total']}\",\n        f\"Average: {stats['average']:.2f}\",\n        \"\\nBy Category:\"\n    ]\n    \n    for category, values in by_category.items():\n        avg = sum(values) / len(values)\n        lines.append(f\"  {category}: {avg:.2f}\")\n    \n    return '\\n'.join(lines)\n\n\ndef generate_report(data: list[dict]) -> str:\n    \"\"\"\n    Generate a comprehensive report from data.\n    \n    :param data: Raw data items\n    :type data: list[dict]\n    :return: Formatted report\n    :rtype: str\n    \"\"\"\n    items = parse_valid_items(data)\n    stats = calculate_statistics(items)\n    by_category = group_by_category(items)\n    return format_report(stats, by_category)

### üí° Aprendizaje Clave\n\n**Puntos cr√≠ticos a recordar**:\n1. **< 20 l√≠neas** es ideal, **< 50 l√≠neas** es aceptable\n2. Si necesitas **scroll** para ver toda la funci√≥n ‚Üí demasiado larga\n3. **> 3 niveles de indentaci√≥n** ‚Üí extrae funciones\n4. Comentarios que separan secciones ‚Üí **cada secci√≥n es una funci√≥n**\n\n**C√≥mo desarrollar intuici√≥n**:\n- **Preg√∫ntate**: \"¬øPuedo ver toda la funci√≥n sin scroll?\"\n  - S√ç ‚Üí tama√±o OK ‚úÖ\n  - NO ‚Üí divide en funciones ‚ùå\n\n- **Preg√∫ntate**: \"¬øEntiendo qu√© hace en 30 segundos?\"\n  - S√ç ‚Üí bien dise√±ada ‚úÖ\n  - NO ‚Üí demasiado compleja ‚ùå\n\n**Cu√°ndo usar / NO usar**:\n- ‚úÖ **SIEMPRE mant√©n funciones peque√±as**:\n  - Funciones de negocio\n  - Funciones de procesamiento\n  - Funciones de transformaci√≥n\n  - Funciones de validaci√≥n\n  \n- ‚ö†Ô∏è **Excepci√≥n rara**:\n  - Funciones con muchos casos edge (pero considera tabla de decisiones)\n  - Scripts one-off (pero refactoriza si reutilizas)\n\n**T√©cnicas de divisi√≥n**:\n```python\n# T√©cnica 1: Extraer por secciones\ndef big_function():\n    # Section 1: Parse ‚Üí extract_parse()\n    # Section 2: Calculate ‚Üí extract_calculate()\n    # Section 3: Format ‚Üí extract_format()\n    pass\n\n# T√©cnica 2: Extraer por niveles de indentaci√≥n\ndef big_function():\n    for item in items:\n        if condition:\n            # Nested logic ‚Üí extract_process_item()\n            pass\n\n# T√©cnica 3: Extraer c√°lculos complejos\ndef big_function():\n    result = (a * b + c) / (d - e) * f  # ‚Üí extract_calculate_metric()\n```\n\n**Beneficios medibles**:\n- **Comprensi√≥n**: 2 min vs 30 min\n- **Testing**: 5 tests simples vs 1 test complejo\n- **Debugging**: Sabes exactamente d√≥nde est√° el bug\n- **Reutilizaci√≥n**: Puedes usar funciones peque√±as en otros lugares\n\n**Herramientas para medir**:\n```python\n# Usar pylint para detectar funciones largas\n# pylint: disable=too-many-lines\n\n# Usar radon para medir complejidad\n# radon cc myfile.py -s\n```\n\n**Referencia oficial:** [Clean Code by Robert C. Martin](https://www.oreilly.com/library/view/clean-code-a/9780136083238/)

## 3. Limitar el N√∫mero de Par√°metros\n\n### üéØ Contexto: Por Qu√© Importa\n\n**Problema real en Data/IA**: \n\nEncuentras funci√≥n:\n```python\ntrain_model(data, target, test_size, random_state, n_estimators, \n            max_depth, min_samples_split, min_samples_leaf, \n            max_features, bootstrap, oob_score, n_jobs, verbose)\n```\n\n**13 par√°metros** üí• ¬øEn qu√© orden van? ¬øCu√°les son obligatorios? ¬øQu√© valores por defecto tienen? **Imposible recordar** üí•\n\nCada llamada es una pesadilla:\n```python\ntrain_model(X, y, 0.2, 42, 100, 10, 2, 1, 'sqrt', True, False, -1, 0)\n```\n¬øQu√© significa cada n√∫mero? **Nadie sabe sin ver la definici√≥n** üí•\n\n**Ejemplo concreto para juniors**:\n\nFunci√≥n `create_user(first, last, email, phone, address, city, state, zip, country, birth, gender)` con 11 par√°metros. Cada vez que la llamas, tienes que buscar el orden correcto. Cuando a√±ades un par√°metro, rompes todas las llamadas existentes.\n\n**Consecuencias de NO usarlo**:\n- **Llamadas ilegibles** ‚Üí nadie entiende qu√© hace cada argumento\n- **Errores frecuentes** ‚Üí par√°metros en orden incorrecto\n- **Testing pesadilla** ‚Üí necesitas mockear 13 par√°metros\n- **Cambios imposibles** ‚Üí a√±adir par√°metro rompe todo\n- **Documentaci√≥n compleja** ‚Üí 13 par√°metros para documentar\n\n### üìö El Concepto\n\n**Definici√≥n t√©cnica**:\n\nLimita funciones a **3 par√°metros o menos**. Si necesitas m√°s, agrupa par√°metros relacionados en objetos (dataclasses, dicts, namedtuples).\n\n**Reglas de par√°metros**:\n1. **Ideal**: 0-1 par√°metros (niladic, monadic)\n2. **Bueno**: 2 par√°metros (dyadic)\n3. **Aceptable**: 3 par√°metros (triadic)\n4. **Refactorizar**: > 3 par√°metros\n5. **Alerta roja**: > 5 par√°metros\n\n**T√©cnicas para reducir par√°metros**:\n1. **Dataclasses**: Agrupa par√°metros relacionados\n2. **Config objects**: Usa objeto de configuraci√≥n\n3. **Builder pattern**: Construye objeto paso a paso\n4. **Kwargs**: Para opciones opcionales\n5. **Method chaining**: Encadena llamadas\n\n**Terminolog√≠a clave**:\n- **Niladic**: 0 par√°metros\n- **Monadic**: 1 par√°metro\n- **Dyadic**: 2 par√°metros\n- **Triadic**: 3 par√°metros\n- **Polyadic**: > 3 par√°metros (evitar)

In [None]:
# BAD: Too many parameters\ndef create_user(first_name, last_name, email, phone, address, city, \n                state, zip_code, country, birth_date, gender):\n    \"\"\"Create a new user with all details.\"\"\"\n    # Implementation\n    pass

In [None]:
# GOOD: Use a data class to group related parameters\nfrom dataclasses import dataclass\nfrom datetime import date\n\n\n@dataclass\nclass UserProfile:\n    \"\"\"User profile information.\"\"\"\n    first_name: str\n    last_name: str\n    email: str\n    phone: str\n    \n\n@dataclass\nclass Address:\n    \"\"\"User address information.\"\"\"\n    street: str\n    city: str\n    state: str\n    zip_code: str\n    country: str\n    \n\n@dataclass\nclass PersonalInfo:\n    \"\"\"Personal information.\"\"\"\n    birth_date: date\n    gender: str\n\n\ndef create_user(profile: UserProfile, address: Address, \n                personal_info: PersonalInfo) -> dict:\n    \"\"\"\n    Create a new user with organized information.\n    \n    :param profile: User profile data\n    :type profile: UserProfile\n    :param address: Address data\n    :type address: Address\n    :param personal_info: Personal information\n    :type personal_info: PersonalInfo\n    :return: Created user data\n    :rtype: dict\n    \"\"\"\n    # Implementation\n    return {\n        'profile': profile,\n        'address': address,\n        'personal_info': personal_info\n    }

### üí° Aprendizaje Clave\n\n**Puntos cr√≠ticos a recordar**:\n1. **‚â§ 3 par√°metros** es la regla de oro\n2. **> 3 par√°metros** ‚Üí agrupa en objetos\n3. **Par√°metros booleanos** ‚Üí divide en 2 funciones\n4. **Orden importa** ‚Üí par√°metros m√°s importantes primero\n\n**C√≥mo desarrollar intuici√≥n**:\n- **Preg√∫ntate**: \"¬øPuedo recordar el orden de los par√°metros?\"\n  - S√ç (‚â§ 3) ‚Üí OK ‚úÖ\n  - NO (> 3) ‚Üí agrupa en objeto ‚ùå\n\n- **Preg√∫ntate**: \"¬øLos par√°metros est√°n relacionados?\"\n  - S√ç ‚Üí agrupa en dataclass ‚úÖ\n  - NO ‚Üí tal vez la funci√≥n hace demasiado ‚ùå\n\n**Cu√°ndo usar / NO usar**:\n- ‚úÖ **Usar agrupaci√≥n cuando**:\n  - > 3 par√°metros relacionados\n  - Par√°metros siempre van juntos\n  - Necesitas a√±adir m√°s par√°metros en el futuro\n  - Par√°metros forman concepto cohesivo\n  \n- ‚ùå **NO agrupar cuando**:\n  - Solo 2-3 par√°metros simples\n  - Par√°metros no relacionados\n  - Agrupaci√≥n a√±ade complejidad innecesaria\n\n**Patrones de refactorizaci√≥n**:\n```python\n# Patr√≥n 1: Dataclass para par√°metros relacionados\n@dataclass\nclass UserInfo:\n    first_name: str\n    last_name: str\n    email: str\n\ndef create_user(info: UserInfo, address: Address): ...\n\n# Patr√≥n 2: Config object\n@dataclass\nclass ModelConfig:\n    n_estimators: int = 100\n    max_depth: int = 10\n    random_state: int = 42\n\ndef train_model(data, config: ModelConfig): ...\n\n# Patr√≥n 3: Builder pattern\nmodel = ModelBuilder()\\\n    .with_estimators(100)\\\n    .with_depth(10)\\\n    .build()\n\n# Patr√≥n 4: Kwargs para opciones\ndef process_data(data, **options): ...\n```\n\n**Antipatr√≥n: Par√°metro booleano**:\n```python\n# ‚ùå MAL: Flag parameter\ndef save_data(data, compress=False):\n    if compress:\n        # Logic A\n    else:\n        # Logic B\n\n# ‚úÖ BIEN: Dos funciones\ndef save_data(data): ...\ndef save_compressed_data(data): ...\n```\n\n**Beneficios medibles**:\n- **Legibilidad**: Llamadas auto-documentadas\n- **Mantenibilidad**: A√±adir par√°metro no rompe c√≥digo\n- **Testing**: Menos combinaciones para testear\n- **Refactoring**: M√°s f√°cil cambiar estructura\n\n**Referencia oficial:** [Python dataclasses](https://docs.python.org/3/library/dataclasses.html)

## 4. Niveles de Abstracci√≥n\n\n### üéØ Contexto: Por Qu√© Importa\n\n**Problema real en Data/IA**: \n\nLees funci√≥n `process_orders()`:\n```python\ndef process_orders(orders):\n    validate_orders(orders)  # Alto nivel\n    \n    # Bajo nivel mezclado\n    total = 0\n    for item in order['items']:\n        price = item['price']\n        qty = item['quantity']\n        disc = item.get('discount', 0)\n        total += price * qty * (1 - disc)\n    \n    charge_customer(total)  # Alto nivel otra vez\n```\n\nTu cerebro salta entre **conceptos de alto nivel** (validar, cobrar) y **detalles de bajo nivel** (loops, c√°lculos). **Dif√≠cil seguir la narrativa** üí•\n\n**Ejemplo concreto para juniors**:\n\nFunci√≥n que mezcla: llamadas a APIs (alto nivel), manipulaci√≥n de strings (bajo nivel), l√≥gica de negocio (medio nivel), y operaciones de bits (muy bajo nivel). Tu cerebro no puede mantener todos los niveles a la vez.\n\n**Consecuencias de NO usarlo**:\n- **Comprensi√≥n lenta** ‚Üí cerebro salta entre niveles\n- **Narrativa rota** ‚Üí no fluye como historia\n- **Mantenimiento dif√≠cil** ‚Üí cambios en bajo nivel afectan alto nivel\n- **Testing complejo** ‚Üí no puedes testear niveles independientemente\n\n### üìö El Concepto\n\n**Definici√≥n t√©cnica**:\n\nCada funci√≥n debe operar en **un solo nivel de abstracci√≥n**. No mezcles operaciones de alto nivel con detalles de bajo nivel.\n\n**Niveles de abstracci√≥n**:\n1. **Muy alto**: Conceptos de negocio (`process_payment`, `send_notification`)\n2. **Alto**: Operaciones de dominio (`validate_email`, `calculate_total`)\n3. **Medio**: Transformaciones (`parse_json`, `format_date`)\n4. **Bajo**: Operaciones b√°sicas (`split`, `lower`, `append`)\n5. **Muy bajo**: Operaciones de bits, memoria\n\n**Regla de lectura (Stepdown Rule)**:\nC√≥digo debe leerse como narrativa de arriba a abajo, cada funci√≥n un nivel m√°s bajo que la anterior:\n```\nprocess_orders()        # Nivel 1\n  ‚îú‚îÄ validate_orders()  # Nivel 2\n  ‚îú‚îÄ calculate_total()  # Nivel 2\n  ‚îî‚îÄ charge_customer()  # Nivel 2\n```\n\n**Terminolog√≠a clave**:\n- **Abstracci√≥n**: Ocultar detalles de implementaci√≥n\n- **Nivel de abstracci√≥n**: Qu√© tan cerca est√°s del hardware/detalles\n- **Stepdown rule**: Leer c√≥digo como bajando escaleras\n- **Leaky abstraction**: Cuando detalles de bajo nivel se filtran

In [None]:
# BAD: Mixed abstraction levels\ndef process_orders(orders):\n    \"\"\"Process customer orders.\"\"\"\n    for order in orders:\n        # High-level concept\n        validate_order(order)\n        \n        # Low-level details mixed in\n        total = 0\n        for item in order['items']:\n            price = item['price']\n            quantity = item['quantity']\n            discount = item.get('discount', 0)\n            total += price * quantity * (1 - discount)\n        \n        # High-level concept again\n        charge_customer(order['customer_id'], total)\n        send_confirmation(order)

In [None]:
# GOOD: Consistent abstraction level\ndef calculate_order_total(order: dict) -> float:\n    \"\"\"\n    Calculate total price for an order.\n    \n    :param order: Order data\n    :type order: dict\n    :return: Total price\n    :rtype: float\n    \"\"\"\n    return sum(\n        item['price'] * item['quantity'] * (1 - item.get('discount', 0))\n        for item in order['items']\n    )\n\n\ndef process_single_order(order: dict) -> None:\n    \"\"\"\n    Process a single customer order.\n    \n    :param order: Order data\n    :type order: dict\n    \"\"\"\n    validate_order(order)\n    total = calculate_order_total(order)\n    charge_customer(order['customer_id'], total)\n    send_confirmation(order)\n\n\ndef process_orders(orders: list[dict]) -> None:\n    \"\"\"\n    Process multiple customer orders.\n    \n    :param orders: List of orders\n    :type orders: list[dict]\n    \"\"\"\n    for order in orders:\n        process_single_order(order)

### üí° Aprendizaje Clave\n\n**Puntos cr√≠ticos a recordar**:\n1. **Un nivel por funci√≥n** ‚Üí no mezcles alto y bajo nivel\n2. **Stepdown rule** ‚Üí lee como bajando escaleras\n3. **Extrae detalles** ‚Üí detalles de bajo nivel en funciones separadas\n4. **Narrativa clara** ‚Üí debe fluir como historia\n\n**C√≥mo desarrollar intuici√≥n**:\n- **Preg√∫ntate**: \"¬øTodas las operaciones est√°n al mismo nivel?\"\n  - S√ç ‚Üí bien dise√±ada ‚úÖ\n  - NO ‚Üí extrae niveles diferentes ‚ùå\n\n- **Preg√∫ntate**: \"¬øPuedo leer esto como una historia?\"\n  - S√ç ‚Üí niveles consistentes ‚úÖ\n  - NO ‚Üí niveles mezclados ‚ùå\n\n**Cu√°ndo usar / NO usar**:\n- ‚úÖ **SIEMPRE mant√©n niveles consistentes**:\n  - Funciones de negocio\n  - Funciones de procesamiento\n  - Funciones de coordinaci√≥n\n  - Funciones p√∫blicas de API\n  \n- ‚ö†Ô∏è **Excepci√≥n rara**:\n  - Funciones de utilidad muy simples\n  - Performance cr√≠tico (pero documenta por qu√©)\n\n**Patr√≥n de refactorizaci√≥n**:\n```python\n# ‚ùå MAL: Niveles mezclados\ndef process_data(data):\n    validate(data)  # Alto nivel\n    \n    # Bajo nivel mezclado\n    result = []\n    for item in data:\n        if item['value'] > 0:\n            result.append(item['value'] * 2)\n    \n    save(result)  # Alto nivel\n\n# ‚úÖ BIEN: Niveles consistentes\ndef process_data(data):\n    validate(data)\n    transformed = transform(data)  # Mismo nivel\n    save(transformed)\n\ndef transform(data):\n    return [\n        item['value'] * 2\n        for item in data\n        if item['value'] > 0\n    ]\n```\n\n**Test de niveles**:\n```python\n# Pregunta: ¬øQu√© nivel es cada operaci√≥n?\n\n# Alto nivel\nprocess_payment()\nsend_notification()\n\n# Medio nivel\nvalidate_email()\ncalculate_total()\n\n# Bajo nivel\nemail.lower().strip()\nsum(prices)\n\n# Si mezclas en una funci√≥n ‚Üí problema\n```\n\n**Beneficios medibles**:\n- **Comprensi√≥n**: 5x m√°s r√°pido entender\n- **Mantenimiento**: Cambios localizados\n- **Testing**: Testea cada nivel independientemente\n- **Reutilizaci√≥n**: Funciones de bajo nivel reutilizables\n\n**Analog√≠a √∫til**:\nComo leer un libro:\n- Cap√≠tulos (alto nivel)\n- Secciones (medio nivel)\n- P√°rrafos (bajo nivel)\n- Oraciones (muy bajo nivel)\n\nNo mezclas oraciones con t√≠tulos de cap√≠tulos.\n\n**Referencia oficial:** [The Stepdown Rule - Clean Code](https://www.oreilly.com/library/view/clean-code-a/9780136083238/)

## Ejercicios Pr√°cticos\n\nAhora es tu turno de practicar escribiendo funciones limpias. Completa los ejercicios en el archivo `exercises/01_clean_functions.py` y verifica tus soluciones con `pytest tests/test_01_clean_functions.py`.

### Ejercicio 1: Refactorizar Funci√≥n con M√∫ltiples Responsabilidades\n\nRefactoriza la siguiente funci√≥n que hace demasiadas cosas en funciones m√°s peque√±as y enfocadas.

In [None]:
# Ver exercises/01_clean_functions.py para el ejercicio completo

### Ejercicio 2: Reducir Par√°metros\n\nRefactoriza una funci√≥n con muchos par√°metros usando dataclasses o diccionarios.

In [None]:
# Ver exercises/01_clean_functions.py para el ejercicio completo

### Ejercicio 3: Separar Niveles de Abstracci√≥n\n\nReorganiza una funci√≥n que mezcla diferentes niveles de abstracci√≥n.

In [None]:
# Ver exercises/01_clean_functions.py para el ejercicio completo

## Resumen\n\nEn este notebook has aprendido los principios fundamentales para escribir funciones limpias:\n\n1. **Responsabilidad √önica**: Cada funci√≥n debe hacer una cosa y hacerla bien\n2. **Funciones Peque√±as**: Mant√©n las funciones cortas (idealmente < 20 l√≠neas)\n3. **Pocos Par√°metros**: Limita a 3 par√°metros o menos, agrupa par√°metros relacionados\n4. **Niveles de Abstracci√≥n**: Mant√©n un nivel de abstracci√≥n consistente en cada funci√≥n\n5. **Nombres Descriptivos**: El nombre debe describir claramente lo que hace la funci√≥n\n\nEstos principios te ayudar√°n a escribir c√≥digo m√°s mantenible, testeable y f√°cil de entender.

## Preguntas de Autoevaluaci√≥n\n\n### 1. ¬øQu√© significa que una funci√≥n tenga una sola responsabilidad?\n\n**Respuesta:** Significa que la funci√≥n debe tener una sola raz√≥n para cambiar. Debe hacer una cosa espec√≠fica y hacerla bien, sin mezclar m√∫ltiples tareas o responsabilidades.\n\n### 2. ¬øCu√°l es el n√∫mero ideal de par√°metros para una funci√≥n?\n\n**Respuesta:** Idealmente 3 o menos. Si necesitas m√°s par√°metros, considera agrupar par√°metros relacionados en objetos (dataclasses, namedtuples) o usar **kwargs para opciones.\n\n### 3. ¬øC√≥mo identificas que una funci√≥n es demasiado larga?\n\n**Respuesta:** Si la funci√≥n tiene m√°s de 20 l√≠neas, si hace m√∫ltiples cosas que podr√≠as describir con \"y\" u \"o\", o si no puedes entender qu√© hace sin leer todo el c√≥digo, probablemente es demasiado larga.\n\n### 4. ¬øQu√© problema resuelve mantener niveles de abstracci√≥n consistentes?\n\n**Respuesta:** Evita que el lector tenga que saltar entre detalles de bajo nivel y conceptos de alto nivel, haciendo el c√≥digo m√°s f√°cil de leer y entender como una narrativa coherente.\n\n### 5. ¬øCu√°ndo deber√≠as dividir una funci√≥n en funciones m√°s peque√±as?\n\n**Respuesta:** Cuando la funci√≥n hace m√∫ltiples cosas, cuando es dif√≠cil de testear, cuando tiene m√∫ltiples niveles de indentaci√≥n, o cuando no puedes darle un nombre descriptivo sin usar \"y\" u \"o\".\n\n### 6. ¬øQu√© ventajas tiene escribir funciones peque√±as y enfocadas?\n\n**Respuesta:** Son m√°s f√°ciles de entender, testear, reutilizar y mantener. Tambi√©n facilitan la identificaci√≥n de bugs y la refactorizaci√≥n del c√≥digo.

## Recursos y Referencias Oficiales\n\n### Documentaci√≥n Oficial\n- **[PEP 8 - Style Guide for Python Code](https://peps.python.org/pep-0008/)**: Gu√≠a oficial de estilo para Python\n  - Convenciones de nomenclatura y estructura de c√≥digo\n\n- **[Python dataclasses](https://docs.python.org/3/library/dataclasses.html)**: Documentaci√≥n oficial de dataclasses\n  - √ötil para agrupar par√°metros relacionados\n\n### Libros y Recursos\n- **[Clean Code by Robert C. Martin](https://www.oreilly.com/library/view/clean-code-a/9780136083238/)**: Referencia fundamental sobre c√≥digo limpio\n  - Cap√≠tulo 3: Functions\n\n- **[Refactoring by Martin Fowler](https://refactoring.com/)**: T√©cnicas de refactorizaci√≥n\n  - Extract Function, Introduce Parameter Object\n\n- **[Python Clean Code](https://testdriven.io/blog/clean-code-python/)**: Gu√≠a de c√≥digo limpio espec√≠fica para Python\n  - Ejemplos pr√°cticos en Python\n\n### Herramientas\n- **[Ruff](https://docs.astral.sh/ruff/)**: Linter y formateador r√°pido para Python\n  - Detecta funciones complejas y problemas de estilo\n\n- **[pylint](https://pylint.pycqa.org/)**: Analizador de c√≥digo Python\n  - Detecta funciones con demasiados par√°metros o l√≠neas\n\n### Notas Importantes\n- Todos los enlaces est√°n actualizados a partir de 2025\n- Se recomienda revisar la documentaci√≥n oficial regularmente\n- Practica estos principios en tu c√≥digo diario para internalizarlos