# HOW TO: Creando nuestro primer set de refactoriaciones.

Para refactorizar código, es necesario tener un conjunto de técnicas a nuestra disposición. En la mayoria de los casos, las refactorizaciones más comunes será extraer funcionalidades o variables a métodos o clases, renombrar variables o métodos para mejorar su legibilidad, o eliminar código duplicado. También es posible aplicar la técnica inversa, crear funciones y variables inline, para simplificar el código.

Para un mayor detalle de las técnicas de refactorización, Fowler (2019) menciona que:

> Extraction is all about giving names, and I often need to change the names as I learn.
> Change Function Declaration (124) changes names of functions; I also use that
> refactoring to add or remove a function’s arguments. For variables, I use Rename
> Variable (137), which relies on Encapsulate Variable (132). When changing function
> arguments, I often find it useful to combine a common clump of arguments into a
> single object with Introduce Parameter Object (140). (p. 121)



## Extract Function.

<small> _Inversion: Inline Function._ </small>

Consiste en extraer un fragmento de código a una función separada. Esto es útil para mejorar la legibilidad del código y para reutilizar el código en diferentes partes del programa. En software existen muchas maneras de definir exactamente en qué punto una función es demasiado larga. Algunos dirán que es por cantidad de líneas, otros por cantidad de responsabilidades. En cualquier caso es importante tener en cuenta que una función debe ser lo suficientemente pequeña como para ser fácilmente entendida y mantenida.

> If you have to spend effort looking at a fragment of code and figuring
> out hat its doing, then you should extract it into a function and name the function
> afterthe “wht.” Then, when you read it again, the purpose of the function leaps right
> out atyou, andmost of the time you won’t need to care about how the function fulfills
> its purose. (Fower, 2019, p. 122)

Para ejemplificar esta técnica usaremos un ejemplo.

La función `procesar_datos` actualmente realiza múltiples tareas sobre una lista de datos: limpia los valores de entrada, valida y transforma los datos numéricos, calcula métricas estadísticas, genera e imprime un reporte, guarda el resultado en un archivo bajo ciertas condiciones, muestra información de cada etapa y maneja posibles errores durante el procesamiento. Por ahora, se requiere analizar y refactorizar esta función, identificando y separando sus distintas responsabilidades para mejorar la claridad, mantenibilidad y reutilización del código, siguiendo las recomendaciones del capítulo 6 de Fowler sobre “Extract Function”.

```python
def procesar_datos(datos):
    # Limpiar datos
    datos_limpios = []
    for d in datos:
        if isinstance(d, str):
            d = d.strip()
        if d:
            datos_limpios.append(d)
    # Validar datos
    datos_validos = []
    for d in datos_limpios:
        if isinstance(d, int) and d > 0:
            datos_validos.append(d)
        elif isinstance(d, str) and d.isdigit():
            datos_validos.append(int(d))
    # Transformar datos (duplicar los valores pares)
    datos_transformados = []
    for d in datos_validos:
        if d % 2 == 0:
            datos_transformados.append(d * 2)
        else:
            datos_transformados.append(d)
    # Calcular métricas
    suma = 0
    maximo = None
    minimo = None
    for d in datos_transformados:
        suma += d
        if maximo is None or d > maximo:
            maximo = d
        if minimo is None or d < minimo:
            minimo = d
    promedio = suma / len(datos_transformados) if datos_transformados else 0
    # Generar reporte
    reporte = f"Total: {suma}, Máximo: {maximo}, Mínimo: {minimo}, Promedio: {promedio:.2f}, Elementos: {len(datos_transformados)}"
    print("==== REPORTE ====")
    print(reporte)
    # Guardar reporte en archivo si la suma es mayor a 100
    if suma > 100:
        with open("reporte.txt", "w") as f:
            f.write(reporte)
    # Logging adicional
    print("Datos originales:", datos)
    print("Datos limpios:", datos_limpios)
    print("Datos válidos:", datos_validos)
    print("Datos transformados:", datos_transformados)
    # Manejo de errores
    try:
        division = suma / (maximo - minimo)
        print("Suma dividida por rango:", division)
    except Exception as e:
        print("Error al calcular suma/rango:", e)
    # Mensaje final
    print("Procesamiento finalizado.")
```

Si el objetivo es mejorar la legibilidad de la función, lo primero que se podría hacer es identificar las distintas responsabilidades que tiene la función y extraerlas a funciones separadas. Por ejemplo, se podría extraer la limpieza de los valores de entrada a una función llamada `limpiar_datos` y la validación y transformación de los datos numéricos a una función llamada `validar_transformar_datos`. 

In [None]:
def limpiar_datos(datos):
    # Elimina espacios en strings y filtra valores vacíos o None
    datos_limpios = []
    for d in datos:
        if isinstance(d, str):
            d = d.strip()
        if d is None or d == "":
            continue
        datos_limpios.append(d)
    return datos_limpios

def validar_transformar_datos(datos_limpios):
    # Valida: solo enteros positivos (convierte strings numéricos)
    datos_validos = []
    for d in datos_limpios:
        if isinstance(d, int):
            if d > 0:
                datos_validos.append(d)
        elif isinstance(d, str):
            if d.isdigit():
                val = int(d)
                if val > 0:
                    datos_validos.append(val)
        # Si no entra a ninguna condición, se ignora el valor
    # Transformación: duplicar valores pares
    datos_transformados = []
    for d in datos_validos:
        if d % 2 == 0:
            datos_transformados.append(d * 2)
        else:
            datos_transformados.append(d)
    return datos_transformados

def procesar_datos(datos):
    # 1) Limpieza
    datos_limpios = limpiar_datos(datos)
    # 2) Validación y transformación
    datos_transformados = validar_transformar_datos(datos_limpios)
    # 3) Calcular métricas
    suma = sum(datos_transformados)
    maximo = max(datos_transformados) if datos_transformados else None
    minimo = min(datos_transformados) if datos_transformados else None
    promedio = suma / len(datos_transformados) if datos_transformados else 0
    # 4) Generar reporte
    reporte = f"Total: {suma}, Máximo: {maximo}, Mínimo: {minimo}, Promedio: {promedio:.2f}, Elementos: {len(datos_transformados)}"
    print("==== REPORTE ====")
    print(reporte)
    # 5) Guardar si procede
    if suma > 100:
        try:
            with open("reporte.txt", "w", encoding="utf-8") as f:
                f.write(reporte)
        except Exception as e:
            print("Error al guardar reporte:", e)
    # 6) Logging de estados intermedios
    print("Datos originales:", datos)
    print("Datos limpios:", datos_limpios)
    print("Datos transformados:", datos_transformados)
    # 7) Manejo de posible error en cálculo adicional
    try:
        if maximo is None or minimo is None or maximo == minimo:
            raise ValueError("Rango inválido para división")
        division = suma / (maximo - minimo)
        print("Suma dividida por rango:", division)
    except Exception as e:
        print("Error al calcular suma/rango:", e)
    print("Procesamiento finalizado.")

# Ejemplo de uso
datos = [" 10 ", "20", 30, "", -5, "abc", 50, 3, "7", "  8", 0, None, "100"]
procesar_datos(datos)

En este sentido no importa que tan simple es la función, si el nombre de la nueva función reflejará claramente lo que hace entonces vale la pena extraerla. Sin embargo si la función ya tiene un nombre lo suficientemente claro entonces es una señal de que no es necesario extraerla. Algunas veces es dificil determinar si una función ya tiene un nombre lo suficientemente claro. Fowler (2019) explica que no es necesario que pienses en el mejor nombre posible para la nueva función en ese momento, a veces es válido extraer la función con un nombre provisional, trabajar con ella, darse cuenta que extraerla no mejora la legibilidad y devolverla a su estado original. Mientras se haya aprendido una lección jamás se está perdiendo el tiempo.

## Inline Function.
<small> _Inversión: Extract Function._ </small>

Abusar de la extracción de funciones puede llevar a un código donde el nombre de la función si es descriptivo pero el código por sí mismo ya refleja claramente lo que hace. En estos casos, es posible que la función extraída no aporte valor y que el código sea más difícil de seguir debido a la necesidad de saltar entre funciones para entender el flujo del programa. En estos casos, se podría considerar la técnica inversa, que es la función inline, para simplificar el código y mejorar su legibilidad.

Tomando el ejemplo anterior pero reconstruido con funciones extraídas.

```python
# Ejemplo de función “demasiado refactorizada”

def strip_valor(valor):
    return valor.strip() if isinstance(valor, str) else valor

def es_vacio_o_none(valor):
    return valor is None or valor == ""

def limpiar_datos(datos):
    return [strip_valor(d) for d in datos if not es_vacio_o_none(strip_valor(d))]

def es_entero_positivo(valor):
    return isinstance(valor, int) and valor > 0

def es_str_entero_positivo(valor):
    return isinstance(valor, str) and valor.isdigit() and int(valor) > 0

def convertir_a_entero(valor):
    return int(valor) if isinstance(valor, str) else valor

def validar_dato(valor):
    if es_entero_positivo(valor):
        return valor
    elif es_str_entero_positivo(valor):
        return convertir_a_entero(valor)
    return None

def validar_datos(datos):
    return [v for v in (validar_dato(d) for d in datos) if v is not None]

def es_par(valor):
    return valor % 2 == 0

def duplicar_si_par(valor):
    return valor * 2 if es_par(valor) else valor

def transformar_datos(datos):
    return [duplicar_si_par(d) for d in datos]

def calcular_suma(datos):
    return sum(datos)

def calcular_maximo(datos):
    return max(datos) if datos else None

def calcular_minimo(datos):
    return min(datos) if datos else None

def calcular_promedio(datos):
    return sum(datos) / len(datos) if datos else 0

def generar_reporte(suma, maximo, minimo, promedio, cantidad):
    return f"Total: {suma}, Máximo: {maximo}, Mínimo: {minimo}, Promedio: {promedio:.2f}, Elementos: {cantidad}"

def guardar_reporte_si_corresponde(reporte, suma):
    if suma > 100:
        try:
            with open("reporte.txt", "w", encoding="utf-8") as f:
                f.write(reporte)
        except Exception as e:
            print("Error al guardar reporte:", e)

def mostrar_logging(etapa, datos):
    print(f"{etapa}:", datos)

def calcular_division_segura(suma, maximo, minimo):
    try:
        if maximo is None or minimo is None or maximo == minimo:
            raise ValueError("Rango inválido para división")
        division = suma / (maximo - minimo)
        print("Suma dividida por rango:", division)
    except Exception as e:
        print("Error al calcular suma/rango:", e)

def mostrar_mensaje_final():
    print("Procesamiento finalizado.")

def procesar_datos(datos):
    mostrar_logging("Datos originales", datos)
    datos_limpios = limpiar_datos(datos)
    mostrar_logging("Datos limpios", datos_limpios)
    datos_validos = validar_datos(datos_limpios)
    mostrar_logging("Datos válidos", datos_validos)
    datos_transformados = transformar_datos(datos_validos)
    mostrar_logging("Datos transformados", datos_transformados)
    suma = calcular_suma(datos_transformados)
    maximo = calcular_maximo(datos_transformados)
    minimo = calcular_minimo(datos_transformados)
    promedio = calcular_promedio(datos_transformados)
    reporte = generar_reporte(suma, maximo, minimo, promedio, len(datos_transformados))
    print("==== REPORTE ====")
    print(reporte)
    guardar_reporte_si_corresponde(reporte, suma)
    calcular_division_segura(suma, maximo, minimo)
    mostrar_mensaje_final()
```

El problema radica en que la función `procesar_datos` ahora es más difícil de seguir debido a la cantidad de funciones auxiliares que se han creado. Aunque cada función tiene un nombre descriptivo, el código se vuelve más fragmentado y requiere saltar entre funciones para entender el flujo del programa. En este caso, podría ser más beneficioso simplificar el código y eliminar algunas de las funciones auxiliares para mejorar la legibilidad y facilitar la comprensión del proceso completo.

Veamos cómo se vería el código si aplicamos la técnica inversa, eliminando algunas de las funciones auxiliares para simplificar el código.

In [None]:
# Ejemplo con los cálculos de métricas “devueltos a su estado salvaje”
def strip_valor(valor):
    return valor.strip() if isinstance(valor, str) else valor

def es_vacio_o_none(valor):
    return valor is None or valor == ""

def limpiar_datos(datos):
    return [strip_valor(d) for d in datos if not es_vacio_o_none(strip_valor(d))]

def es_entero_positivo(valor):
    return isinstance(valor, int) and valor > 0

def es_str_entero_positivo(valor):
    return isinstance(valor, str) and valor.isdigit() and int(valor) > 0

def convertir_a_entero(valor):
    return int(valor) if isinstance(valor, str) else valor

def validar_dato(valor):
    if es_entero_positivo(valor):
        return valor
    elif es_str_entero_positivo(valor):
        return convertir_a_entero(valor)
    return None

def validar_datos(datos):
    return [v for v in (validar_dato(d) for d in datos) if v is not None]

def es_par(valor):
    return valor % 2 == 0

def duplicar_si_par(valor):
    return valor * 2 if es_par(valor) else valor

def transformar_datos(datos):
    return [duplicar_si_par(d) for d in datos]

def generar_reporte(suma, maximo, minimo, promedio, cantidad):
    return f"Total: {suma}, Máximo: {maximo}, Mínimo: {minimo}, Promedio: {promedio:.2f}, Elementos: {cantidad}"

def guardar_reporte_si_corresponde(reporte, suma):
    if suma > 100:
        try:
            with open("reporte.txt", "w", encoding="utf-8") as f:
                f.write(reporte)
        except Exception as e:
            print("Error al guardar reporte:", e)

def mostrar_logging(etapa, datos):
    print(f"{etapa}:", datos)

def calcular_division_segura(suma, maximo, minimo):
    try:
        if maximo is None or minimo is None or maximo == minimo:
            raise ValueError("Rango inválido para división")
        division = suma / (maximo - minimo)
        print("Suma dividida por rango:", division)
    except Exception as e:
        print("Error al calcular suma/rango:", e)

def mostrar_mensaje_final():
    print("Procesamiento finalizado.")

def procesar_datos(datos):
    datos_limpios = limpiar_datos(datos)
    datos_validos = validar_datos(datos_limpios)
    datos_transformados = transformar_datos(datos_validos)
    # Cálculo de métricas todo junto
    suma = 0
    maximo = None
    minimo = None
    for d in datos_transformados:
        suma += d
        if maximo is None or d > maximo:
            maximo = d
        if minimo is None or d < minimo:
            minimo = d
    promedio = suma / len(datos_transformados) if datos_transformados else 0
    reporte = generar_reporte(suma, maximo, minimo, promedio, len(datos_transformados))
    print("==== REPORTE ====")
    print(reporte)
    guardar_reporte_si_corresponde(reporte, suma)
    calcular_division_segura(suma, maximo, minimo)
    mostrar_mensaje_final()

# El resto de funciones auxiliares permanece igual (limpiar_datos, validar_datos, transformar_datos, etc.)

# Ejemplo de uso
datos = [" 10 ", "20", 30, "", -5, "abc", 50, 3, "7", "  8", 0, None, "100"]
procesar_datos(datos)

## Extract Variable.
<small> _Inversión: Inline Variable._ </small>

