# Clean code

## Styiling
La guía completa de styling se puede encontrar en [PEP 8](https://peps.python.org/pep-0008/)
- _**snake_case**_: variables, funciones, parámetros y atributos. También nombres de librerías y módulos.
- _**PascalCase**_: clases y tipos, aunque algunos tipos los verán en snake_case (`int`, `str`, `datetime`, `np.ndarray`)
- _**UPPERCASE**_: constantes
- _**camelCase**_: no se utiliza, pero hay excepciones

In [None]:
PI = 3.14

class Circulo:

    def __init__(self, radio):
        self.radio = radio

    def calcular_perimetro(self):
        return 2*self.radio*PI

    def calcular_area(self):
        return self.radio*(PI**2)

circulo = Circulo(3)
print(circulo.calcular_perimetro(), circulo.calcular_area())

## Naming
Debemos procurar nombrar nuestras variables, funciones y clases de una manera que sea conciso y se nos haga lo más intuitivo posible su uso y lectura.

In [None]:
# Evitar nomenclatura genérica como en este ejemplo

lista = ["1984", "La metamorfosis", "Crimen y castigo", "Ilíada", "El señor de las moscas"]

for i in lista:
    print(i)

In [None]:
# Mejor

libros = ["1984", "La metamorfosis", "Crimen y castigo", "Ilíada", "El señor de las moscas"]

for titulo in libros:
    print(titulo)

In [None]:
# Evitar abreviaturas innecesarias o muy agresivas

yr = 2024
v = [1.5, -2.15, 0.06] # velocidad, valores
w = 800
h = 600

In [None]:
# Mejor

year = 2024
vec = [1.5, -2.15, 0.06]
width = 800
height = 600

In [None]:
# Evitar nomenclatura excesivamente larga

def funcion_lineal_con_un_parametro_de_entrada_y_un_coeficiente(x, m, n):
    return m*x+n

In [None]:
# Mejor

def funcion_lineal_simple(x, m, n):
    return m*x+n

### Underscore "**_**"

Podemos usar underscore "**\_**" para variables temporales que no se utilizarán en otra parte del código.

In [None]:
import random

# Sin usar _

random_nums = []
for i in range(10):
    random_nums.append(random.random())

# Usando _

random_nums = [random.random() for _ in range(10)]
random_nums

### Imports

Debemos evitar sobreescribir las funciones/librerías cuando hacemos **import**.

In [None]:
# Hacer buen uso de los namespaces y evitar los wildcard imports

def choices():
    pass

from random import * # Mal
import random # Bien
import random as r # Bien
from random import random, randint # Bien, aunque la función random se puede confundir con el módulo random

# Es preferible importar random de manera consistente y acceder a las funciones con random.func()

In [None]:
# Evitar sobrescribir funciones nativas de Python

max_ = 1000 # Si escribimos max = 1000, no podremos utilizar la función max()

### Métodos y Atributos Privados

Podemos indicar que ciertos métodos y atributos son "privados" usando underscore al principio del nombre.

Los métodos y atributos privados son funciones/variables dentro de una clase diseñadas solo para uso interno.

In [None]:
# Utilizar el underscore al comienzo de métodos y atributos que consideramos privados

class Circulo:

    def __init__(self, radio):
        self.radio = radio

    def _calcular_perimetro(self):
        return 2*self.radio*PI

    def _calcular_area(self):
        return PI*self.radio**2

    def info(self):
        return {
            "perimetro" : self._calcular_perimetro(),
            "area" : self._calcular_area()
        }

circulo = Circulo(3)
circulo.info()

### Comentarios y Docstrings

- **Comentarios**: Utilizar comentarios para explicar el porqué, antes que el qué o el cómo.
- **Docstrings**:
    - El docstring debe empezar con una oración breve que describa el propósito general de la función o clase.
    - Después de la descripción breve, incluye detalles sobre parámetros, retornos y excepciones si es necesario.

In [None]:
# Evitar comentarios redundantes, como este ejemplo

TOKEN = "abcde1234"

# headers
headers = {
    "Authorization" : f"Bearer {TOKEN}"
}

In [None]:
# Utilizar comentarios para explicar el porqué, antes que el qué o el cómo

######## Mal ejemplo
# Función para calcular el factorial de un número
def factorial_mal(num):
    
    # Si es 0 o 1, retornamos 1
    if num == 0 or num == 1:
        return 1

    # Si no, calculamos el factorial del número anterior y lo multiplicamos por el número actual
    return num * factorial_mal(num-1)

######## Buen ejemplo
# La necesitamos para el cálculo de combinatorias
def factorial_bien(num):
    if num == 0 or num == 1:
        return 1

    # Lógica: 5! == 5*4*3*2*1 == 5*4!
    return num * factorial_bien(num-1)

### Calcula el factorial de un número.
#### Parámetros:
- num: un número entero para el calculo del factorial
#### Retorno:
- int: el resultado del cálculo de factorial

In [None]:
# Utilizar docstrings para documentar funciones y clases es una buena manera de mejorar la inteligibilidad de nuestro código

# La necesitamos para el cálculo de combinatorias
def factorial(num): # ''' texto '''
    """
    # Calcula el factorial de un número.
    ### Parámetros:
    - num: un número entero para el calculo del factorial
    ### Retorno:
    - int: el resultado del cálculo de factorial
    """
    if num == 0 or num == 1:
        return 1

    # Lógica: 5! == 5*4*3*2*1 == 5*4!
    return num * factorial(num-1)

In [None]:
class Animal:
    """
    Esta clase representa un animal. Está pensada para crear subclases de animales concretos, no para instanciarla directametne.
    """

    def __init__(self, nombre):
        """
        El constructor de todos los animales recibe una string por el parámetro nombre, que tiene que ser el nombre del animal.
        """
        self.nombre = nombre

### Positional vs keywords arguements

In [None]:
# Función normal

def suma(a, b):
    return a+b

print(suma(2,3))
print(suma(2, b=3))
print(suma(a=2, b=3))
print(suma(b=2, a=3))

In [None]:
# Todos los parámetros deben ser keyword arguments
def suma(*,a, b):
    return a+b

print(suma(2,3))

In [None]:
print(suma(2, b=3))

In [None]:
print(suma(a=2, b=3))
print(suma(a=3, b=2))

In [None]:
# Solo b debe ser keyword arguement
def suma(a, *, b):
    return a+b

print(suma(2,3))

In [None]:
print(suma(2, b=3))

In [None]:
print(suma(a=2, b=3))

In [None]:
# Todos los parámetros deben ser positional arguements
def suma(a, b, /):
    return a+b

print(suma(2,3))

In [None]:
print(suma(2, b=3))

In [None]:
print(suma(a=2, b=3))

In [None]:
# Solo a debe ser positional arguement
def suma(a, /, b):
    return a+b

print(suma(2,3))

In [None]:
print(suma(2, b=3))

In [None]:
print(suma(a=2, b=3))

In [None]:
# Podemos desempaquetar un iterable para utilizarlo en una función con positional arguements

def suma(a, b):
    return a+b


print(suma(2,3))

In [None]:
valores = [2,3]
print(suma(*valores))

In [None]:
# También podemos desempaquetar fuera de funciones
valores = [2,3]
val1, val2 = valores
print(val1, val2)

valores = [2,3,4,5,6]
first_val, *other_vals, last_val = valores
print(first_val, other_vals, last_val)

In [None]:
# Podemos desempaquetar un diccionario para utilizarlo en una función con keyword arguements
def suma(a, b):
    return a+b


print(suma(2,3))

valores = {
    "a" : 2,
    "b" : 3
}

print(suma(**valores))

In [None]:
# Podemos utilizar *args para recibir una cantidad indefinida de argumentos posicionales

def suma(*args):
    val = 0
    for num in args:
        val += num
    return val


print(suma(2,3))
print(suma(2,3,4,5))
print(suma(2,3,4,5,6,7,8,9,10))

In [None]:
# Podemos utilizar **kwargs para recibir una cantidad indefinida de argumentos posicionales

def suma(**kwargs):
    val = 0
    keys = []
    for k, v in kwargs.items():
        val += v
        keys.append(k)
    return f"{' + '.join(keys)} = {val}"


print(suma(a=2,b=3))
print(suma(a=2,b=3,c=4,d=5))
print(suma(a=2,b=3,c=4,d=5,e=6,f=7,g=8,h=9,i=10))

In [None]:
# Podemos utilizar tanto *args como **kwargs para recibir cualquier tipo de argumentos

def suma(*args, **kwargs):
    val = 0
    keys = []
    for num in args:
        val += num
        keys.append(str(val))
    for k, v in kwargs.items():
        val += v
        keys.append(k)
    return f"{' + '.join(keys)} = {val}"


print(suma(2,a=3))
print(suma(2,3,a=4,b=5))
print(suma(2,3,4,a=5,b=6,c=7,d=8,e=9,f=10))

In [None]:
valores_args = [1,2,3]
valores_kwargs = {
    "a" : 4,
    "b" : 5
}

print(suma(*valores_args, **valores_kwargs))

## Estructura y organización
En proyectos grandes es buena práctica estructurar los módulos por carpetas. En lugar de tener la siguiente estructura:

```
 |- app.py
 |- intro.py
 |- eda.py
 |- ml.py
 |- about.py
 |- data.csv
 |- .gitignore
 |- model.pkl
 |- .env
 |- eda.ipynb
 |- extraction.ipynb
 |- training.ipynb
```

Podemos tener la siguiente:

```
 |- lib
   |- __init__.py
   |- pages
     |- __init__.py
     |- intro.py
     |- eda.py
     |- ml.py
     |- about.py
 |- bin
   |- data.csv
   |- model.pkl
 |- notebooks
   |- eda.ipynb
   |- extraction.ipynb
   |- training.ipynb
 |- app.py
 |- .gitignore
 |- .env
```

- En `lib` suele ir prácticamente todo el código, idealmente organizado por módulos. En este caso solo está el módulo pages.
- En `bin` suelen ir los binarios necesarios para el proyecto. Aquí también pueden ir los csv, aunque también está la opción de crear otra carpeta aparte que se llame `data`.
- Los ficheros de configuración y el entrypoint (`app.py` en este caso) normalmente van a nivel raiz de la estructura de un proyecto.
- Los notebooks es buena idea tenerlos también en una carpeta aparte.

El `__init__.py` se ejecuta cuando importamos el módulo (carpeta) en el que se encuentra:

- **`lib/pages/__init__.py`**

```python
from . import intro, eda, ml, about

print("Importes de pages correctos!")
```

- **`lib/__init__.py`**

```python
from . import pages # Cuando hacemos este import, obtenemos "Importes de pages correctos!" en la consola

print("Importes de lib correctos!")
```

- **`app.py`**

```python
from lib.pages import intro, eda, ml, about # Cuando hacemos este import, obtenemos "Importes de lib correctos!" en la consola
```

## OOP
### Dunder methods
- Cuando trabajamos con objetos, es muy buena práctica incorporar algunos de los métodos dunder que ofrece Python. Los métodos dunder son todos aquellos métodos que empiezan y terminan por doble underscore.
- Estos métodos nos ayudan a integrar nuestras clases en el ecosistema de Python, permitiendo que se utilicen funciones y sintaxis nativa sobre éstas.
- Cada método dunder tiene un rol muy específico y debemos seguir la implementación de manera correcta.
- Es muy importante entender los métodos dunder, más allá de si los terminamos usando o no, ya que nos ofrecen una perspectiva de más bajo nivel sobre el funcionamiento de Python, donde absolutamente todo son objetos (incluso las funciones).

**A continuación algunos de los métodos dunder más importantes.**

|Método|Descripción|
|-|-|
|`__new__()`| Se ejecuta a la hora de instanciar el objeto, antes de `__init__()`, y retorna la instancia en sí. Se utiliza para modificar la lógica de instanciación. |
|`__init__()`| Se ejecuta justo después de crear la instancia con `__new__()`. Aquí va nuestra lógica de inicialización de los atributos del objeto. |
|`__repr__()`| Permite definir un formato en forma de str personalizado que aparezca en pantalla cuando, por ejemplo, hacemos un print del objeto.|
|`__str__()`| Especifica la lógica que se debe ejecutar al castear el objeto a str usando `str()`. |
|`__len__()`| Especifica la lógica al utilizar la función `len()` sobre el objeto. |
|`__iter__()`| Define la lógica que se ejecuta al iterar sobre el objeto. Debe retornar un iterador o utilizar `yield`. |
|`__next__()`| Define la lógica que se ejecuta al utilizar la función `next()` sobre el objeto, convirtiéndolo así en un iterador. |
|`__getitem__()`| Permite consultar el objeto como si fuera un diccionario. |
|`__setitem__()`| Permite asignar valores al objeto como si fuera un diccionario. |
|`__delitem__()`| Permite utilizar `del` con la sintaxis de indexado de diccionario. |
|`__index__()`| Define la lógica de indexing, slicing y stride. |
|`__add__()`| Especifica la lógica al utilizar el operador `+`. Véase también `__sub__()`, `__mul__()`, `__truediv__()`, `__floordiv__()`, `__mod__()`, `__pow__()` y `__matmul__()`.|
|`__iadd__()`| Especifica la lógica al utilizar el operador `+=`. Véase también `__isub__()`, `__imul__()`, `__itruediv__()`, `__ifloordiv__()`, `__imod__()` y `__ipow__()`.|
|`__eq__()`| Especifica la lógica al utilizar el operador `==`. Véase también `__ne__()`, `__gt__()`, `__ge__()`, `__lt__()` y `__le__()`.|
|`__and__()`| Especifica la lógica al utilizar el operador `&`. Véase también `__or__()`, `__xor__()`, `__lshift__()`, `__rshift__()` e `__invert__()`.|
|`__call__()`| Permite llamar una instancia del objeto como si fuera una función. |
|`__contains__()`| Permite utilizar la keyword `in` para consultar la presencia de un elemento. |
|`__enter__()`| Permite utilizar la instancia como context manager. Se ejecuta al entrar en el contexto y `__exit__()` debe estar implementado. |
|`__exit__()`| Permite utilizar la instancia como context manager. Se ejecuta al salir del contexto y `__enter__()` debe estar implementado.|
|`__bool__()`| Define el comportamiento al castear el objeto a booleano con `bool()`. |

## Tipado de datos
### Tipado de primitivos

In [None]:
# Sin tipado de datos

nombre = "José"
edad = 28
balance = 3293.23

print(type(nombre), type(edad), type(balance))

In [None]:
# Con tipado de datos

nombre: str = "José"
edad: int = 28
balance: float = 3293.23

print(type(nombre), type(edad), type(balance))

In [None]:
# El tipado no se impone

nombre: float = "José"
edad: float = 28
balance: float = 3293.23

print(type(nombre), type(edad), type(balance))

### Tipado de estructuras complejas

In [None]:
vector: list[float] = [1.5, 1.77, -0.13]

In [None]:
persona: dict[str, str | float | int] = {
    "nombre" : "José",
    "edad" : 28,
    "balance" : 3293.23
}

In [None]:
# Tupla de integers de longitud desconocida

tupla: tuple[int, ...] = 1, 2, 3, 4


# Tupla de tres integers

tupla_tres_elementos: tuple[int, int, int] = 2, 3, 9


# Tupla de cuatro elementos diferentes

tupla_cuatro_elementos_diferentes: tuple[str, int, float, list[str]] = "José", 28, 3293.23, ["hola", "mundo"]

In [None]:
print(tupla_cuatro_elementos_diferentes)

### Aliases

In [None]:
# Útil para especificar unidades de medida...

Year = int
Euro = float

nombre: str = "José"
edad: Year = 28
balance: Euro = 3293.23

print(type(nombre), type(edad), type(balance))

In [None]:
# ...contextualizar las variables...

Vector = list[float]

vec: Vector = [1.5, 1.77, -0.13]

print(type(vec))

In [None]:
# ...o simplificar estructuras complejas

Vector = list[float]
Token = str
Embedding = tuple[Token, Vector]
Language = list[Embedding]

### Funciones

In [None]:
# Sin tipado de datos

def suma(a, b):
    return a+b

In [None]:
# Con tipado de datos

def suma(a: int | float, b: int | float) -> int | float:
    return a+b

### Módulo `typing`

In [None]:
from typing import Optional

# El parámetro c es opcional (None por defecto)

def suma(a: int | float, b: int | float, c: Optional[int | float] = None) -> int | float:
    return a+b if c is None else a+b+c

In [None]:
# Podemos utilizar docstrings en nuestras funciones...

def suma(a: int | float, b: int | float) -> int | float:
    """
    ## Parámetros:
    - a: primer número de la suma.
    - b: segundo número de la suma.
    ## Retorno:
    - La suma de a y b
    """
    return a+b

In [None]:
from typing import Annotated

# ...o podemos documentar nuestros parámetros y retornos utilizando Annotated type

def suma(
    a: Annotated[int | float, "Primer número de la suma"],
    b: Annotated[int | float, "Segundo número de la suma"]
) -> Annotated[int | float, "La suma de a y b"]:
    
    return a+b

In [None]:
from typing import Union

# Podemos utilizar Union type para agrupar varios tipos en uno

Number = Union[int, float] # Optional = Union[type | None]

def suma(a: Number, b: Number) -> Number:
    return a+b

In [None]:
from typing import Iterable, Collection

# Podemos declarar variables como Iterable type cuando nos da igual el tipo de dato, solo nos importa que podamos iterar sobre él

def suma(nums: Iterable[Number]) -> Number:
    sum_ = 0
    for num in nums:
        sum_ += num
    return sum_


# También podemos usar Collection type cuando necesitamos colecciones. Un dato se considera colección cuando podemos utilizar la keyword `in`

def suma(nums: Collection[Number]) -> Number:
    sum_ = 0
    for num in nums:
        sum_ += num
    return sum_

In [None]:
from typing import Iterator

# En Python existen objetos iteradores como range(), enumerate() o zip()
# Hay que especificar el tipo de valores que arrojan al iterar sobre ellos

def get_range() -> Iterator[int]:
    return range(10)

In [None]:
from typing import Any

# Cuando no sabemos qué tipo de datos vamos a recibir, y además nos da igual, podemos usar Any type

def parse_request(response: dict[str, Any]) -> list[tuple[str, Any]]:
    ...

In [None]:
from typing import Callable

# Cuando recibimos funciones (o un objeto que se pueda llamar) como parámetros, o los retornamos, podemos marcarlos como Callable type
# Se especifica con una lista los tipos de los parámetros en orden, y con un tipo el retorno: Callable[[arg1, arg2, ...], return]

def generador_lineas(m: Number, n: Number) -> Callable[[Number], Number]:
    # Sí, podemos definir funciones dentro de funciones
    def func(x: Number) -> Number:
        return m*x + n

    return func

In [None]:
generador_lineas(3,4)(5)

In [None]:
from typing import TypeVar

# Podemos especificar generics, es decir, tipos de datos que pueden ser cualquier cosa. Un aspecto clave que diferencia los generics de algo
# como Any, es que existe una coherencia entre como se manejan las variables


# Usando generics sabemos que si pasamos como argumento [1,2,3], obtendremos o un int o un None
# Si pasamos como argumento ["hola", "mundo"], obtendremos un str o un None

T = TypeVar("T")

def primer_elemento(lst: list[T]) -> Optional[T]:
    return lst[0] if len(lst) > 0 else None


# Usando Any si pasamos como argumento [1,2,3] O [1, "hola", 1.6], no sabemos el tipo de dato que obtendremos, ya que es Any y no guarda relación con los params

def primer_elemento(lst: list[Any]) -> Any:
    return lst[0] if len(lst) > 0 else None

In [None]:
from typing import Literal

# Podemos utilizar Literal para especificar que el valor del parámetro debe ser exactamente alguno de los que aparecen

def closest_vectors(distance: Literal['euclidean', 'manhattan', 'cosine']) -> tuple[Vector, Vector]:
    ...

In [None]:
from typing import NoReturn

# Podemos utilizar NoReturn cuando una función no retorna nada. Es diferente a None, pues esperamos que la función siempre arroje algún error
# que pare la ejecución

def stop_execution() -> NoReturn:
    raise Exception("This function never returns")

In [None]:
from typing import NewType

# Similar al aliasing, solo que los static type checkers entienden estos nuevos tipos como diferentes de los originales, por lo que te avisan

Vector = NewType("Vector", list[float])
vec: Vector = Vector([.1,.2,.3])

print(type(vec))

### Tipado en clases

In [None]:
# Las clases pueden ser utilizados como tipos

class Animal:
    def __init__(self, nombre: str) -> None:
        self.nombre = nombre

class Persona:
    def __init__(self, nombre: str, edad: int, mascotas: list[Animal]) -> None:
        self.nombre = nombre
        self.edad = edad
        self.mascotas = mascotas

In [None]:
from typing import Self

# Podemos también tipar el parámetro self con el Self type

class Animal:
    def __init__(self: Self, nombre: str) -> None:
        self.nombre = nombre

class Persona:
    def __init__(self: Self, nombre: str, edad: int, mascotas: list[Animal]) -> None:
        self.nombre = nombre
        self.edad = edad
        self.mascotas = mascotas

In [None]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

# Muchas librerías traen clases que podemos utilizar para el tipado

def plot_hist(df: pd.DataFrame, col: str) -> go.Figure:
    fig = px.histogram(df, x=col)
    mean = df[col].mean()
    
    fig.add_trace(go.Scatter(
    x=[mean, mean],
    y=[0, df[col].count()],
    mode="lines",
    line=dict(color="red", dash="dash"),
    name="Mean"))

    return fig

## Programación funcional
### Closures

In [None]:
def generador_ecuaciones_cuadraticas(a, b, c):
    def ecuacion(x):
        return a*x**2 + b*x + c

    return ecuacion

cuadratica = generador_ecuaciones_cuadraticas(2,3,4)
cuadratica

In [None]:
cuadratica(x=7)

### Currying

In [None]:
def suma(a,b,c):
    return a+b+c

suma(2,3,4)

In [None]:
def suma(a):
    def suma_b(b):
        def suma_c(c):
            return a+b+c
        return suma_c
    return suma_b

suma(2)(3)(4)

In [None]:
suma_parcial = suma(2)(4)
suma_final = suma_parcial(5)
suma_final

### Recursividad

In [None]:
def factorial(num):
    if num == 0 or num == 1: # Condición base
        return 1

    # Lógica: 5! == 5*4*3*2*1 == 5*4!
    return num * factorial(num-1)

for i in range(10):
    print(factorial(i))

In [None]:
def nth_fibonacci_num(n):
    if n < 0:
        raise ValueError("Input must be a non-negative integer")
    elif n == 0: # Condición base
        return 0
    elif n == 1: # Condición base
        return 1
    else:
        return nth_fibonacci_num(n - 1) + nth_fibonacci_num(n - 2) # Lógica


for i in range(15):
    print(nth_fibonacci_num(i))

In [None]:
# Ejemplo de un while usando recursividad

def recursive_loop():
    user_input = input("Enter something (or 'exit' to stop): ")
    if user_input.lower() == 'exit': # Condición base
        print("Exiting...")
    else:
        print(f"You entered: {user_input}")
        recursive_loop() # Lógica

recursive_loop()

### Decoradores

In [None]:
import time

# Decorador para temporizar la ejecución de una función

def time_it(func):
    def wrapper(*args, **kwargs):
        start = time.time()
        result = func(*args, **kwargs) # Llamamos nuestra función aquí
        end = time.time()
        print(f"Execution time: {end-start} seconds")
        return result
    return wrapper

@time_it
def long_for():
    for i in range(100_000_000):
        i = 0
    return "Hola"

long_for()

In [None]:
# Podemos tener decoradores con parámetros

def time_it(verbose = 2):
    def decorator(func):
        def wrapper(*args, **kwargs):
            start_time = time.time()
            result = func(*args, **kwargs)
            end_time = time.time()
            if verbose >= 2:
                print(f"Start time = {start_time}")
                print(f"End time = {end_time}")
            if verbose >=1:
                print(f"Execution time: {end_time - start_time:.4f} seconds")
            return result
        return wrapper
    return decorator

@time_it(2)
def slow_function(seconds):
    time.sleep(seconds)
    print("Function completed")

# Usage
slow_function(2)

In [None]:
@time_it(verbose=1)
def slow_function(seconds):
    time.sleep(seconds)
    print("Function completed")

# Usage
slow_function(2)

In [None]:
@time_it(verbose=0)
def slow_function(seconds):
    time.sleep(seconds)
    print("Function completed")

# Usage
slow_function(2)

### Generadores

In [None]:
# En Python existe un tipo de objeto llamado generador. Estos objetos permiten iterar sobre ellos y arrojan valores de manera programática,
# sin necesariamente almacenarlos todos a la vez en memoria.

def custom_range(n):
    counter = 0
    while counter < n:
        yield counter # yield es como un return, pero no detiene la función. En su lugar, arroja el valor y se sigue ejecutando el código.
        counter += 1
        
for num in custom_range(5): # range(5)
    print(num)

In [None]:
type(custom_range)

In [None]:
type(custom_range(5))

In [None]:
# Sin poner un return, Python automáticamente asigna el retorno de la función a tipo generador. Por lo tanto, podemos utilizar el método yield
# directamente en el método dunder __iter__()

class Baraja:
    def __init__(self):
        self.cartas = [num for num in range(8)]

    def __iter__(self):
        for carta in self.cartas:
            yield carta

baraja = Baraja()

for carta in baraja:
    print(carta)

In [None]:
# Podemos utilizar la keyword from para arrojar valores de otro generador u iterador

def quadratic_range(n=2):
    yield from range(n**2)

for num in quadratic_range(2):
    print(num)

In [None]:
# Podemos utilizar la función `next()` para acceder al siguiente elemento de un generador, hasta agotarlos
range_2 = quadratic_range(2)

print(next(range_2))
print(next(range_2))
print(next(range_2))
print(next(range_2))

In [None]:
# Si utilizamos `next()` sobre un generador vacío, obtendremos una excepción de tipo StopIteration

print(next(range_2))

In [None]:
# Podemos tener generadores que reciben elementos con el método `.send()` , además de arrojarlos

def counter():
    total = 0
    while True:
        value = (yield total)
        if value is not None:
            total += value

gen = counter()
next(gen)

print(gen.send(10))
print(gen.send(1))
print(gen.send(5))
print(gen.send(4))

### Módulo `functools`

In [None]:
import functools

# Podemos utilizar lru_cache para almacenar retornos de funciones 
@functools.lru_cache(maxsize=128)
def pow_2(n):
    print(f"Computing {n}...")
    return n * n

print(pow_2(10))
print(pow_2(10))  # cache hit
print(pow_2(11))  # cache miss

In [None]:
# Los partials nos permiten introducir argumentos a una función parcialmente para completarla en otro momento. El mismo efecto
# se puede lograr con lambdas o con currying, pero esto es más eficiente a nivel computacional, ya que nos ahorramos una llamada y por lo tanto
# una operación de stack en nuestra memoria.

def power(base, exponent):
    return base ** exponent

square = functools.partial(power, exponent=2)
cube = functools.partial(power, exponent=3)

print(type(square), square(5))  # <class 'functools.partial'> 25 (5^2)
print(type(cube), cube(5))    # <class 'functools.partial'> 125 (5^3)

In [None]:
# Esta función se utiliza igual que partial, pero sirve para los métodos de una clase

class Calculator:
    def power(self, base, exponent):
        return base ** exponent

    square = functools.partialmethod(power, exponent=2)
    cube = functools.partialmethod(power, exponent=3)

calc = Calculator()
print(type(calc.square), calc.square(4))  # <class 'functools.partial'> 16 (4^2)
print(type(calc.cube), calc.cube(3))    # <class 'functools.partial'> 27 (3^3)


In [None]:
# La función wraps ayuda a mejorar nuestros decoradores conservando el metadata de la función original. Para usarla debemos decorar la función
# wrapper dentro de nuestro decorador.

# Sin wraps
def my_decorator(func):
    def wrapper(*args, **kwargs):
        print(f"Calling {func.__name__}")
        return func(*args, **kwargs)
    return wrapper

@my_decorator
def say_hello():
    """This function says hello."""
    print("Hello!")

say_hello()
print(say_hello.__name__)  # wrapper
print(say_hello.__doc__)   # None

In [None]:
# Usando wraps
def my_decorator(func):
    @functools.wraps(func)
    def wrapper(*args, **kwargs):
        print(f"Calling {func.__name__}")
        return func(*args, **kwargs)
    return wrapper

@my_decorator
def say_hello():
    """This function says hello."""
    print("Hello!")

say_hello()
print(say_hello.__name__)  # say_hello 
print(say_hello.__doc__)   # "This function says hello."

# Optimización de código
## DRY
El principio DRY hace referencia a Don't Repeat Yourself (No te repitas). Esto es clave no solo en la filosofía de clean code, donde queremos tener un código de tal forma que esté modularizado y cada función y clase tenga una responsabilidad única, sino que también afecta a como desarrollamos pensando en la eficiencia. Si en clean code DRY simboliza la simpleza, cuando hablamos de _performance_ estamos buscando la manera de que no se ejecuten más operaciones de las necesarias.

In [None]:
# ¿Cuál de estas dos funciones es más eficiente?

@time_it(2)
def drop_duplicates_1(lista):
    i = 0
    resultado = set()
    while i < len(lista):
        resultado.add(lista[i])
        i +=1
    return resultado

@time_it(2)
def drop_duplicates_2(lista):
    i = 0
    resultado = set()
    size = len(lista)
    while i < size:
        resultado.add(lista[i])
        i +=1
    return resultado

In [None]:
lista = [num for num in range(10_000)]
lista_enorme = [num for num in range(100_000_000)]

In [None]:
drop_duplicates_1(lista)
print()
drop_duplicates_2(lista)
print()

In [None]:
drop_duplicates_1(lista_enorme)
print()
drop_duplicates_2(lista_enorme)
print()

## Big O(n)
Esto es un concepto que proviene de las matemáticas, y es el estudio de la complejidad de una operación. La complejidad determina cómo varía el consumo de recursos de la operación en función del tamaño del input. En la programación, tenemos dos recursos principales de los que preocuparnos: el tiempo y la memoria.

En la enorme mayoría de las ocasiones estaremos sacrificando tiempo de ejecución por mejor manejo de memoria, o viceversa. Qué debemos hacer en cada caso va a depender mucho de las necesidades del problema que estamos resolviendo.

En la notación de O(n) no se tienen en cuenta las constantes (el _overhead_), sino únicamente como influye el input en los recursos.

A continuación se pueden ver ejemplos de algoritmos de diferentes complejidades temporales en orden de menor a mayor influencia del input.

In [None]:
array = [1,43,12,5,12,65334,132,124,1111,98]
sorted_array = sorted(array)

In [None]:
# y = 4x + 3 -> O(n)

In [None]:
%%time
# Complejidad O(1) (constante)

def get_first_element(arr):
    return arr[0]

get_first_element(array)

In [None]:
%%time
# Complejidad O(log n) (logarítmica)

def binary_search(arr, target):
    left, right = 0, len(arr) - 1
    while left <= right:
        mid = (left + right) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return -1 # No encontrado

binary_search(sorted_array, 1111)

In [None]:
%%time
# Complejidad O(n) (lineal)

def search(arr, target):
    for idx, num in enumerate(arr):
        if num == target:
            return idx
    return -1 # No encontrado

search(sorted_array, 1111)

In [None]:
%%time
# Complejidad O(n log n) (n-logarítmica)

def merge_sort(arr):
    if len(arr) <= 1:
        return arr
    mid = len(arr) // 2
    left_half = merge_sort(arr[:mid])
    right_half = merge_sort(arr[mid:])
    return merge(left_half, right_half)

# Función auxiliar
def merge(left, right):
    result = []
    i = j = 0
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    result.extend(left[i:])
    result.extend(right[j:])
    return result

merge_sort(array)

In [None]:
%%time
# Complejidad O(n**2) (cuadrática)

def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        for j in range(0, n - i - 1):
            if arr[j] > arr[j + 1]:
                arr[j], arr[j + 1] = arr[j + 1], arr[j]
    return arr

bubble_sort(array)

In [None]:
%%time
# Complejidad O(2**n) (exponencial)

def fibonacci(n):
    if n <= 1:
        return n
    return fibonacci(n - 1) + fibonacci(n - 2)

fibonacci(100)

In [None]:
%%time

# Complejidad O(n!) (factorial)

def generate_permutations(arr):
    if len(arr) == 0:
        return []
    if len(arr) == 1:
        return [arr]
        
    perms = []
    for i in range(len(arr)):
        current = arr[i]
        remaining = arr[:i] + arr[i+1:]
        
        for p in generate_permutations(remaining):
            perms.append([current] + p)

    return perms

generate_permutations(array)

## Consumo de memoria vs tiempo de ejecución

In [None]:
import pandas as pd

p_lista = "datos.csv"

# Función optimizada para velocidad

def mean(lista): # lista = 1.1 MB = ~1_100_000 bytes 
    suma = 0 # 24 bytes
    for elem in lista: # elem = 24 bytes
        suma += elem
    size = len(lista) # 24 bytes
    return suma / size if size > 0 else 0 # 24 bytes


In [None]:
# Función optimizada para reducir el uso de memoria

def mean_lazy(p_lista, headers=True): # headers = 1 byte | p_lista = ~64 bytes
    suma = 0 # 24 bytes
    size = 0 # 24 bytes
    f = None # 0 bytes (null pointer)
    try:
        f = open(p_lista) # ~8192 bytes (file buffer)
        line = f.readline() # ~256 bytes
        if headers:
            line = f.readline()

        while line:
            values = line.split(",") # ~1024 bytes
            num = float(values[3]) # 24 bytes
            suma += num
            size += 1
            line = f.readline()
        
    except Exception as e:
        print(f"An error occurred: {e}") # ~64 bytes
    
    finally:
        if f is not None:
            f.close()
            
    return suma / size if size > 0 else 0 # 24 bytes

In [None]:
%%timeit
# Total memory usage ~12.6MB
lista = pd.read_csv(p_lista)["age"].to_list()

In [None]:
%%timeit
# Total memory usage >1.1MB
lista = pd.read_csv(p_lista)["age"].to_list()
mean(lista)

In [None]:
%%timeit
# Total memory usage ~10KB
lista = pd.read_csv(p_lista)["age"].to_list()
mean_lazy(p_lista)

## Garbage collection
Muchos lenguajes de programación funcionan con un garbage collector para que no nos tengamos que preocupar demasiado por el manejo de memoria. Entre esos lenguajes se encuentra Python.

El garbage collector no es más que un programa o proceso que se ejecuta junto con el programa que nosotros hemos escrito. Se encarga de recolectar variables y de liberar la memoria que ocupan cuando se dejan de utilizar. En uno de los ejemplos anteriores, cuando cargamos la lista con `pandas`, por un momento estamos creando un dataframe. Como no lo estamos almacenando en ninguna variable, el garbage collector se encarga de eliminar ese dataframe de la memoria tan pronto como puede. Por esa razón esta celda llega a tardar incluso más en ejecutarse que nuestra función `mean_lazy()`.

```python
%%time
# Total memory usage ~12.6MB
lista = pd.read_csv(p_lista)["age"].to_list()
print(mean(lista))
```

En la práctica rara vez tenemos que pensar en el garbage collector cuando trabajamos con Python, pero si identificamos un código como el anterior dentro de un bucle por ejemplo, debemos prestarle atención porque habrá bastante margen de mejora en cuanto al rendimiento.

## Outsourcing
Otra forma de mejorar de manera significativa nuestro código en términos de eficiencia es aprovechar las herramientas que ofrecen Python a nuestra disposición, así como las librerías externas que ofrecen mejoras de eficiencia como `numpy`.

Python es un lenguaje lento de facto, es el precio a pagar por su simpleza y fácilidad de adopción. No obstante, podemos aprovechar el poder de otros lenguajes como C, C++, Rust, Zig y otros sin salir de nuestro notebook. Muchos de estos códigos pesados, como los algoritmos de _sorting_, ya tienen una implementación optimizada en estos lenguajes de bajo nivel. Nosotros tan solo tenemos que utilizar la interfaz que nos ofrecen para Python si necesitamos realizar las tareas pertinentes.

In [None]:
# En lugar de implementar nuestro propio algoritmo para ordenar, podemos usar `sorted()`

lista = [12312,12,312,11,-1221,312,643,87654,124564536451]
sorted(lista)

In [None]:
import numpy as np

# En lugar de utilizar listas, podemos utilizar los arrays de numpy
array = np.array([12312,12,312,11,-1221,312,643,87654,124564536451])
array.sort()
array

## Tips extra
- Evitar variables globales. Cuantas menos variables globales tengamos, mejor. Idealmente no deberías tener ninguna.
- Aprovechar los generadores y los iteradores para no cargar muchos elementos de golpe en memoria, sino calcularlos uno a uno conforme sea necesario.
- Utilizar `%%time` o `%%timeit` para obtener unas medidas de ejecución como se ha hecho en los ejemplos de Big O.
- Aprovechar los sets y los diccionarios, pues suelen tener una complejidad temporal constante a la hora de indexarlos, a diferencia de las listas.
- Evitar bucles innecesarios. Aprovechar el módulo `itertools` para operaciones comunes de bucles y combinatoria.
- Evitar utilizar operaciones costosas como `try-except` dentro de bucles siempre que sea posible.
- Evitar hacer operaciones I/O de una en una:
    ```python
    with open('output.txt', 'w') as f:
        for line in lines:
            f.write(line + '\n')
    ```
    
    VS
  
    ```python
    with open('output.txt', 'w') as f:
        f.write('\n'.join(lines))
    ```