# Organizando un proyecto

**Niveles**:

* Código
* Notebook
* Repositorio

# Objetivos

* **Ahorrar tiempo**
* **Facilidad en el trabajo**
    * Escalabilidad: poder añadir funciones nuevas o mejorar el proceso.
    * Robustez: evitar errores.
    * Poder compartirlo con compañeros: intercambiar ideas, colaborar.

# Organiza el trabajo

* Piensa de antemano qué quieres conseguir y cómo.
    * Diagramas de flujo
    * Mapas mentales: [XMind](https://xmind.ai/)
    * Papel y bolígrafo

# Bajo nivel

## Comenta el código

Al escribir un código por primera vez, se suelen tener las ideas claras y mucha información de la implementación técnica. Con el paso del tiempo, aparecerán otros asuntos y el código evolucionará. Por eso, es importante documentar el código con comentarios, tipados y docstrings para que otras personas puedan entenderlo y para que uno mismo pueda recordar lo que hizo. 

Muy útil para Copilot y otros ayudantes automáticos.

<p align="center">
    <img src="https://pbs.twimg.com/media/CYPTfviWQAAa2VG?format=jpg&name=900x900" alt="Image">
</p>

Consejos a la hora de comentar:

* Mantén comentarios de alto nivel que no repitan el código.
* Añade explicaciones si no es evidente el motivo del código.
* Sé preciso y conciso.

In [1]:
# Ejemplo sin comentar
def procesar_datos(datos): # Mejorar nombre de la función
    resultados = []
    for d in datos:
        if d > 0:
            valor = d * 2
            if valor % 3 == 0:
                resultados.append(valor)
            elif valor % 5 == 0:
                resultados.append(valor * 2)
        elif d < 0:
            valor = abs(d)
            resultados.append(valor**2)
    return resultados

datos = [1, -2, 3, 4, -5, 6, 7, -8, 9, 10]
print(procesar_datos(datos))

[4, 6, 25, 12, 64, 18, 40]


In [2]:
# Ejemplo comentado
def procesar_datos(datos):
    """
    Esta función procesa una lista de números y devuelve una nueva lista con resultados basados en ciertas condiciones.
    Si el número es positivo, se multiplica por 2 y si el resultado es divisible por 3, se añade a la lista de resultados.
    Si el resultado es divisible por 5, se multiplica por 2 y se añade a la lista de resultados.
    Si el número es negativo, se obtiene el valor absoluto y se eleva al cuadrado, añadiendo el resultado a la lista.
    """
    resultados = [] 
    for d in datos: 
        if d > 0:  # Si el número es positivo
            valor = d * 2  
            if valor % 3 == 0:  # Si el resultado es divisible por 3
                resultados.append(valor) 
            elif valor % 5 == 0:  # Si el resultado es divisible por 5
                resultados.append(valor * 2) 
        elif d < 0:  # Si el número es negativo
            valor = abs(d) 
            resultados.append(valor**2) 
    return resultados 

datos = [1, -2, 3, 4, -5, 6, 7, -8, 9, 10]
print(procesar_datos(datos))

[4, 6, 25, 12, 64, 18, 40]


In [None]:
# ¿Puedes mejorar el código?
def procesar_datos(datos):
    pass

## Readability counts (la legibilidad cuenta)

In [3]:
# Difícil de leer
def f(x,y):return x*y;
a=10;b=20;c=f(a,b);print(c)

200


In [4]:
# Más fácil de leer
def calcular_producto(numero1, numero2):
  """
  Esta función calcula el producto de dos números.
  """
  producto = numero1 * numero2
  return producto

numero_a = 10
numero_b = 20
resultado = calcular_producto(numero_a, numero_b)
print(resultado)

200


**Consejos**:
* **Usar nombres descriptivos**: Los nombres de las variables y funciones deben ser descriptivos y representar el propósito de la variable o función.
* **Ser riguroso con los nombres de las variables**: evitar utilizar el mismo nombre para dos objetos con comportamientos diferentes.
* **Usar convenciones de estilo**, como [PEP 8](https://peps.python.org/pep-0008/).
* **Dar aire**: añadir espacios en blanco para separar bloques de código, especialmente para bloques funcionales.

# Estructura del código

<p align="center">
    <img src="https://substackcdn.com/image/fetch/w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2F7b4d4e36-8863-4aa7-be38-2e99121ef2a4_1080x1020.png">
</p>

## Código spaghetti

<p align="center">
    <img src="https://miro.medium.com/v2/resize:fit:750/format:webp/0*RTnjKNOBLvh95iK-.png" alt="Image">
</p>

In [None]:
# Código spaghetti
def process_data(data):
    result = 0
    if data['type'] == 1:
        for i in range(len(data['values'])):
            if data['values'][i] > 10:
                result += data['values'][i] * 2
            else:
                result += data['values'][i]
        if result > 1000:
            result /= 2
    elif data['type'] == 2:
        j = 0
        while j < len(data['values']):
            if data['values'][j] < 5:
                result += data['values'][j] * 3
            else:
                result += data['values'][j]
            j += 1
        if result < 50:
            result *= 2
    elif data['type'] == 3:
        k = 0
        while k < len(data['values']):  # Changed to while loop for demonstration
            result += data['values'][k] + 5
            k += 1
        if result % 2 == 0:
            result = result / 3
    else:  # Default case, could be more complex
        for m in range(len(data['values'])):
            result += data['values'][m]

    if result > 500:
        result -= 100

    return result

In [None]:
# Versión refactorizada
def process_data_type1(values):
    result = 0
    for value in values:
        result += value * 2 if value > 10 else value
    return result / 2 if result > 1000 else result

def process_data_type2(values):
    result = 0
    for value in values:
        result += value * 3 if value < 5 else value
    return result * 2 if result < 50 else result

def process_data_type3(values):
    result = 0
    for value in values:
        result += value + 5
    return result / 3 if result % 2 == 0 else result

def process_data(data):
    values = data['values']  # Extract values for easier access
    data_type = data['type']

    if data_type == 1:
        result = process_data_type1(values)
    elif data_type == 2:
        result = process_data_type2(values)
    elif data_type == 3:
        result = process_data_type3(values)
    else:  # Default case
        result = sum(values) # More concise default calculation

    return result - 100 if result > 500 else result

## Código lasaña 

Los códigos lasaña son códigos con excesivas capas, haciéndolo más complejo y difícil de mantener de lo necestario. 

In [None]:
# Código lasaña
class DataProcessor:
    def __init__(self, data_source):
        self.data_source = data_source
        self.filter = DataFilter()
        self.transformer = DataTransformer()
        self.aggregator = DataAggregator()

    def process_data(self):
        raw_data = self.data_source.fetch_data()
        filtered_data = self.filter.apply_filter(raw_data)
        transformed_data = self.transformer.transform_data(filtered_data)
        aggregated_data = self.aggregator.aggregate(transformed_data)
        return aggregated_data

class DataSource:  # Layer 1
    def fetch_data(self):
        # Imagine complex database interaction or API calls here...
        return [{"id": 1, "value": 10}, {"id": 2, "value": 20}, {"id": 3, "value": 30}]  # Simplified for demonstration

class DataFilter:  # Layer 2
    def apply_filter(self, data):
        return [item for item in data if item["value"] > 5] # Simple filter

class DataTransformer:  # Layer 3
    def transform_data(self, data):
        return [{"id": item["id"], "doubled_value": item["value"] * 2} for item in data]

class DataAggregator:  # Layer 4
    def aggregate(self, data):
        return sum(item["doubled_value"] for item in data)
    
# Usage
source = DataSource()
processor = DataProcessor(source)
result = processor.process_data()
print(result)  # Output: 120

In [None]:
# Versión refactorizada
def process_data(data):  # No need for a separate DataProcessor class
    filtered_data = [item for item in data if item["value"] > 5]
    transformed_data = [{"id": item["id"], "doubled_value": item["value"] * 2} for item in filtered_data]
    aggregated_data = sum(item["doubled_value"] for item in transformed_data)
    return aggregated_data

def fetch_data():  # Keep data fetching separate but not overly abstracted
    # Imagine complex database interaction or API calls here...
    return [{"id": 1, "value": 10}, {"id": 2, "value": 20}, {"id": 3, "value": 30}]

# Usage
data = fetch_data()
result = process_data(data)
print(result)  # Output: 120

# Alto nivel

# Patrones de diseño

Los patrones de diseño son estrategias para organizar el código que solventan problemas comunes en el diseño de software. Hay de muchos tipos, pero aquí abordaremos el **diseño modular**. Para ver más opciones, puedes consultar [Design Patterns in Python](https://refactoring.guru/design-patterns/python).

## Diseño modular

 El **diseño modular** consiste en dividir un programa en partes o módulos más pequeños. Cada módulo tiene una función o tarea específica y se comunica con otros módulos para realizar tareas más complejas. 

* **Ventajas**:
    * Fácil de mantener y depurar: responsabilidades claras y acotadas.
    * Permite reutilizar código.
    * Facilita la colaboración en equipos grandes.
* **Desventajas**:
    * Puede ser más lento debido a la comunicación entre módulos.
    * Requiere una buena planificación y diseño inicial.


**Ejemplos**:

* Varias clases encadenadas
    * La salida del objeto 1 es la entrada del objeto 2, y así sucesivamente.

In [7]:
class ProcesadorDeTexto:
    def __init__(self) -> None:
        pass

    def eliminar_espacios(self, texto: str) -> str:
        return texto.replace(" ", "")

    def convertir_a_mayusculas(self, texto: str) -> str:
        return texto.upper()

    def contar_caracteres(self, texto: str) -> int:
        return len(texto)

    def main(self, texto_original: str) -> str:
        texto_sin_espacios: str = self.eliminar_espacios(texto_original)  # Eliminamos espacios
        texto_mayusculas: str = self.convertir_a_mayusculas(texto_sin_espacios)  # Convertimos a mayúsculas
        longitud: int = self.contar_caracteres(texto_mayusculas)  # Contamos caracteres del texto en mayúsculas

        print(f"Texto original: {texto_original}")
        print(f"Longitud del texto procesado: {longitud}")

        return texto_mayusculas

procesador = ProcesadorDeTexto()
texto_procesado = procesador.main("Hola, mundo!")
texto_procesado

Texto original: Hola, mundo!
Longitud del texto procesado: 11


'HOLA,MUNDO!'

* Una clase principal que agrupa otras clases
    * La clase principal llama las clases secundarias y adapta su salida para la siguiente clase.

In [8]:
# Definir funciones fuera de la clase
def eliminar_espacios(texto: list) -> list:
    return [t.replace(" ", "") for t in texto]

def convertir_a_mayusculas(texto: str) -> str:
    return texto.upper()

def contar_caracteres(texto: str) -> int:
    return len(texto)

# Clase mejorada
class ProcesadorDeTexto:
    def __init__(self) -> None:
        pass

    def main(self, texto_original: str) -> str:
        # Comprobaciones de validez
        if not isinstance(texto_original, str):
            raise ValueError("El texto debe ser una cadena.")
        if len(texto_original) > 100:
            raise ValueError("El texto no debe tener más de 100 caracteres.")

        # Procesamiento del texto
        texto_sin_espacios: list = eliminar_espacios([texto_original])
        texto_sin_espacios_str: str = ''.join(texto_sin_espacios)
        texto_mayusculas: str = convertir_a_mayusculas(texto_sin_espacios_str)
        longitud: int = contar_caracteres(texto_mayusculas)

        print(f"Texto original: {texto_original}")
        print(f"Longitud del texto procesado: {longitud}")

        return texto_mayusculas

procesador = ProcesadorDeTexto()
texto_procesado = procesador.main("Hola, mundo!")
texto_procesado

Texto original: Hola, mundo!
Longitud del texto procesado: 11


'HOLA,MUNDO!'

# Ramas

Para aplicaciones de negocio, es conveniente tener, al menos, tres ramas:
* **main**: ejecuta el código en producción para los usuarios finales.
* **staging**: ejecuta el código en un entorno de pruebas para validar los cambios antes de implementarlos en producción. Debe ser lo más similar posible a la rama principal.
* **dev**: ejecuta el código en un entorno de desarrollo para probar nuevas características y cambios antes de enviarlos a pruebas.

**Nota**: la imagen de abajo usa "Prod Stable" en lugar de "main", "Prod" para "staging" y "Staging" para "dev". La idea es la misma, pero los nombres son diferentes.

<p align="center">
    <img src="https://miro.medium.com/v2/resize:fit:1400/format:webp/1*uvPrd2fVEiJntdYhx7WLSw.png" alt="Image">
</p>

# Versionado de módulos y entornos virtuales

* Controlar las versiones Python y módulos utilizados.
    * Permite replicar las condiciones de desarrollo.

* Utilizar un entorno virtual para cada proyecto.
    * Evita conflictos entre dependencias de diferentes proyectos.
    * Se crean con el comando: `python3 -m venv nombre_entorno`
    * Se activan con comandos (diferencias en sistemas operativos).
        * Windows: `nombre_entorno\Scripts\activate`
        * Linux: `source nombre_entorno/bin/activate`

* Los módulos utilizados se guardan en un archivo requirements.txt.
    * Se crean con el comando: `pip freeze > requirements.txt`.
    * Se instalan con el comando: `pip install -r requirements.txt`.

# Organizando el repositorio

**Organiza el código de forma que sea fácil ubicar cada elemento.** 

Esturctura de ejemplo:

* **Raíz**: Carpeta principal del proyecto.
    * `README.md`: Archivo de documentación.
    * `requirements.txt`: Archivo con las dependencias del proyecto.
    * `.gitignore`: Archivo para ignorar archivos y carpetas en Git.
    * Códigos principales

* `src/`:
    * Códigos con cada una de las clases o funciones usadas en los códigos principales.
* `tests/`:
    * Archivos de pruebas unitarias.
* `docs/`:
    * Archivos de documentación.
* `credentials/`:
    * JSON, CSV u otros archivos con credenciales.
* `utils/`:
    * Datos auxiliares o de uso común.
* `checkpoints/`:
    * Puntos de control de modelos pre-entrenados.