# Diagnóstico y solución del error de importación y atributos en el proyecto

Este notebook te guía para:
- Diagnosticar por qué ocurre el error `AttributeError: module 'data_processor' has no attribute 'clean_and_prepare_data'`.
- Verificar la estructura de módulos y atributos.
- Solucionar el problema para que el pipeline funcione correctamente.

In [None]:
# 1. Verifica la existencia y contenido del archivo data_processor.py

import os

ruta_modulo = os.path.join(os.getcwd(), "src", "data_processor.py")
print("¿Existe data_processor.py?", os.path.exists(ruta_modulo))

if os.path.exists(ruta_modulo):
    with open(ruta_modulo, encoding="utf-8") as f:
        print(f.read())
else:
    print("El archivo src/data_processor.py no existe. Debes crearlo e implementar la función clean_and_prepare_data.")

## 2. ¿Por qué ocurre el error?

El error se debe a que el archivo `src/data_processor.py` existe pero **no contiene** la función `clean_and_prepare_data`, o el archivo está vacío.

**Solución:**  
Debes implementar la función `clean_and_prepare_data` en `src/data_processor.py`.  
Ejemplo mínimo para que el pipeline avance:

In [None]:
# src/data_processor.py
def clean_and_prepare_data(df, config=None):
    """
    Limpia y prepara el DataFrame de encuestas.
    Esta es una versión mínima. Personalízala según tus necesidades.
    """
    # Ejemplo: elimina filas completamente vacías y rellena NaN con vacío
    df = df.dropna(how='all')
    df = df.fillna('')
    # Aquí puedes agregar más lógica de limpieza según el proyecto
    return df

## 3. ¿Cómo probar la solución?

1. Copia el código de la celda anterior en `src/data_processor.py`.
2. Ejecuta de nuevo `main.py`.
3. Si necesitas lógica de limpieza avanzada, implementa más funciones dentro de ese archivo.

**Recomendación:**  
Asegúrate de que todos los módulos (`data_processor`, `visualizer`, etc.) tengan las funciones que el pipeline espera.

## 4. Resumen de buenas prácticas para módulos

- Cada archivo `.py` debe tener las funciones públicas que se usan desde `main.py`.
- Si el archivo está vacío o solo tiene comentarios, Python lo importa pero no encuentra los atributos.
- Si usas carpetas como paquetes, asegúrate de tener `__init__.py` en cada una.
- Si cambias la estructura, ajusta las rutas en `sys.path` y las importaciones.

**¡Con esto tu pipeline debería avanzar!**