# PRUEBA EDA 

# 🧪 Exploración de Datos Automatizada
Este notebook muestra cómo usar la clase `EDAHelper` para realizar un Análisis Exploratorio de Datos por fases.

### 📂 Estructura de Carpetas para ejecutar el EDA

In [None]:
"""
mi_proyecto/
│
├── src/
│   └── Class_EDA.py   ← Aquí está tu clase `EDAHelper`
│   └── Class_Test.py   ← Aquí está tu clase `StatisticalTest`
│
├── data/
│   └── archivo.csv        ← Tu dataset
│
├── document/
│   └── eda_analysis.ipynb ← Tu notebook
│   └── Doc_Aux.ipynb ← Documento de informacio tecnica teorica
"""

# ⚙️🔧🛠️ Importaciones y carga de archivos

In [None]:
# RECURSOS
import os
import sys
import pandas as pd

# Importacion de los recursos Class_EDA (Class_Test ya importado desde Class_EDA)
# Añadir la carpeta src al path
sys.path.append(os.path.abspath(os.path.join('..', 'src')))
# Importar clase
from Class_EDA import EDAHelper

# Carga del archivo (Copia el archivo a analizar a la carpeta Data)
# Nombre del archivo
dataset = 'tu_archivo.ext' # ❗❗❗❗ Cambia esto por el nombre de tu archivo ❗❗❗
# Ruta del archivo de datos
file_path = os.path.join('..', 'data', dataset)  

# Crear instancia y cargar datos
eda = EDAHelper(file_path)
eda.load_data()
eda.df_raw # Muestra los datos originales

## 🗄️ Fase 0: Datos Crudos

In [None]:
eda.run_fase0_Datos_Crudos()

### 📝 Notas Fase 0

### 🧩🧹 Transformaciones Básicas

In [None]:
'EJEMPLOS DE TRANSFORMACIONES'
"""
#- Modificamos el formato de las columnas Alta y Fecha_venta a tipo datetime
eda.df['Alta'] = pd.to_datetime(eda.df['Alta'])
eda.df['Fecha_Venta'] = pd.to_datetime(eda.df['Fecha_Venta'])
#- Modificamos el formato de la columna Año a tipo String
eda.df['Año'] = eda.df['Año'].astype(str)
#- Modificamos el formato de la columna Año a tipo booleano
eda.df['Desmontada'] = eda.df['Desmontada'].astype(bool)
#- Eliminamos las columnas Fotos y Fotos_veh
eda.df.drop(columns=['Fotos'], inplace=True)
eda.df.drop(columns=['Fotos_Veh'], inplace=True)"""

In [None]:
# Muestra los datos con las transformaciones aplicadas.
eda.df

### Exportar DataSet Transformado

In [None]:
'DESCOMENTA LA OPCION QUE NECESITES Y EJECUTA'
#eda.df.to_csv((os.path.join("Descargas","archivo.xlsx"), index=False)
#eda.df.to_csv((os.path.join("Descargas","archivo.xlsx"), index=False, encoding='utf-8') # Si contiene tildes o caracteres especiales
#eda.df.to_parquet(os.path.join("Descargas","archivo.xlsx"), index=False) # pip install pyarrow (o fastparquet)
#eda.df.to_excel(os.path.join("Descargas","archivo.xlsx"), index=False) # pip install openpyxl (para .xlsx)


## 🔍 Fase 1: Análisis Preliminar

In [None]:
eda.run_fase1_preliminar()

#### 📝 Notas Fase 1:

## 🔢 Fase 2: Análisis Numérico

In [None]:
eda.run_fase2_numericas()

#### 📝 Notas Fase 2:

## 🔠 Fase 3: Variables Categóricas

In [None]:
#modifica el parametro para cambiar el numero de columnas de los graficos (Por defecto 15)
eda.run_fase3_categoricas(max_categorias=15) 

#### 📝 Notas Fase 3:

## 📆 Fase 4: Fechas y Booleanos

In [None]:
eda.run_fase4_fechas_booleans()

#### 📝 Notas Fase 4:

## 🔗 Fase 5: Correlaciones

In [None]:
eda.run_fase5_correlaciones()

#### 📝 Notas Fase 5:

## 🧾 Fase 6: Conclusiones Automáticas

In [None]:
eda.run_fase6_conclusiones()

#### 📝 Notas Fase 6:

## 🧪 Fase Test: Análisis Univariante con Test Estadísticos

In [None]:
'DESCOMENTAR PARA EJECUTAR TEST'
#eda.run_fase_test_univariante()

#### 📝 Notas Test Univariante:

## 🧪 Fase Test A/B (1 Muestra) -> Hipotesis

In [None]:
'DESCOMENTAR PARA EJECUTAR TEST'
#eda.run_fase_test_one_sample()

#### 📝 Notas Test One Sample:

## ⚗️ Fase Test: Análisis Bivariante con Test Estadísticos

In [None]:
'DESCOMENTAR PARA EJECUTAR TEST'
#eda.run_fase_test_bivariante()

#### 📝 Notas Test Bivariante:

## ⚗️ Fase Test A/B (Grupos) -> Hipotesis

In [None]:
'DESCOMENTAR PARA EJECUTAR TEST'
#eda.run_fase_test_ab()

#### 📝 Notas Test A/B (Grupos):