In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# Carga del Dataset

In [None]:
df : pd.DataFrame = pd.read_csv('dxCropRecommendation.csv')
df.head()

# Analisis Exploratorio 

In [None]:
# Analisis valores nulos y faltantes 
df.isna().sum()

In [None]:
""" 
Boxplot distribución total de las variables 
"""

# Excluir la columna 'Cultivo' y transformar el DataFrame a formato largo
df_largo = df.melt(id_vars=['Cultivo'], var_name='Variable', value_name='Valor')

# Crear el box plot usando plotly express
fig = px.box(df_largo, x='Variable', y='Valor', color= 'Variable')

# Mostrar la figura
fig.show()


In [None]:
""" 
Boxplot de distribución de cada variable dependiendo el cultivo  
"""

columns = df.columns.drop('Cultivo')

for column in columns: 
    fig = px.box(df, x='Cultivo', y= column, color= 'Cultivo', title=f"Distribución de {column} por cultivo")
    fig.show()

In [None]:
""" 
Boxplot de distribucion de la variable dependiendo el cultivo
"""

fig = make_subplots(rows=1, cols=1)

dropdown_options = []
columns = df.columns.drop('Cultivo')

for column in columns:
    fig.add_trace(
        go.Box(
            y=df[column],
            x=df['Cultivo'],
            name=column,
            marker_color = 'tomato'
        ),
        row=1, col=1
    )
    dropdown_options.append({
        'label': column,
        'method': 'update',
        'args': [{'visible': [col == column for col in columns]},
                 {'title': f"Distribución de {column} por cultivo"}]
    })

# Inicialmente, mostrar solo la primera columna
fig.update_traces(visible=False)
fig.data[0].visible = True

fig.update_layout(
    updatemenus=[{
        'buttons': dropdown_options,
        'direction': 'down',
        'showactive': True,
        'x': 0.5,
        'y': 1.15,
        'xanchor': 'center',
        'yanchor': 'top'
    }],
    title_text=f"Distribución de {columns[0]} por cultivo",
)

fig.show()