# Importando Librerias

In [2]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
from statsmodels.graphics.mosaicplot import mosaic

In [2]:
# ========================
# NUMÉRICA vs CATEGÓRICA
# ========================

def bar_plot(data, x, y):
    """
    Parámetros:
        data: DataFrame que contiene los datos
        x: variable categórica (string)
        y: variable numérica (string)
    """
    # Gráfico de barras con media y desviación estándar
    plt.figure(figsize=(8, 5))
    sns.barplot(data=data, x=x, y=y, ci="sd")
    plt.title(f"Bar plot de {y} por {x}")
    plt.show()


def count_plot(data, x, hue=None):
    """
    Parámetros:
        data: DataFrame
        x: variable categórica principal (string)
        hue: variable categórica secundaria (opcional, string)
    """
    plt.figure(figsize=(8, 5))
    sns.countplot(data=data, x=x, hue=hue)
    plt.title(f"Count plot de {x}")
    plt.show()


def swarm_plot(data, x, y):
    """
    Parámetros:
        data: DataFrame
        x: variable categórica (string)
        y: variable numérica (string)
    """
    plt.figure(figsize=(8, 5))
    sns.swarmplot(data=data, x=x, y=y)
    plt.title(f"Swarm plot de {y} por {x}")
    plt.show()


def violin_plot(data, x, y):
    """
    Parámetros:
        data: DataFrame
        x: variable categórica (string)
        y: variable numérica (string)
    """
    plt.figure(figsize=(8, 5))
    sns.violinplot(data=data, x=x, y=y)
    plt.title(f"Violin plot de {y} por {x}")
    plt.show()


def raincloud_plot(data, x, y):
    """
    Parámetros:
        data: DataFrame
        x: variable categórica (string)
        y: variable numérica (string)
    """
    plt.figure(figsize=(8, 5))
    sns.violinplot(data=data, x=x, y=y, inner=None, color="lightblue")
    sns.boxplot(data=data, x=x, y=y, width=0.2, showcaps=False, boxprops={'facecolor':'white'}, showfliers=False)
    sns.stripplot(data=data, x=x, y=y, size=3, color="black", alpha=0.3, jitter=True)
    plt.title(f"Raincloud plot de {y} por {x}")
    plt.show()


def box_plot(data, x, y):
    """
    Parámetros:
        data: DataFrame
        x: variable categórica (string)
        y: variable numérica (string)
    """
    plt.figure(figsize=(8, 5))
    sns.boxplot(data=data, x=x, y=y)
    plt.title(f"Box plot de {y} por {x}")
    plt.show()

# ========================
# CATEGÓRICA vs CATEGÓRICA
# ========================

def crosstab_plot(data, x, y):
    """
    Parámetros:
        data: DataFrame
        x: variable categórica 1 (string)
        y: variable categórica 2 (string)
    """
    tabla = pd.crosstab(data[x], data[y])
    print("Tabla cruzada:")
    print(tabla)


def mosaic_plot(data, x, y):
    """
    Parámetros:
        data: DataFrame
        x: variable categórica 1 (string)
        y: variable categórica 2 (string)
    """
    tab = pd.crosstab(data[x], data[y])
    mosaic(tab.stack())
    plt.title(f"Mosaic plot de {x} vs {y}")
    plt.show()


def heatmap_plot(data, x, y):
    """
    Parámetros:
        data: DataFrame
        x: variable categórica 1 (string)
        y: variable categórica 2 (string)
    """
    tabla = pd.crosstab(data[x], data[y])
    plt.figure(figsize=(8, 5))
    sns.heatmap(tabla, annot=True, fmt='d', cmap="YlGnBu")
    plt.title(f"Heatmap de {x} vs {y}")
    plt.show()


def stacked_bar_chart(data, x, y):
    """
    Parámetros:
        data: DataFrame
        x: variable categórica principal (string)
        y: variable categórica para apilar (string)
    """
    tabla = pd.crosstab(data[x], data[y])
    tabla.plot(kind='bar', stacked=True, figsize=(8, 5), colormap='tab20')
    plt.title(f"Stacked Bar Chart de {x} vs {y}")
    plt.ylabel("Frecuencia")
    plt.show()


def grouped_bar_chart(data, x, hue):
    """
    Parámetros:
        data: DataFrame
        x: variable categórica base (string)
        hue: variable categórica agrupadora (string)
    """
    plt.figure(figsize=(8, 5))
    sns.countplot(data=data, x=x, hue=hue)
    plt.title(f"Grouped Bar Chart de {x} por {hue}")
    plt.show()


def analizar_excel(path_archivo, var1, var2, hoja=0):
    """
    Parámetros:
        path_archivo: ruta al archivo Excel (string)
        var1: nombre de la primera variable (string)
        var2: nombre de la segunda variable (string)
        hoja: nombre o número de hoja (por defecto 0)
    
    Esta función detecta si var1 y var2 son numéricas o categóricas,
    y lanza los gráficos apropiados.
    """
    df = pd.read_excel(path_archivo, sheet_name=hoja)
    
    tipo1 = 'num' if pd.api.types.is_numeric_dtype(df[var1]) else 'cat'
    tipo2 = 'num' if pd.api.types.is_numeric_dtype(df[var2]) else 'cat'
    
    if tipo1 == "cat" and tipo2 == "num":
        bar_plot(df, var1, var2)
        count_plot(df, var1)
        swarm_plot(df, var1, var2)
        violin_plot(df, var1, var2)
        raincloud_plot(df, var1, var2)
        box_plot(df, var1, var2)
    elif tipo1 == "cat" and tipo2 == "cat":
        crosstab_plot(df, var1, var2)
        mosaic_plot(df, var1, var2)
        heatmap_plot(df, var1, var2)
        stacked_bar_chart(df, var1, var2)
        grouped_bar_chart(df, var1, var2)
    else:
        print("Este script no está diseñado para analizar dos variables numéricas.")
