# Probabilidad y estadística interactiva

## using

* ipywidgets
* seaborn

* voila
* reveal

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
from scipy.stats import t
from scipy.stats import expon
from scipy.stats import binom
from scipy.stats import uniform
import ipywidgets as widgets
from IPython.display import display
from IPython.display import display_html
import seaborn as sns
import pandas as pd
import plotly.express as px
import ipywidgets
import plotly.figure_factory as ff

### Número de bines en un histograma

- No hay un número "mejor" de bines. Diferentes números de bines pueden revelar diferentes características de los datos.
- Aunque existen varias pautas y reglas generales para determinar un número "óptimo" de bines, estos métodos generalmente hacen fuertes suposiciones sobre la forma de la distribución. 
  - Según la distribución real de los datos y los objetivos del análisis, pueden ser apropiados diferentes anchos de intervalo, por lo que generalmente **se necesita experimentación para determinar un número de bines apropiado.** 
  
- Vaya a la diapositiva abajo y determine el número adecuado de bines. 

In [2]:
np.random.seed(123)
size = 100

# create some exponential random data
values = expon.rvs(scale=1/4, size=size)

# Create gaussian noise
noise = norm.rvs(loc=1, size=size)

real_data = values + np.abs(noise)

def hist_bins(b):
    plt.figure(figsize=(8,6))
    #plt.hist(real_data, bins=b, density=True, edgecolor="seagreen")
    ax = sns.histplot(x=real_data, bins=b, stat="density", kde=True)
    ax.lines[0].set_color('crimson')

b = widgets.SelectionSlider(options=list(range(1,11))+[20, 30, 50, 100], value=2,
    description='Número de bines',
    layout=widgets.Layout(width='70%'))
b.style = {'description_width': '300px'}

ui = widgets.VBox(children=[b])

out = widgets.interactive_output(hist_bins, {'b': b})

display(ui, out)

VBox(children=(SelectionSlider(description='Número de bines', index=1, layout=Layout(width='70%'), options=(1,…

Output()

In [3]:
l = widgets.Label("¿El número adecuado de bines es?")

n = widgets.Dropdown(options=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10], value=1,
    description='Seleccione un número de bines',
    layout=widgets.Layout(width='70%'))
n.style = {'description_width': '300px'}

a = widgets.Text(value=" ",
    description='La respuesta es',
    layout=widgets.Layout(width='70%'))
a.style = {'description_width': '300px'}

ui = widgets.VBox(children=[l, n, a])

def answer(n):
    if n==4:
        a.value = "Correcta!"
    else:
        a.value = "Incorrecta!"

out = out = widgets.interactive_output(answer, {'n': n})
display(ui, out)

VBox(children=(Label(value='¿El número adecuado de bines es?'), Dropdown(description='Seleccione un número de …

Output()

### Explorando la correlación

- A continuación se muestran ejemplos de diagramas de dispersión de varios conjuntos de datos con varios coeficientes de correlación.
- Vaya a la diapositiva abajo y seleccione el coeficiente de correlación entre -1 y 1. 
- También puede cambiar el tamaño de la muestra y observar la correlación de acuerdo al número de puntos observados. 

In [4]:
mean = [0, 0]

def cov_plot(c, n, l):
    np.random.seed(123456)
    cov = [[1, c], [c, 1]]
    x, y = np.random.multivariate_normal(mean, cov, n).T
    data = pd.DataFrame({'x': x, 'y': y})
    s = sns.lmplot(data=data, x='x', y='y', height=7, aspect=1, fit_reg=l,
                   scatter_kws={"s": 20, 'alpha': 0.5, 'color': "seagreen"},
                   line_kws={'color': 'orange'}
                  )

c = widgets.SelectionSlider(value=0, options=[-1.0, -0.9, -0.8, -0.7, -0.6, 
                                              -0.5, -0.4, -0.3, -0.2, -0.1] + 
                            [0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0],
                            description='Correlación',
                            layout=widgets.Layout(width='70%'))
c.style = {'description_width': '300px'}

n = widgets.SelectionSlider(value=100, 
                            options=list(range(10,101,10))+[200, 500, 1000, 5000],
                            description='Tamaño de muestra',
                            layout=widgets.Layout(width='70%'))
n.style = {'description_width': '300px'}

l = widgets.Checkbox(
    value=True,
    description='Regresión lineal',
    layout=widgets.Layout(width='70%'))
l.style = {'description_width': '300px'}

ui = widgets.VBox(children=[c, n, l])

out = widgets.interactive_output(cov_plot, {'c':c, 'n': n, 'l': l})

display(ui, out)

VBox(children=(SelectionSlider(description='Correlación', index=10, layout=Layout(width='70%'), options=(-1.0,…

Output()

### Función de masa y función acumulada de probabilidad

- Para una variable aleatoria discreta $X$ con valores posibles $x_1, x_2, x_3, \cdots , x_n$, una función de masa de probabilidad $f(x_i)$ es una función que cumple las siguientes condiciones:
    
  1. $f(x_i) \geq 0$
  2. $\sum^n_{i=1} f(x_i) = 1$
  3. $f(x_i) = P(X = x_i)$
  
- Para una variabel aleatoria discreta $X$, la Función de Distribución Acumulada $F(x)$ satisface las siguientes propiedades:
  1. $F(x)=P(X \leq x) = \sum_{x_i \leq x} f(x_i)$
  2. $0 \leq F(x) \leq 1$
  3. Si $x \leq y$, entonces $F(x) \leq F(y)$

In [5]:
def centered(content):
    display_html(f"<center>{content}</center>", raw=True)

def pmf_cdf(a, b, c):
    d = pd.DataFrame({"x": [-1, 0, 1, 4], "p(x)": ['0.2', '0.5', a, '0.1'],
                      "F(x)": [b, '0.7', c, '1.0'],
                     })
    
    true_values = {"a": "0.2", "b": "0.2", "c": "0.9"}
    
    correct_values = {v: eval(v).value==true_values[v] for v in true_values}
    
    lf.value = "Su respuesta es: "+', '.join(["("+tv+") Correcta" if correct_values[tv] 
                                              else "("+tv+") Incorrecta" 
               for i, tv in enumerate(correct_values)])+"."
    
    centered(d.to_html(index=False))

l = widgets.Label(r"De los valores de a, b y c.")
lf = widgets.Label("")

a = widgets.Dropdown(options=['a', '0.0', '0.1', '0.2', '0.5', '0.8', '0.9', '1.0'], value='a',
    description='Valor de a',
    layout=widgets.Layout(width='70%'))
a.style = {'description_width': '300px'}

b = widgets.Dropdown(options=['b', '0.0', '0.1', '0.2', '0.5', '0.8', '0.9', '1.0'], value='b',
    description='Valor de b',
    layout=widgets.Layout(width='70%'))
b.style = {'description_width': '300px'}

c = widgets.Dropdown(options=['c', '0.0', '0.1', '0.2', '0.5', '0.8', '0.9', '1.0'], value='c',
    description='Valor de c',
    layout=widgets.Layout(width='70%'))
c.style = {'description_width': '300px'}

ui = widgets.VBox(children=[l, lf, a, b, c])
out = widgets.interactive_output(pmf_cdf, {'a': a, 'b': b, 'c': c})

display(ui, out)

VBox(children=(Label(value='De los valores de a, b y c.'), Label(value='Su respuesta es: (a) Incorrecta, (b) I…

Output()

### Lanzando monedas (distribución binomial)

- Para la siguiente distribución binomial, elija el número de monedas $n$ que desea lanzar
$X\sim binom(p=0.5, n)$. 
- El resultado cuenta el número de caras obtenidas al lanzar $n$ monedas. 

  - Por ejemplo al lanzar 2 monedas pueden obtenerse $x \in \{0, 1, 2\}$ caras. 

- Elija el número de lanzamientos que desea realizar, a medida que este número sea más grande, más cercano será el valor observado en la muestra al valor teórico (PMF). 

In [6]:
def coin(n, p, s):
    X = binom.rvs(n, p, size=s)
    x, freq = np.unique(X, return_counts=True)
    plt.figure(figsize=(8,6))
    plt.bar(x, freq/s, label="Simulación")
    plt.xlabel("Número de caras")
    if n == 100:
        plt.xticks(range(x.min(), x.max()+1, 2))
    else:
        plt.xticks(x)
    plt.plot(x, binom.pmf(x, n, p), ':or', label="PMF")
    plt.legend()

n = widgets.SelectionSlider(options=list(range(1,11))+[10, 50, 100], value=1,
    description='Número de monedas a lanzar',
    layout=widgets.Layout(width='70%'))
n.style = {'description_width': '300px'}

p = widgets.SelectionSlider(value=0.5, options=[0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9],
                            description='Probabilidad (cara)',
                            layout=widgets.Layout(width='70%'))
p.style = {'description_width': '300px'}

s = widgets.Dropdown(options=[10, 100, 1000, 10000, 100000], value=100,
    description='Número de lanzamientos',
    layout=widgets.Layout(width='70%'))
s.style = {'description_width': '300px'}

ui = widgets.VBox(children=[n, p, s])

out = widgets.interactive_output(coin, {'n': n, 's': s, 'p': p})

display(ui, out)

VBox(children=(SelectionSlider(description='Número de monedas a lanzar', layout=Layout(width='70%'), options=(…

Output()

### Teorema del límte central

- Elija el tamaño de muestra $n$ para el cual quiere calcular la media muestral $\bar{X}$. 
  - Este proceso se repite muchas veces y se grafica un histograma de la media muestral.
- Se grafica la PDF de la distribución normal $\bar{X} \sim N(\mu, \sigma^2/\sqrt{n})$.
  - El teorema del límite central nos dice que $\bar{X}$ sigue dicha distribución para un tamaño lo suficientemente grande de $n$. 
- El muestreo proviene de 2 distribuciones:
  - Uniforme $X\sim U(a=0, b=1)$ con: $\mu=1/2,\ \sigma^2 = 1/12$.
  - Exponencial $X\sim Expon(\lambda=2)$ con: $\mu=2,\ \sigma^2 = 4$.

In [7]:
def clt(n, dist):
    simulations = 10000
    if dist=="Uniforme":
        X_bar = np.random.random(size=(simulations,n)).mean(axis=1)
        mu, sigma2 = 1/2, 1/12  # mu, sigma of the population distribution
    if dist=="Exponencial":
        X_bar = expon.rvs(scale=2, size=(simulations,n)).mean(axis=1)
        mu, sigma2 = 2, 4  # mu, sigma of the population distribution
    plt.figure(figsize=(8,6))
    plt.hist(X_bar, bins=40, density=True, edgecolor="seagreen", label=r"$\bar{X}$")
    xl, xu = X_bar.min(), X_bar.max()
    x = np.linspace(xl, xu, 500)
    plt.plot(x, norm.pdf(x, loc=mu, scale=np.sqrt(sigma2/n)), 
             linewidth=2, color="crimson", label=r"$N(\mu, \sigma^2/\sqrt{n})$")
    plt.legend()
    

n = widgets.Dropdown(options=[1, 2, 5, 10, 30, 100], value=1,
    description='Tamaño de muestra',
    layout=widgets.Layout(width='70%'))
n.style = {'description_width': '300px'}

dist = widgets.Dropdown(options=["Uniforme", "Exponencial"], value="Uniforme",
                       description='Distribución',
    layout=widgets.Layout(width='70%'))
dist.style = {'description_width': '300px'}

ui = widgets.VBox(children=[n, dist])

out = widgets.interactive_output(clt, {'n': n, 'dist': dist})

display(ui, out)

VBox(children=(Dropdown(description='Tamaño de muestra', layout=Layout(width='70%'), options=(1, 2, 5, 10, 30,…

Output()

### Exactitud y precisión de un estimador $\theta_j$


<img src="https://raw.githubusercontent.com/marsgr6/r-scripts/master/imgs/Illustration-of-the-precision-and-the-accuracy-of-an-estimator.png" alt="drawing" width="400"/>

In [8]:
def throw_darts(n, e, p):
    smx, smy = [np.random.choice([-1, 1], size=2)][0]
    exactitud = {'Alta': (0, 0), 'Media': (0.5, 0.5), 'Baja': (2, 2)}
    precision = {'Alta': (0.1, 0.1), 'Media': (0.25, 0.25), 'Baja': (1, 1)}
    mx, my = exactitud[e]
    sx, sy = precision[p]
    mx *= smx; my *= smy
    dart_x = norm.rvs(mx, sx, size=n)
    dart_y = norm.rvs(my, sy, size=n)

    plt.figure(figsize=(8,8))

    plt.plot(0, 0, 'ok', label="Target")
    plt.plot(dart_x, dart_y, 'x')

    circle1 = plt.Circle((0,0),1,color='b', fill=False)
    plt.gcf().gca().add_artist(circle1)
    circle1 = plt.Circle((0,0),2,color='g', fill=False)
    plt.gcf().gca().add_artist(circle1)
    circle1 = plt.Circle((0,0),3,color='r', fill=False)
    plt.gcf().gca().add_artist(circle1)

    plt.xlim(-5, 5)
    plt.ylim(-5, 5)
    plt.gca().set_aspect('equal', adjustable='box')
    plt.legend()
    

n = widgets.Dropdown(options=[10, 20, 30, 50, 100], value=10,
    description='Tamaño de muestra',
    layout=widgets.Layout(width='70%'))
n.style = {'description_width': '300px'}

e = widgets.Dropdown(options=["Alta", "Media", "Baja"], value="Alta",
                       description='Exactitud',
    layout=widgets.Layout(width='70%'))
e.style = {'description_width': '300px'}

p = widgets.Dropdown(options=["Alta", "Media", "Baja"], value="Alta",
                       description='Precisión',
    layout=widgets.Layout(width='70%'))
p.style = {'description_width': '300px'}

ui = widgets.VBox(children=[n, e, p])

out = widgets.interactive_output(throw_darts, {'n': n, 'e': e, 'p': p})

display(ui, out)

VBox(children=(Dropdown(description='Tamaño de muestra', layout=Layout(width='70%'), options=(10, 20, 30, 50, …

Output()

### Exactitud y precisión

- Experimenta por tu cuenta

In [9]:
def throw_darts(mx, my, sx, sy, n=20):
    dart_x = norm.rvs(mx, sx, size=n)
    dart_y = norm.rvs(my, sy, size=n)

    plt.figure(figsize=(8,8))

    plt.plot(0, 0, 'ok', label="Target")
    plt.plot(dart_x, dart_y, 'x')

    circle1 = plt.Circle((0,0),1,color='b', fill=False)
    plt.gcf().gca().add_artist(circle1)
    circle1 = plt.Circle((0,0),2,color='g', fill=False)
    plt.gcf().gca().add_artist(circle1)
    circle1 = plt.Circle((0,0),3,color='r', fill=False)
    plt.gcf().gca().add_artist(circle1)

    plt.xlim(-5, 5)
    plt.ylim(-5, 5)
    plt.gca().set_aspect('equal', adjustable='box')
    plt.legend()
    

mx = widgets.SelectionSlider(value=0, options=[-2, -1, -0.5, 0, 0.5, 1, 2],
                            description='Media X',
                            layout=widgets.Layout(width='70%'))
mx.style = {'description_width': '300px'}

my = widgets.SelectionSlider(value=0, options=[-2, -1, -0.5, 0, 0.5, 1, 2],
                            description='Media Y',
                            layout=widgets.Layout(width='70%'))
my.style = {'description_width': '300px'}

sx = widgets.SelectionSlider(value=0.1, options=[0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.75, 1.0],
                            description='Desviación X',
                            layout=widgets.Layout(width='70%'))
sx.style = {'description_width': '300px'}

sy = widgets.SelectionSlider(value=0.1, options=[0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.75, 1.0],
                            description='Desviación Y',
                            layout=widgets.Layout(width='70%'))
sy.style = {'description_width': '300px'}

ui = widgets.VBox(children=[mx, my, sx, sy])

out = widgets.interactive_output(throw_darts, {'mx': mx, 'my': my, 'sx': sx, 'sy': sy})

display(ui, out)

VBox(children=(SelectionSlider(description='Media X', index=3, layout=Layout(width='70%'), options=(-2, -1, -0…

Output()

### Intervalo t de confianza para la media

- Vamos a realizar un muestreo de una distribución normal estándar $X\sim N(0,1)$.
- Construiremos un intervalo t para la media. 
- Vea como cambia el ancho del intervalo de acuerdo al nivel de confianza y al tamaño de muestra. 

In [10]:
def interval(nc, n, size=100):
    alpha = 1 - nc
    df = n - 1  # grados de libertad para t

    # Estamos muestreando la distribución uniforme estándar
    mu = 0  # mu: media poblacional

    U = norm.rvs(size=(size,n))  # uniform rvs
    Um = np.mean(U, axis=1)  # media muestral 
    Us = np.std(U, ddof=1, axis=1)  # varianza muestral
    se = Us / np.sqrt(n)  # error estándar

    ICL, ICU = t.interval(1-alpha, df, loc=Um, scale=se)  # Intervalo de confianza 

    CI = np.vstack([ICL, ICU]).transpose()  # unimos ICL, ICU en 2 columnas
    # comprobamos que mu está en el intervalo
    # para esto debe cumplirse que limite inferior < mu y límite superior mayor que mu
    # np.logical_and(CI[:,0] < mu, CI[:,1] > mu)
    # ubicamos los índices donde se cumple la condición anterior 
    # np.where(condicion)[]
    cont = np.where(np.logical_and(CI[:,0] < mu, CI[:,1] > mu))[0]

    plt.figure(figsize=(8,8))

    # Graficamos cada intervalo como una línea horizontal
    # Si el intervalo contiene la media poblacinal mu es negro
    # rojo en caso contrario
    for pos, limits in enumerate(CI):
        if pos in cont:  # está dentro del intervalo
            col = 'k'  # color negro
        else:  # está fuera del intervalo
            col = 'r'  # color rojo
        plt.hlines(pos+1, limits[0], limits[1], colors=col)  # línea horizontal
        plt.plot(Um[pos], pos+1, '.', c=col)

    plt.vlines(mu, 0, size+1, colors='b', label=r"$\mu$")
    plt.legend()

    # Contemos cuantas veces el intervalo contiene la media poblacional
    # Si el intervalo (lineal horizontal) contiene la media, este se intersecta con la línea vertical azul
    l.value = "La media poblacional está en el intervalo "+str(np.shape(cont)[0]/size*100)+"% de las veces."
    
    
nc = widgets.SelectionSlider(value=0.9, options=[0.68, 0.9, 0.95, 0.99],
                            description='Nivel de confianza',
                            layout=widgets.Layout(width='70%'))
nc.style = {'description_width': '300px'}

n = widgets.Dropdown(options=[10, 30, 100, 500, 1000], value=30,
    description='Tamaño de muestra',
    layout=widgets.Layout(width='70%'))
n.style = {'description_width': '300px'}

l = widgets.Label(" ")

ui = widgets.VBox(children=[nc, n, l])

out = widgets.interactive_output(interval, {'nc': nc, 'n': n})

display(ui, out)

VBox(children=(SelectionSlider(description='Nivel de confianza', index=1, layout=Layout(width='70%'), options=…

Output()

### Bono: Análisis exploratorio

- Para realizar un análisis exploratorio de datos (EDA), así como para visualizar efectivamente un conjunto de datos es necesario tener interactividad. 
  - La interactividad permite flexibilidad al usuario para elegir las variables a explorar. 

- Para la interactividad usaremos **ipywidgets** junto con **seaborn** para visualizar los datos. 

  - Vea el siguiente [enlace](https://ppeng08.medium.com/interactive-visualization-for-exploratory-data-analysis-in-jupyter-notebook-adc826e1e76a).

In [11]:
tips = sns.load_dataset("tips")
@ipywidgets.interact
def plot(col=tips.select_dtypes(include = 'category').columns):          # categorical univariate plot
    plt.figure(figsize=(8,6))
    sns.countplot(y=col, data=tips);                                     # y indicates horizontal plot

interactive(children=(Dropdown(description='col', options=('sex', 'smoker', 'day', 'time'), value='sex'), Outp…

In [12]:
@ipywidgets.interact
def plot(col_x=tips.select_dtypes(include = 'float').columns, 
         hue=tips.select_dtypes(include = 'category').columns,
         element=["bars", "step", "poly"]
        ):
    sns.displot(data=tips, x=col_x, hue=hue, element=element);

interactive(children=(Dropdown(description='col_x', options=('total_bill', 'tip'), value='total_bill'), Dropdo…

In [13]:
@ipywidgets.interact
def plot(var_x=tips.select_dtypes(include = 'category').columns, 
         var_y=tips.select_dtypes(include = 'float').columns,
         hue=tips.select_dtypes(include = 'category').columns,
         tplot=["boxplot", "lineplot"]
        ):         
    if tplot == "boxplot":
        sns.boxplot(data=tips, x=var_x, y=var_y, hue=hue);
    else:
        sns.lineplot(data=tips, x=var_x, y=var_y, hue=hue, 
                     err_style="bars", ci=68, estimator='mean')

interactive(children=(Dropdown(description='var_x', options=('sex', 'smoker', 'day', 'time'), value='sex'), Dr…

In [14]:
@ipywidgets.interact
def plot(col_x=tips.select_dtypes(include = 'float').columns, 
         col_y=tips.select_dtypes(include = 'float').columns, 
         hue=tips.select_dtypes(include = 'category').columns,
         size=tips.select_dtypes(include = 'category').columns
        ): 
    sns.scatterplot(data=tips, x=col_x, y=col_y, hue=hue, size=size)

interactive(children=(Dropdown(description='col_x', options=('total_bill', 'tip'), value='total_bill'), Dropdo…

In [15]:
@ipywidgets.interact
def plot(col=tips.select_dtypes(include = 'category').columns,
         hue=tips.select_dtypes(include = 'category').columns,
        ):          # categorical univariate plot
    sns.countplot(x=col, hue=hue, data=tips);

interactive(children=(Dropdown(description='col', options=('sex', 'smoker', 'day', 'time'), value='sex'), Drop…

### Bono: Análisis exploratorio

- Replicamos el ejercicio anterior usando **plotly** en lugar de seaborn. 
- Plotly crea gráficos interactivos a diferencia de los gráficos estáticos de seaborn. 

In [21]:
tips = sns.load_dataset("tips")
@ipywidgets.interact
def plot(col=tips.select_dtypes(include = 'category').columns):
    df = tips.groupby(by=[col]).size().reset_index(name="counts")
    fig = px.bar(data_frame=df, x=col, y="counts", color=col)
    fig.show()

interactive(children=(Dropdown(description='col', options=('sex', 'smoker', 'day', 'time'), value='sex'), Outp…

In [22]:
@ipywidgets.interact
def plot(col_x=tips.select_dtypes(include = 'float').columns, 
         hue=tips.select_dtypes(include = 'category').columns,
         marginal=["box", "violin", "rug"]
        ):
    fig = px.histogram(data_frame=tips, x=col_x, color=hue, marginal=marginal)
    fig.show()

interactive(children=(Dropdown(description='col_x', options=('total_bill', 'tip'), value='total_bill'), Dropdo…

In [23]:
@ipywidgets.interact
def plot(col_x=tips.select_dtypes(include = 'float').columns, 
         hue=tips.select_dtypes(include = 'category').columns
        ):
    group_labels = tips[hue].unique()
    groups = []
    for gl in group_labels:
        groups += [tips[col_x][tips[hue]==gl]]
    fig = ff.create_distplot(groups, group_labels)
    fig.show()

interactive(children=(Dropdown(description='col_x', options=('total_bill', 'tip'), value='total_bill'), Dropdo…

In [24]:
@ipywidgets.interact
def plot(col_x=tips.select_dtypes(include = 'float').columns, 
         col_y=tips.select_dtypes(include = 'float').columns, 
         hue=tips.select_dtypes(include = 'category').columns,
         marker=tips.select_dtypes(include = 'category').columns
        ): 
    fig = px.scatter(data_frame=tips, x=col_x, y=col_y, color=hue, symbol=marker)
    fig.show()

interactive(children=(Dropdown(description='col_x', options=('total_bill', 'tip'), value='total_bill'), Dropdo…

In [25]:
from plotly.offline import iplot

@ipywidgets.interact
def plot(col=tips.select_dtypes(include = 'category').columns,
         hue=tips.select_dtypes(include = 'category').columns,
        ):          # categorical univariate plot
    if col==hue:
        df = tips.groupby(by=[col]).size().reset_index(name="counts")
    else:
        df = tips.groupby(by=[col, hue]).size().reset_index(name="counts")
    fig = px.bar(data_frame=df, x=col, y="counts", color=hue, barmode="group")
    fig.show()

interactive(children=(Dropdown(description='col', options=('sex', 'smoker', 'day', 'time'), value='sex'), Drop…