# 🚀 Practicando con Plotly 📊


**Dataset:** Para estos ejercicios, utilizaremos el conjunto de datos `tips`, que viene incluido en Plotly Express. Este dataset contiene información sobre propinas dadas en un restaurante, incluyendo el total de la factura, la propina, el sexo del pagador, si era fumador, el día, la hora y el tamaño del grupo.

**Instrucciones:**
1. Lee atentamente cada enunciado.
2. Utiliza una celda de código debajo de cada enunciado para escribir tu solución en Python usando Plotly.
3. Intenta usar `plotly.express` (importado como `px`) para la mayoría de los gráficos. Si necesitas más personalización, puedes recurrir a `plotly.graph_objects` (importado como `go`).
4. No dudes en usar `pandas` para cualquier manipulación de datos previa que necesites (filtrados, agrupaciones, creación de nuevas columnas, etc.).
5. ¡Experimenta y diviértete creando visualizaciones interactivas!

Comencemos importando las librerías necesarias y cargando el dataset.

In [3]:
# !pip install plotly

In [4]:
import plotly.express as px
import plotly.graph_objects as go
import pandas as pd
import numpy as np # Lo incluimos por si es necesario para alguna manipulación

# Cargar el dataset "tips"
df_tips = px.data.tips()

# Echar un primer vistazo a los datos
print("Primeras filas del dataset 'tips':")
print(df_tips.head())

print("\nInformación del DataFrame:")
df_tips.info()

print("\nEstadísticas descriptivas:")
df_tips.describe()

Primeras filas del dataset 'tips':
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4

Información del DataFrame:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 244 entries, 0 to 243
Data columns (total 7 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   total_bill  244 non-null    float64
 1   tip         244 non-null    float64
 2   sex         244 non-null    object 
 3   smoker      244 non-null    object 
 4   day         244 non-null    object 
 5   time        244 non-null    object 
 6   size        244 non-null    int64  
dtypes: float64(2), int64(1), object(4)
memory usage: 13.5+ KB

Estadísticas descriptivas:


Unnamed: 0,total_bill,tip,size
count,244.0,244.0,244.0
mean,19.785943,2.998279,2.569672
std,8.902412,1.383638,0.9511
min,3.07,1.0,1.0
25%,13.3475,2.0,2.0
50%,17.795,2.9,2.0
75%,24.1275,3.5625,3.0
max,50.81,10.0,6.0


--- 
## Ejercicio 1: Relación entre Factura y Propina (Scatter Plot)

**Pregunta de Negocio:** Como dueños del restaurante, queremos entender la relación básica entre el importe total de la factura y la propina que dejan los clientes. ¿A mayor factura, mayor propina?

**Tarea:** Crea un gráfico de dispersión (`scatter plot`) que muestre `total_bill` en el eje X y `tip` en el eje Y. Asegúrate de que el gráfico tenga un título claro y etiquetas adecuadas para los ejes.

In [3]:


fig_scatter_basic = px.scatter(df_tips,
                               x="total_bill",
                               y="tip",
                               title="Factura vs propina")

# Mostrar el gráfico
fig_scatter_basic.show()

--- 
## Ejercicio 2: Factura vs. Propina con Más Dimensiones (Scatter Plot Avanzado)

**Pregunta de Negocio:** Queremos profundizar en la relación factura-propina. ¿Influye si el cliente es fumador? ¿Y el tamaño del grupo tiene algún efecto visible?

**Tarea:** Partiendo del gráfico anterior:
1. Colorea los puntos según si el cliente es `smoker` (fumador) o no.
2. Haz que el tamaño de los puntos (`size` del marcador) represente el `size` (número de comensales en la mesa).
3. Personaliza la información que aparece al pasar el ratón (`hover_data`) para que muestre también el día (`day`) y la hora (`time`).
4. Añade un título descriptivo.

In [9]:

fig_scatter_basic = px.scatter(df_tips,
                               x="total_bill",
                               y="tip",
                               color="smoker",        
                               size="size",             
                               hover_data = ["day", "time"],
                               title="Factura vs propina")

# Mostrar el gráfico
fig_scatter_basic.show()

--- 
## Ejercicio 3: Día de la Semana con Mayores Propinas (Bar Chart)

**Pregunta de Negocio:** ¿Qué día de la semana es el más lucrativo en términos de propinas totales recaudadas? Esto podría ayudarnos a planificar mejor los turnos del personal.

**Tarea:** Crea un gráfico de barras (`bar chart`) que muestre la suma total de propinas (`tip`) para cada día de la semana (`day`). Ordena las barras para identificar fácilmente el día con más propinas. Añade un título y etiquetas claras.

Para ordenar la categorías: category_orders={'day': ['Thur', 'Fri', 'Sat', 'Sun']} # Opcional para orden específico

--- 
## Ejercicio 4: Comparativa de Factura Media: Comida vs. Cena (Bar Chart Agrupado)

**Pregunta de Negocio:** ¿Existen diferencias significativas en el importe medio de la factura entre las comidas (`Lunch`) y las cenas (`Dinner`) para cada día de la semana?

**Tarea:** Crea un gráfico de barras que compare el importe medio de la factura (`total_bill`) para `Lunch` y `Dinner` en cada `day` de la semana. Puedes usar barras agrupadas (`barmode='group'`).
*Pista: Necesitarás agrupar los datos por `day` y `time` y calcular la media de `total_bill`.*

`category_orders={'day': ['Thur', 'Fri', 'Sat', 'Sun'], 'time': ['Lunch', 'Dinner']}`

--- 
## Ejercicio 5: Distribución del Importe de las Facturas (Histogram)

**Pregunta de Negocio:** ¿Cuál es el rango de importes de factura más frecuente en nuestro restaurante? ¿La mayoría de las facturas son bajas, medias o altas?

**Tarea:** Crea un histograma (`histogram`) de la columna `total_bill`. Experimenta con el número de `bins` (contenedores) para obtener una buena visualización de la distribución. Añade un título claro.

si quereis el rug: `marginal="rug" # Opcional: añade 'rug plot'`

--- 
## Ejercicio 6: Distribución de Propinas por Día (Box Plot)

**Pregunta de Negocio:** Queremos comparar cómo se distribuyen las propinas a lo largo de los diferentes días de la semana. ¿Hay días con mayor variabilidad o con medianas de propina consistentemente más altas?

**Tarea:** Crea un diagrama de caja (`box plot`) que muestre la distribución de las propinas (`tip`) para cada día de la semana (`day`). Colorea las cajas por día para una mejor distinción y asegúrate de que el gráfico tenga un título.

Para poner los puntos: `points="all" # Muestra todos los puntos además de la caja`

--- 
## Ejercicio 7: Propinas por Sexo y Condición de Fumador (Box Plot con Agrupación)

**Pregunta de Negocio:** ¿Existen diferencias en la distribución de las propinas basadas en el sexo (`sex`) del pagador y si el grupo incluía fumadores (`smoker`)?

**Tarea:** Crea un diagrama de caja (`box plot`) que muestre la distribución de las propinas (`tip`). Queremos ver esta distribución separada por `sex` y, adicionalmente, agrupada o coloreada por `smoker`. Elige la mejor manera de presentar esta información (p.ej. `x='sex', color='smoker'` o viceversa). Titula el gráfico apropiadamente.

--- 
## Ejercicio 8: Tendencia del Porcentaje de Propina (Line Plot o Scatter con Línea de Tendencia)

**Pregunta de Negocio:** ¿Los clientes tienden a dejar un porcentaje de propina mayor, menor o igual a medida que aumenta el importe total de la factura?

**Tarea:** 
1. Crea una nueva columna en el DataFrame llamada `tip_percentage` (propina / factura_total * 100).
2. Crea un gráfico de dispersión (`scatter plot`) con `total_bill` en el eje X y `tip_percentage` en el eje Y.
3. (Opcional, pero recomendado) Intenta añadir una línea de tendencia (regresión lineal) a este gráfico de dispersión para visualizar mejor la tendencia general. Plotly Express lo permite con el argumento `trendline='ols'`.
4. Titula el gráfico y etiqueta los ejes.

In [22]:
# !pip install statsmodels

--- 
## Ejercicio 9: Jerarquía de Ingresos por Propinas (Treemap)

**Pregunta de Negocio:** Queremos una vista jerárquica de cómo se componen nuestros ingresos por propinas, primero por día de la semana, y dentro de cada día, por el momento (comida/cena).

**Tarea:** Crea un mapa de árbol (`treemap`) que muestre la jerarquía `day` -> `time` (`path=[px.Constant("Todos"), 'day', 'time']`). El tamaño de los rectángulos debe representar la suma de las propinas (`tip`). Colorea los rectángulos según alguna de estas categorías (o por la propia propina) para hacerlo más informativo. Añade un título.

Usar .update_traces(textinfo = "label+value+percent parent") para mostrar mas info

--- 
## Ejercicio 10: Exploración de Relaciones Numéricas (Scatter Matrix - SPLOM)

**Pregunta de Negocio:** ¿Cómo se relacionan entre sí las variables numéricas principales: `total_bill`, `tip`, y `size` (tamaño del grupo)? ¿Hay alguna agrupación evidente si consideramos el momento del día (`time`)?

**Tarea:** Crea una matriz de dispersión (`scatter_matrix` o SPLOM) para las dimensiones `total_bill`, `tip`, y `size`. Colorea los puntos según la columna `time` (Comida/Cena). Incluye un título.

--- 
## Ejercicio 11: Densidad de Facturas y Propinas (Gráfico de Densidad 2D)

**Pregunta de Negocio (Autonomía):** Para identificar patrones de gasto y propinas, queremos ver dónde se concentran la mayoría de las combinaciones de `total_bill` y `tip`. ¿Hay "zonas calientes"?

**Tarea:** Investiga y crea un **mapa de calor de densidad 2D** (`density_heatmap`) o un **gráfico de contorno de densidad 2D** (`density_contour`). Estos gráficos muestran la densidad de puntos en un espacio bidimensional.
   - Eje X: `total_bill`
   - Eje Y: `tip`
   - El color representará la densidad de observaciones.
   - No olvides el título y las etiquetas.

*Pista: Busca en la documentación de `plotly.express` funciones como `density_heatmap` o `density_contour`.*

--- 
## Ejercicio 12: Factura vs. Propina por Día en Subgráficos (Facet Plot)

**Pregunta de Negocio (Autonomía):** Queremos analizar la relación entre `total_bill` y `tip` de forma individual para cada día de la semana, pero en una sola visualización para facilitar la comparación.

**Tarea:** Crea un gráfico de dispersión de `total_bill` (eje X) vs `tip` (eje Y). Utiliza la funcionalidad de **facetas** (subgráficos) de Plotly Express para generar un subgráfico separado para cada `day` de la semana.
   - Adicionalmente, dentro de cada subgráfico, colorea los puntos según la variable `time` (Lunch/Dinner).
   - Añade un título general al conjunto de gráficos.

*Pista: Busca en la documentación de `plotly.express` argumentos como `facet_row` o `facet_col` en las funciones de gráficos.*

### Ejercicio 13 (Extra): Dashboard Interactivo con ipywidgets (Versión Simplificada)

Pregunta de Negocio (Autonomía): Como analistas, queremos construir un pequeño panel de control interactivo en nuestro notebook. Este panel nos permitirá explorar la relación entre el total_bill y la tip de forma más flexible, cambiando dinámicamente la variable que define el color de los puntos y ajustando su opacidad para una mejor inspección visual de posibles agrupaciones o patrones.

### Tarea:

- Crea un gráfico de dispersión (scatter plot) que muestre total_bill en el eje X y tip en el eje Y.
- Utiliza la función interact de ipywidgets para añadir los siguientes controles interactivos:
    1. Un control que permita al usuario seleccionar una columna categórica del dataset tips (por ejemplo, sex, smoker, day, time) para ser utilizada como la variable de color en el gráfico de dispersión.
    2. Un control que permita al usuario ajustar la opacidad de los marcadores (puntos) en el gráfico, en un rango de 0.1 (casi transparente) a 1.0 (opaco).
    3. El gráfico de dispersión debe actualizarse dinámicamente cada vez que el usuario interactúe con cualquiera de los controles.
- Asegúrate de que el gráfico siempre tenga un título claro y etiquetas adecuadas para los ejes.

### Consideraciones y Pistas:

- Necesitarás importar plotly.express as px y from ipywidgets import interact.
- Define una función que tome como argumentos los valores que controlarán los widgets (la columna para el color y el nivel de opacidad).
- Dentro de esta función, genera tu gráfico de Plotly Express usando estos argumentos.
- La función deberá devolver el objeto figura de Plotly (return fig).
- interact se encargará de crear los widgets automáticamente basándose en los argumentos de tu función (si les pasas listas o tuplas para rangos) y de mostrar el gráfico resultante. https://ipywidgets.readthedocs.io/en/latest/examples/Using%20Interact.html



In [None]:
import plotly.express as px
from ipywidgets import interact # Importar interact

categorical_cols_for_color = ['sex', 'smoker', 'day', 'time']

# 1. Definir la función que genera el gráfico y lo devuelve
def plot_interactive_scatter(color_by_column, marker_opacity):
    """
    Genera un gráfico de dispersión interactivo de total_bill vs tip,
    coloreado por la columna especificada y con la opacidad dada.
    """
     # COMPLETAR AQUI!!!

    return fig # 'interact' mostrará la figura que se devuelve




# Aqui, usar la funcion interact para que interactue la funcion plot_interactive_scatter 
# con un dropdown con las 4 columnas categoricas ['sex', 'smoker', 'day', 'time'] y un slider 
# que vaya de 0.1 a 1 en saltos de 0.5 

interact


In [1]:
import ipywidgets.widgets as w

In [None]:
w.S

In [None]:
def doble(numero):
    return 2*numero

w.interact(doble, numero=w.IntSlider());


interactive(children=(IntSlider(value=0, description='numero'), Output()), _dom_classes=('widget-interact',))