<a href="https://colab.research.google.com/github/NoeliaFerrero/Python-PANDAS/blob/main/Visualizaciones_plotly.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Visualizaciones con Plotly

Pueden encontrar mucha más información en el siguiente link.

https://plotly.com/python/plotly-express/

In [None]:
import plotly.express as px

## Cargar dataset

Para los gráficos, utilizaremos un famoso set de datos conocido como IRIS. 

Contiene información sobre 3 tipos de flores diferentes: Setosa, Versicolor y virginica.

Las otras columnas son las medidas de los pétalos y los sépalos de las flores.


In [None]:
df = px.data.iris()

In [None]:
df.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,species_id
0,5.1,3.5,1.4,0.2,setosa,1
1,4.9,3.0,1.4,0.2,setosa,1
2,4.7,3.2,1.3,0.2,setosa,1
3,4.6,3.1,1.5,0.2,setosa,1
4,5.0,3.6,1.4,0.2,setosa,1


## Gráficos de puntos

Los parámetros básicos que recibe este gráfico son:

- df : (el dataset)
- x : la columna que vamos a dibujar en el eje horizontal
- y : la columna que vamos a dibujar en el eje vertical

Para nuestro ejemplo, en el eje horizontal (x) vamos a graficar el ancho de los sépalos y en el eje vertical (y) vamos a graficar el largo del sépalo. 

Finalmente, le asignamos un color diferente a cada especie.

In [None]:
fig = px.scatter(df, 
                 x="sepal_width", 
                 y="sepal_length", 
                 color="species")
fig.show()

En el siguiente gráfico le agregamos el parpametro *size* que va a hacer puntos más grandes o pequeños de acuerdo al petal_width (ancho del pétalo).

*Nota: Observamos que las especie setosa tiene los pétalos menos anchos porque los puntos de color violeta son más pequeños que los de las otras especies*

In [None]:
fig = px.scatter(df, 
                 x="sepal_width", 
                 y="sepal_length", 
                 color="species",
                 size="petal_width")
fig.show()

También podemos agregar gráficos secundarios en los márgenes. En el gráfico de abajo, le agregamos un boxplot al margen vertical con el parámetro: *marginal_y*.

El boxplot sirve para ver en donde se concentran los valores y para identificar si hay valores extremos. También nos muestra el mínimo y máximo que seria aceptable de cada columna. 

En el siguiente ejemplo, podemos ver que hay un valor extremo para la flor virginia. 

In [None]:
fig = px.scatter(df, 
                 x="sepal_width", 
                 y="sepal_length", 
                 color="species", 
                 marginal_y="box",
           )
fig.show()

En la siguiente imagen, agregamos un segundo boxplot al margel horizontal.

In [None]:
fig = px.scatter(df, 
                 x="sepal_width", 
                 y="sepal_length", 
                 color="species", 
                 marginal_y="box",
                 marginal_x="box",
           )
fig.show()

Finalmente, vamos a agregarle un título al gráfico y cambiarle los títulos a los ejes.

In [None]:
fig = px.scatter(df, 
                 x="sepal_width", 
                 y="sepal_length", 
                 color="species", 
                 marginal_y="box",
                 marginal_x="box",
           )
fig.update_layout(title='Especies de Flores',
                  yaxis_title='Largo del sépalo',
                  xaxis_title='Ancho del sépalo')

fig.show()

## Graficos de barras

Para ver estos gráficos, vamos a utilizar un set de datos diferente. Los datos son de un restaurante y muestra el precio de la comida (total_bill) y la propina (bill)

In [None]:
df = px.data.tips()
df.head()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.5,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4


Para el primer gráfico, vamos a mostrar la propina que dejaron los clientes por día.

In [None]:
fig = px.bar(df, 
             x="day",
             y="total_bill", 
             )
fig.show()

Al gráfico anterior, podemos agregarle el parámetro color para que nos pinte el valor de otra columnas. Por ejemplo si elegimos que pinte de color diferente el sexo, vamos a ver cuanta propina dejoron los hombres y las mujeres cada día.

In [None]:
fig = px.bar(df, 
             x="day",
             y="total_bill", 
             color="sex",
             )
fig.show()

Al gráfico anterior, también podemos sumarle el parámetro *barmode* para que las propinas de hombres y mujeres aparezcan una al lado de la otra. 

In [None]:
fig = px.bar(df, 
             x="day",
             y="total_bill", 
             color="sex",
             barmode='group'
             )
fig.show()

## Gráficos de tortas

El siguiente gráfico de torta muestra las propinas (tip) por día de la semana. Observamos que los findes de semana (Saturday y Sunday) los clientes dan más propina. 

In [None]:
fig = px.pie(df, 
             values='tip', 
             names='day')
fig.show()

El siguiente gráfico de torta muestra las propinas (tip) por time, es decir si fue una cena o almuerzo. Observamos que en las cenas, los clientes dejan más propinas.

Si agregamos el parámetro *hole*, le podemos poner un hueco en el centro.

In [None]:
fig = px.pie(df, 
             values='tip', 
             names='time',
             hole=0.4)
fig.show()

También podemos agregarle títulos al gráfico.

In [None]:
fig = px.pie(df, 
             values='tip', 
             names='time',
             hole=0.4)
fig.update_layout(title='Gráfico de torta')
fig.show()