In [None]:
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
import plotly.graph_objects as go

In [None]:
# Matplotlib inline para visualizar los gráficos de Matplotlib
#Para que se vean los gráficos en el notebook
%matplotlib inline 
#Para que se vean los gráficos en alta resolución
%config Inlinebackend.figure_format= 'retina' 
# Configuración para setear y que todas las fig de Seaborn salgan por defecto con este tamaño
# Se puede especificar el tamaño de cada figura
sns.set_context("poster") #paper, notebook, talk, poster
sns.set(rc={"figure.figsize": (12.,6.)}) #Tamaño de las figuras
sns.set_style("darkgrid") #darkgrid, whitegrid, dark, white, ticks

In [None]:
from IPython.display import HTML
import random

def hide_toggle(for_next=False):
    this_cell = """$('div.cell.code_cell.rendered.selected')"""
    next_cell = this_cell + '.next()'

    toggle_text = 'Pista'  # text shown on toggle link
    target_cell = this_cell  # target cell to control with toggle
    js_hide_current = ''  # bit of JS to permanently hide code in current cell (only when toggling next cell)

    if for_next:
        target_cell = next_cell
        toggle_text += ' next cell'
        js_hide_current = this_cell + '.find("div.input").hide();'

    js_f_name = 'code_toggle_{}'.format(str(random.randint(1,2**64)))

    html = """
        <script>
            function {f_name}() {{
                {cell_selector}.find('div.input').toggle();
            }}

            {js_hide_current}
        </script>

        <a href="javascript:{f_name}()">{toggle_text}</a>
    """.format(
        f_name=js_f_name,
        cell_selector=target_cell,
        js_hide_current=js_hide_current, 
        toggle_text=toggle_text
    )

    return HTML(html)

## 1. Carga el set de datos mpg de seaborn.

In [None]:
mpg = sns.load_dataset('mpg')
mpg

## 2. Haz un grafico de barras para ver cuantas coches provienen de cada país.

In [None]:
fig = px.bar(mpg, x=mpg['origin'], color='origin' )
fig.show()

## 3. Seaborn tiene muchos tipos de paletas, por ejemplo: deep , muted , pastel , bright , dark , y colorblind. Prueba a cambiar la paleta del anterior grafico de barras y escoge el que menos te guste.

In [None]:
sns.barplot(data=mpg, x='model_year',y = 'weight', palette='magma')

In [None]:
fig = px.bar(mpg,x='model_year',y='weight')
fig.show()

## 4. Ahora, modifica el gráfico anterior agrupando por la columna cylinders.

In [None]:
## Pista_ usa el parámetro hue
hide_toggle()

In [None]:
barras = sns.barplot(data=mpg, x='model_year',y = 'acceleration', palette='magma',hue='cylinders')
sns.move_legend(barras, "upper left", bbox_to_anchor=(1, 1))

In [None]:
fig = px.bar(mpg,x='model_year',y='weight',color='cylinders')
fig.show()

## 5. Puedes hacer que el gráfico se vea horizintalmente?

In [None]:
barras = sns.countplot(data=mpg,y = 'origin', palette='magma',hue='cylinders')
sns.move_legend(barras, "upper left", bbox_to_anchor=(1, 1))

In [None]:
fig_h = px.bar(mpg,y='origin',color='cylinders')
fig_h.show()

## 6. Haz que el gráfico tenga unos colores muy saturados.

In [None]:
barras = sns.countplot(data=mpg,y = 'origin', palette='magma',hue='cylinders',saturation = 1)
sns.move_legend(barras, "upper left", bbox_to_anchor=(1, 1))

In [None]:
fig_h = px.bar(mpg,y='origin',color='cylinders',opacity=1)
fig_h.show()

## 7. Volviendo a que sea el grafico en vertical, puedes añadir etiquetas para ver cuantos coches hay de cada tipo?

In [None]:
## Pista: usa el comnado que Víctor enseñó en los apuntes
## y quítale la suma y la división
hide_toggle()

In [None]:
barras = sns.countplot(data=mpg, x='origin', palette='magma',hue='cylinders',saturation = 1)
sns.move_legend(barras, "upper left", bbox_to_anchor=(1, 1))
for p in barras.patches:
    barras.annotate(p.get_height(), (p.get_x(), p.get_height()))

In [None]:
fig = px.bar(mpg,x='model_year',y='weight',color='cylinders')
fig.add_trace(go.Scatter(
    x=mpg['model_year'], 
    y=mpg['weight'],
    text=mpg['weight'],
    mode='text',
    textposition='top center',
    textfont=dict(
        size=18,
    ),
    showlegend=False
))

fig.show()

## 8. Haz un histograma de una columna numérica.

In [None]:
mpg.sample(3)

In [None]:
sns.histplot(x=mpg.acceleration)

In [None]:
fig_hist = px.histogram(mpg,x='acceleration')
fig_hist.show()

## 9. Cambiale el número de barras a 20 (por defecto son 10)

In [None]:
sns.histplot(x=mpg.acceleration,bins=30)

In [None]:
fig_hist = px.histogram(mpg,x='acceleration',nbins=30,facet_row_spacing =1)
fig_hist.show()

## 10. Haz que cada barra esté vacía y cambiale el color.

In [None]:
sns.histplot(x=mpg.acceleration,bins=30,fill=None,color='darkgreen')

In [None]:
fig_hist = px.histogram(mpg,x='acceleration',nbins=30,facet_row_spacing =1)
fig.update_traces(marker_color='rgba(0,0,0,0)', marker_line_color='black', marker_line_width=1)
fig_hist.show()

## 11. Añade la estimación de la densidad. 

In [None]:
## Pista: usa el parámetro kde
hide_toggle()

In [None]:
sns.histplot(x=mpg.acceleration,bins=30,fill=None,color='darkgreen',kde= True)

## 12. Ahora haz el histograma agrupando por origen. (usa el histograma de la actividad 8 si quieres)

In [None]:
sns.histplot(data= mpg,x='acceleration',hue='origin')

## 13. Se están solapando algunos no? Como puedes hacer que estén uno encima de otro?

In [None]:
## Pista: usa el parámetro multiple
hide_toggle()

In [None]:
sns.histplot(data= mpg,x='acceleration',hue='origin',multiple='stack')

## 14. Cambia la leyenda para que esté en español.

In [None]:
sns.histplot(data= mpg,x='acceleration',hue='origin',multiple='stack')
plt.legend(title='Origen', labels=['Estados Unidos', 'Japón', 'Europa'])

## 15. En vez de que las barras esten una encima de otra, haz que estén separadas

In [None]:
sns.histplot(data= mpg,x='acceleration',hue='origin',multiple='dodge')
plt.legend(title='Origen', labels=['Estados Unidos', 'Japón', 'Europa'])

## 16. Haz un scatterplot con las variables weight y housepower

In [None]:
mpg.sample(3)

In [None]:
sns.scatterplot(data=mpg, x='weight', y='horsepower')

In [None]:
scatter_3d([data_frame, x, y, z, color, …])

## 17. Colorealo según el origen

In [None]:
sns.scatterplot(data=mpg, x='weight', y='horsepower',hue='origin')

## 18. Haz que el tamaño de cada pelota dependa de cylinders

In [None]:
sns.scatterplot(data=mpg, x='weight', y='horsepower',size='cylinders',hue='origin')

## 19. Haz que la opacidad sea de 0.5

In [None]:
sns.scatterplot(data=mpg, x='weight', y='horsepower',size='cylinders',hue='origin',alpha=0.5)

## 20. Cambia el estilo de punto según el origen.

In [None]:
mpg.sample(3)

In [None]:
puntos = sns.scatterplot(data=mpg, x='weight', y='horsepower',size='cylinders',style='origin',hue='model_year')
sns.move_legend(puntos, "upper left", bbox_to_anchor=(1, 1))

## 21. Haz un pairplot y agrupa por el origen.

In [None]:
sns.pairplot(mpg,hue='origin')

## 22. Haz un boxplot de la variable weight según los cylinders con plotly

In [None]:
import plotly.express as px

In [None]:
fig = px.box(mpg, x='cylinders',y='weight')
fig.show()

## 23. Ahora, hazlo con seaborn

In [None]:
sns.boxplot(x="cylinders", y="weight", data=mpg)