<a href="https://colab.research.google.com/github/ornenovino/python_course_eim/blob/main/intro_py_m3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# Introducción a la programación en python

## Módulo 3: Visualización de datos con Python


Uso de librerías como Matplotlib, Seaborn y Plotly para crear gráficos y visualizaciones de datos de manera efectiva.

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import plotly.express as px

### Matplotlib

In [None]:
# https://matplotlib.org/stable/gallery/index
# Cargamos una encuesta sobre marcas de ketchup
ketchup = pd.read_csv('/content/drive/MyDrive/python_intro/Ketchup.csv')

In [None]:
ketchup.head()

In [None]:
# Generamos un df con los nombres y el count por marca
choice = ketchup['Ketchup.choice'].value_counts().rename_axis('names').reset_index(name='counts')
print(choice.head())
choice['names'] = choice['names'].str.capitalize() # pasamos la primer letra a mayúscula
choice.head()

In [None]:
# generamos un simple barplot por marca
plt.bar(choice['names'], choice['counts'])

In [None]:
# incluso podemos cambiarle los colores
plt.bar(choice['names'], choice['counts'], color=['red', 'green', 'blue', 'orange'])

In [None]:
# hay que tener en cuenta que los graficos funcionan como canvas - capas
fig, ax = plt.subplots() # creamos las primeras capas

bar_colors = ['tab:red', 'tab:green', 'tab:blue', 'tab:orange']

ax.bar(choice['names'], choice['counts'], color = bar_colors)

ax.set_ylabel('Count')
ax.set_title('Count of brands')
ax.set_xlabel('Brand')
 
plt.show() # obtenemos el mismo resultado

In [None]:
# podemos hacer graficos de torta
fig, ax = plt.subplots()
ax.pie(choice['counts'], labels = choice['names'], autopct='%1.1f%%')

### Seaborn

In [None]:
# Seaborn nos ofrece datasets que podemos descargar y almacenar para trabajar
# https://github.com/mwaskom/seaborn-data
# https://rdrr.io/cran/reshape2/man/tips.html 
df = sns.load_dataset('tips')
df.head()

In [None]:
# podemos hacer un simple .barplot() con el total de la cuenta por el horario del dia
plot = sns.barplot(data = df, x = 'time', y = 'total_bill')
plot.set(xlabel = 'Hour', ylabel = '$USD Total Bill')
plt.show()

In [None]:
# podemos setear un tema (tener en cuenta el modelo de capas)
sns.set_theme(style = 'whitegrid')
# o simplemente el genero con la funcion .countplot()
plot = sns.countplot(x = 'sex', data = df)
plot.set(ylabel = '', xlabel = 'Gender', title = 'Gender distribution')
plt.show()

In [None]:
# Cargamos informacion sobre covid en uy
# https://guiad-covid.github.io/data/estadisticasuy/estadisticasuy/
covid = pd.read_csv('https://raw.githubusercontent.com/GUIAD-COVID/datos-y-visualizaciones-GUIAD/master/datos/estadisticasUY.csv')
covid.head()

In [None]:
# separamos el dia, el mes y el año
covid[['dia', 'mes', 'ano']] = covid['fecha'].str.split('/', expand = True)
covid.head()

In [None]:
# filtramos por 2021
covid2021 = covid[covid['ano'] == '2021']
covid2021.head()

In [None]:
# podemos plotear la cantidad de casos nuevos por mes del 2021
sns.lineplot(data = covid2021, x = 'mes', y = 'cantCasosNuevosOriginal')

### Plotly

In [None]:
# al igual que seaborn plotly tiene algunos datasets por ejemplo el de tips
df = px.data.tips()
fig = px.histogram(df, x = 'sex', y = "total_bill",
             color = 'smoker', barmode = 'group',
             height = 400)
fig.show()

In [None]:
# https://www.gapminder.org/data/documentation/
# poblacion del Uruguay por año

dfuy = px.data.gapminder().query("country == 'Uruguay'")
fig = px.bar(dfuy, x = 'year', y = 'pop', text_auto = '.2s')
fig.show()

In [None]:
# poblacion del Uruguay por año
dfuy = px.data.gapminder().query("country in ['Uruguay']")
fig = px.bar(dfuy, x = 'year', y = 'pop', text_auto = '.2s')
fig.update_traces(textfont_size = 12, textangle = 0, textposition = 'outside', cliponaxis = False)
fig.show()

In [None]:
df = px.data.gapminder().query("country in ['Uruguay', 'Argentina', 'Chile']") # para poder hacer querys

# en este caso graficamos la esperanza de vida por año y pais seleccionado
fig = px.line(df, 
              x = 'year', y = 'lifeExp', 
              color = 'country', 
              markers = True, 
              symbol = 'country',
              title = 'Esperanza de vida de Argentina, Chile y Uruguay por año',
              labels = {
                     "lifeExp": "Esperanza de vida",
                     "year": "Año",
                     "country": "País"
                 })
fig.show()

In [None]:
# aqui podemos graficar el PBI per capita por la esperanza de vida
fig = px.line(df, x = 'lifeExp', y = 'gdpPercap', color = 'country', text = 'year') # podemos agregar el año
fig.update_traces(textposition = 'bottom right') # y donde queremos que vaya
fig.show()

In [None]:
# aqui podemos graficar el PBI per capita por la esperanza de vida
fig = px.line(df, x = 'lifeExp', y = 'gdpPercap', color = 'country', text = 'year', template = 'ggplot2',
              title = 'Esperanza de vida por PBI per capita de Argentina, Chile y Uruguay',
              labels={
                     "lifeExp": "Esperanza de vida",
                     "gdpPercap": "PBI per capita",
                     "country": "País"
                 }) # podemos cambiar el tema
fig.update_traces(textposition = 'bottom right') # y donde queremos que vaya
fig.show()