# **Gráficos en Python**

## Instalación e importación de librerías
- Se asegura que Plotly Express esté instalado e importado para generar gráficos interactivos.

In [1]:
# pip install plotly_express

Importamos la librería Plotly Express

In [2]:
import plotly.express as px

## Carga de datos
Se utilizan datasets de ejemplo de Plotly (`gapminder` y `tips`) para realizar diferentes tipos de visualizaciones.

In [3]:
gapminder = px.data.gapminder()

In [4]:
gapminder.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.85303,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.10071,AFG,4
3,Afghanistan,Asia,1967,34.02,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4


## Filtrado de datos
Se filtran los datos del dataset `gapminder` para trabajar solo con el año 2007.

In [5]:
# Filtramos el dataset 'gapminder' para seleccionar solo las filas correspondientes al año 2007
gapminder2007 = gapminder.query("year == 2007")

# Mostramos las primeras filas del dataset filtrado para visualizar y verificar los datos
gapminder2007.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
11,Afghanistan,Asia,2007,43.828,31889923,974.580338,AFG,4
23,Albania,Europe,2007,76.423,3600523,5937.029526,ALB,8
35,Algeria,Africa,2007,72.301,33333216,6223.367465,DZA,12
47,Angola,Africa,2007,42.731,12420476,4797.231267,AGO,24
59,Argentina,Americas,2007,75.32,40301927,12779.37964,ARG,32


## Creación de gráficos

### Diagrama de dispersión
Muestra la relación entre PIB per cápita y esperanza de vida, agrupando por continentes y ajustando el tamaño de los puntos según la población.


In [6]:
# Creamos un diagrama de dispersión utilizando el dataset filtrado 'gapminder2007'
# - 'x' representa el PIB per cápita (gdpPercap) en el eje X
# - 'y' representa la esperanza de vida (lifeExp) en el eje Y
# - 'color' asigna colores a los puntos según el continente, permitiendo distinguir los datos por región
# - 'labels' cambia las etiquetas de los ejes para que se muestren en español: PIB per cápita (USD) y Esperanza de Vida
# - 'size' ajusta el tamaño de los puntos según la población (pop) de cada país, con un tamaño máximo de 100
# - 'hover_name' muestra el nombre del país al pasar el cursor sobre los puntos
# - 'log_x=True' convierte el eje X a escala logarítmica para mejorar la visualización de datos con alta variabilidad
# - 'facet_col' crea gráficos separados en columnas, agrupando los datos por continente
fig = px.scatter(
    data_frame=gapminder2007, 
    x="gdpPercap", 
    y="lifeExp", 
    color="continent", 
    labels={"gdpPercap": "PIB per cápita (USD)", "lifeExp": "Esperanza de Vida"}, 
    size="pop", 
    size_max=100,
    hover_name="country", 
    log_x=True, 
    facet_col="continent"
)

# Muestra el diagrama de dispersión interactivo
fig.show()

### Gráfica coroplética animada
Visualiza la evolución de la esperanza de vida a lo largo de los años en diferentes países.

In [7]:
# Creamos una gráfica coroplética utilizando el dataset 'gapminder'
# - 'data_frame' especifica el dataset a usar
# - 'locations' define las ubicaciones de los países utilizando sus códigos ISO Alpha-3 (iso_alpha)
# - 'color' asigna un color a cada país según la esperanza de vida (lifeExp), creando un mapa de calor visual
# - 'animation_frame' permite animar la gráfica a través de los años, mostrando cambios en la esperanza de vida a lo largo del tiempo
# - 'hover_name' muestra el nombre del país cuando se pasa el cursor sobre él
# - 'projection' utiliza la proyección "natural earth" para dar una representación realista del mapa
# - 'labels' cambia las etiquetas para mostrar "Esperanza de Vida" y "Año" en español
fig2 = px.choropleth(
    data_frame=gapminder, 
    locations="iso_alpha", 
    color="lifeExp", 
    animation_frame="year", 
    hover_name="country",
    projection="natural earth", 
    labels={"lifeExp": "Esperanza de Vida", "year": "Año"}
)

# Muestra la gráfica coroplética interactiva y animada
fig2.show()


### Histograma
Analiza la relación entre el total de la cuenta y las propinas, diferenciando entre clientes fumadores y no fumadores.

In [8]:
# Cargamos un dataset de ejemplo llamado 'tips' proporcionado por Plotly Express
# Este dataset contiene información sobre cuentas de restaurante, incluyendo datos como el total de la cuenta, la propina, 
# el día de la semana, si el cliente era fumador o no, el género del cliente, y el tamaño del grupo
tips = px.data.tips()

In [9]:
# Creamos un histograma utilizando el dataset 'tips'
# - 'x' representa el total de la cuenta (total_bill) en el eje X
# - 'y' representa la suma de las propinas (tip) en el eje Y
# - 'color' asigna diferentes colores según si el cliente era fumador o no (smoker), permitiendo comparar visualmente ambos grupos
# - 'histfunc="sum"' especifica que se deben sumar las propinas para cada rango del total de la cuenta, en lugar de contar la cantidad de observaciones
fig3 = px.histogram(
    tips, 
    x="total_bill", 
    y="tip", 
    color="smoker", 
    histfunc="sum"
)

# Muestra el histograma interactivo
fig3.show()
