# Gráficos de Burbujas

Los gráficos de burbujas son una forma efectiva de visualizar datos en tres dimensiones, donde el tamaño de la burbuja representa una tercera variable.

En este ejemplo vamos a visualizar la espectativa de vida según paises.


In [14]:
import pandas as pd

country_life_df = pd.read_csv('../data/paises_vida.csv', index_col='index')
country_life_df  


Unnamed: 0_level_0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.853030,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.100710,AFG,4
3,Afghanistan,Asia,1967,34.020,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4
...,...,...,...,...,...,...,...,...
1699,Zimbabwe,Africa,1987,62.351,9216418,706.157306,ZWE,716
1700,Zimbabwe,Africa,1992,60.377,10704340,693.420786,ZWE,716
1701,Zimbabwe,Africa,1997,46.809,11404948,792.449960,ZWE,716
1702,Zimbabwe,Africa,2002,39.989,11926563,672.038623,ZWE,716


In [15]:
# ahora vamos a limpiar 🧹
country_life_df = country_life_df.dropna()
country_life_2002_df = country_life_df[country_life_df['year'] == 2002]
country_life_2002_df 

Unnamed: 0_level_0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
10,Afghanistan,Asia,2002,42.129,25268405,726.734055,AFG,4
22,Albania,Europe,2002,75.651,3508512,4604.211737,ALB,8
34,Algeria,Africa,2002,70.994,31287142,5288.040382,DZA,12
46,Angola,Africa,2002,41.003,10866106,2773.287312,AGO,24
58,Argentina,Americas,2002,74.340,38331121,8797.640716,ARG,32
...,...,...,...,...,...,...,...,...
1654,Vietnam,Asia,2002,73.017,80908147,1764.456677,VNM,704
1666,West Bank and Gaza,Asia,2002,72.370,3389578,4515.487575,PSE,275
1678,"Yemen, Rep.",Asia,2002,60.308,18701257,2234.820827,YEM,887
1690,Zambia,Africa,2002,39.193,10595811,1071.613938,ZMB,894


In [16]:
import plotly.express as px
# ahora vamos a graficar 

fig_2002 = px.scatter(
        country_life_2002_df,
        x='gdpPercap',
        y='lifeExp',
        size='pop',
        size_max= 60
        )

fig_2002.show()

<img src="../files/grafica-burbujas-2002-01.png" alt="Gráfica de burbujas" width="100%"/>


A través del gráfico ya podemos ver que hay una correlación exponencial, vemos una curva que va creciendo, y eso es lo que nos indica que hay una relación entre el PIB y la expectativa de vida. A medida que el PIB aumenta, la expectativa de vida también aumenta.
volvamos a consultar la imágen de referncia para el tipo de correlaciones.

<img src="../files/diagrama_de_dispersion.svg" alt="Correlaciones" width="600"/>

Para poder visualizar mejor la relación entre las variables, vamos a ajustar el eje X para que sea `logarítmico`.

### ¿Qué significa esto? 
Que en lugar de crecer de manera lineal, los valores del eje X crecerán de forma proporcional a sus logaritmos.

> Esto permite "aplanar" relaciones que originalmente son exponenciales, haciendo que la gráfica se vea más lineal y sea más fácil de interpretar.

In [19]:
fig_2002 = px.scatter(
        country_life_2002_df,
        x='gdpPercap',
        y='lifeExp',
        size='pop',
        size_max= 60,
        # aquí aplicamos el logaritmo a la población
         log_x=True,

         # vamos a poner color por continente
         color='continent',
        )

fig_2002.show()

<img src='../files/grafica-burbujas-2002-02.png' alt="Gráfica de burbujas"  width="100%"/>    


