# Actividad 2: Gráficas de Dataset

**Asignatura:** Big Data Aplicado.
**Estudiante:** Byron V. Blatch Rodríguez.
**Fecha:** 25/11/2025

## Objetivos de la actividad
1. Manejar una librería con herramientas gráficas interactivas para una presentación más personalizada.
2. Dibujar un gráfico interactivo donde se muestre el mapa de Venezuela con un círculo que represente la cantidad de población según el año.

> En esta ocasión comienzo a trabajar con el dataset en limpio que creé en 'Actividad_01_Homogenizacion_Dataset': vnzla_population_limpio.csv
---

In [1]:
# Como costumbre,  importamos las librerías que usaremos
import pandas as pd
import plotly.express as px # Librería para gráficas interactivas

# Cargamos el dataset en limpio que exporté en la actividad anterior
df = pd.read_csv('data/vnzla_population_limpio.csv')

print("Primeras filas del dataset cargado:")
print(df.head())

Primeras filas del dataset cargado:
  Country/Territory  Year  Population
0         Venezuela  2000    24427729
1         Venezuela  2010    28715022
2         Venezuela  2015    30529716
3         Venezuela  2020    28490453
4         Venezuela  2022    28301696


Según la documentación de Plotly, debemos indicar "dónde" debe pintar ese gráfico que quiero representar. Utilizaré uno sencillo para efectos prácticos de la actividad, usaré un Scatter Geo, es decir, un punto geográfico en una coordenada.

Seleccionaremos las coordenadas del centro de Venezuela, así el círculo estará justo en el medio de Venezuela. Esas coordenadas son Latitud 6.4238 y Longitud -66.5897.

In [2]:
# Inyectamos las coordenadas geográficas de Venezuela
df['lat'] = 6.4238
df['lon'] = -66.5897

# Verificamos que las coordenadas se hayan añadido correctamente.
print("Dataset con coordenadas añadidas:")
print(df[['Year', 'lat', 'lon']].head())

Dataset con coordenadas añadidas:
   Year     lat      lon
0  2000  6.4238 -66.5897
1  2010  6.4238 -66.5897
2  2015  6.4238 -66.5897
3  2020  6.4238 -66.5897
4  2022  6.4238 -66.5897


Ahora pasamos al corazón de la creación de la gráfica, será con la función `px.scatter_geo`.

In [3]:
fig = px.scatter_geo(
    df, # DataFrame con los datos
    
    # Coordenadas geográficas ¿qué columnas dicen dónde se debe pintar el punto?
    lat='lat', # Columna de latitud
    lon='lon', # Columna de longitud

    # Dimensión del punto ¿qué columna define el tamaño del punto?
    size='Population', # Columna que define el tamaño del círculo

    # Interacción (Tooltips) con el punto ¿qué columna se muestra al pasar el ratón sobre el punto?
    hover_name='Country/Territory', # Título del popup
    hover_data=['Population'], # Datos adicionales en el popup

    # La dimensión Tiempo (esto lo hará videográfico)
    animation_frame='Year', # Esto creará el slider inferior. Plotly agrupa los datos por año.

    # Estética del Mapa.
    projection='natural earth', # Estilo de la proyección (tierra redonda pero aplanada).
    title='Población de Venezuela a lo largo de los años (1950-2023)', # Título del gráfico

    # Ajuste de burbujas
    size_max=100, # Tamaño máximo en píxeles para el valor más alto.
    # Si se hace muy pequeño no se notará el cambio
)

A pesar de todos estos parámetros, aún debemos hacer más ajustes, pues así en crudo se mostrará el mapa del mundo y Venezuela, el país que me interesa mostrar, se verá minúsculo. Por tanto, debo "ajustar la cámara" para que se enfoque en Venezuela.

In [4]:
# Ajustamos la cámara para que se enfoque en Venezuela
fig.update_geos(
    center=dict(lat=6.4238, lon=-66.5897), # Centro en Venezuela

    # Nivel de zoom (más alto = más cerca)
    projection_scale=10, # Valor ajustado para enfocar Venezuela

    # Este paso es adicional, quiero mostrar las fronteras de los países cercanos.
    showcountries=True, countrycolor="Black"
)

# Mostramos la gráfica interactiva
fig.show()