In [None]:
#  INSTALACIÓN E IMPORTACIÓN DE PANDAS

# py -m pip install pandas matplotlib numpy
# pip install pandas matplotlib numpy

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt


#Ejercicio: Análisis de la Densidad de Población con Pandas Series

print("\n" + "="*50)
print("1. CREACIÓN DE SERIES DESDE LISTAS")
print("="*50)

# Lista de ciudades y su población (millones)
ciudades = ["Tokio", "Delhi", "Shanghái", "Quito", "Ciudad de México"]
poblacion = [37.4, 31.0, 27.1, 22.2, 21.9]

# Series sin índices personalizados → usa índices numéricos automáticos
serie_poblacion = pd.Series(poblacion)
print("Serie básica (índices automáticos):")
print(serie_poblacion)

# Series con índices personalizados → usamos nombres de ciudades como etiquetas
serie_poblacion_nombres = pd.Series(poblacion, index=ciudades, name="Población (millones)")
print("\nSerie con índices personalizados:")
print(serie_poblacion_nombres)

print("\n" + "="*50)
print("2. CREACIÓN DE SERIES DESDE DICCIONARIOS")
print("="*50)

# Diccionario con áreas de ciudades (km²)
areas_km2 = {
    "Tokio": 2194,
    "Delhi": 1484,
    "Shanghái": 6341,
    "Quito": 1521,
    "Ciudad de México": 1485
}

serie_areas = pd.Series(areas_km2, name="Área (km²)")
print("Serie desde diccionario:")
print(serie_areas)

print("\n" + "="*50)
print("3. CREACIÓN DE SERIES DESDE NUMPY")
print("="*50)

temperaturas_promedio = np.array([15.4, 25.0, 16.5, 21.0, 17.5])
serie_temperaturas = pd.Series(temperaturas_promedio, 
                              index=ciudades, 
                              name="Temperatura Promedio (°C)")
print("Serie desde array NumPy:")
print(serie_temperaturas)


#  SELECCIÓN Y ACCESO A ELEMENTOS DE UNA SERIE

print("\n" + "="*50)
print("4. ACCESO A ELEMENTOS DE UNA SERIE")
print("="*50)

print("Serie de población completa:")
print(serie_poblacion_nombres)

# Acceso posicional
print(f"\n Primer elemento (por posición): {serie_poblacion_nombres.iloc[0]}")
print(f" Último elemento (por posición): {serie_poblacion_nombres.iloc[-1]}")

# Acceso por etiqueta
print(f"Población de Delhi: {serie_poblacion_nombres['Delhi']} millones")
print(f"Población de Shanghái: {serie_poblacion_nombres.loc['Shanghái']} millones")

# Slicing → seleccionar subconjuntos
print(f"\n Primeras 3 ciudades:")
print(serie_poblacion_nombres.iloc[:3])

print(f"\n Ciudades de Delhi a Quito:")
print(serie_poblacion_nombres.loc['Delhi':'Quito'])

# OPERACIONES ARITMÉTICAS ENTRE SERIES

print("\n" + "="*50)
print("5. OPERACIONES ARITMÉTICAS")
print("="*50)

# Convertimos millones → habitantes
serie_poblacion_habitantes = serie_poblacion_nombres * 1_000_000
serie_poblacion_habitantes.name = "Población (habitantes)"
print("Población en habitantes:")
print(serie_poblacion_habitantes)

# Cálculo de densidad de población
densidad_poblacion = serie_poblacion_habitantes / serie_areas
densidad_poblacion.name = "Densidad (hab/km²)"
print("\nDensidad de población:")
print(densidad_poblacion)

# Operación con escalares → aumentar población en 5%
print(f"\nPoblación aumentada 5%:")
print(serie_poblacion_nombres * 1.05)

#  ESTADÍSTICOS DESCRIPTIVOS BÁSICOS

print("\n" + "="*50)
print("6. ESTADÍSTICOS DESCRIPTIVOS")
print("="*50)

print("Estadísticas de población:")
# Media: promedio de todos los valores, indica un valor "típico"
print(f"   Media: {serie_poblacion_nombres.mean():.2f} millones")

# Mediana: valor central al ordenar los datos, no se ve afectada por valores extremos
print(f"   Mediana: {serie_poblacion_nombres.median():.2f} millones")

# Desviación estándar: mide la dispersión de los datos respecto a la media
print(f"   Desviación estándar: {serie_poblacion_nombres.std():.2f} millones")

# Mínimo: el valor más pequeño en la serie
print(f"   Mínimo: {serie_poblacion_nombres.min():.2f} millones")

# Máximo: el valor más grande en la serie
print(f"   Máximo: {serie_poblacion_nombres.max():.2f} millones")

# Suma total: suma de todos los valores de la serie
print(f"   Suma total: {serie_poblacion_nombres.sum():.2f} millones")

print("\nEstadísticas de densidad:")

# Densidad promedio: promedio de habitantes por km²
print(f"   Densidad promedio: {densidad_poblacion.mean():.0f} hab/km²")

# Ciudad más densa: ciudad con mayor densidad (habitantes/km²)
print(f"   Ciudad más densa: {densidad_poblacion.idxmax()} ({densidad_poblacion.max():.0f} hab/km²)")

# Ciudad menos densa: ciudad con menor densidad (habitantes/km²)
print(f"   Ciudad menos densa: {densidad_poblacion.idxmin()} ({densidad_poblacion.min():.0f} hab/km²)")


#  VISUALIZACIÓN CON MATPLOTLIB

print("\n" + "="*50)
print("7. VISUALIZACIÓN DE DATOS")
print("="*50)

# Establece un estilo de gráficos más agradable visualmente
plt.style.use('seaborn-v0_8')  

# Crea una figura con una cuadrícula de 2x2 subplots
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 10))

# Título principal de la figura
fig.suptitle('Análisis de Densidad de Población en Grandes Ciudades', fontsize=16, fontweight='bold')


# Gráfico 1: Población por ciudad

serie_poblacion_nombres.plot(kind='bar', ax=ax1, color='skyblue', edgecolor='black')

# Título del subplot
ax1.set_title('Población (millones)')

# Etiqueta del eje Y
ax1.set_ylabel('Millones de habitantes')

# Rotación de etiquetas del eje X para que no se encimen
ax1.tick_params(axis='x', rotation=45)

# Gráfico 2: Área de cada ciudad

serie_areas.plot(kind='bar', ax=ax2, color='lightgreen', edgecolor='black')
ax2.set_title('Área (km²)')
ax2.set_ylabel('Kilómetros cuadrados')
ax2.tick_params(axis='x', rotation=45)


# Gráfico 3: Densidad de población

densidad_poblacion.plot(kind='bar', ax=ax3, color='coral', edgecolor='black')
ax3.set_title('Densidad de Población')
ax3.set_ylabel('Habitantes por km²')
ax3.tick_params(axis='x', rotation=45)


# Gráfico 4: Dispersión Población vs Área

ax4.scatter(serie_areas, serie_poblacion_nombres, s=100, alpha=0.7, color='purple')

# Anotaciones: añade etiquetas con el nombre de cada ciudad
for i, ciudad in enumerate(ciudades):
    ax4.annotate(ciudad, (serie_areas.iloc[i], serie_poblacion_nombres.iloc[i]), 
                 xytext=(5, 5), textcoords='offset points')

# Etiquetas de los ejes
ax4.set_xlabel('Área (km²)')
ax4.set_ylabel('Población (millones)')

# Título del subplot
ax4.set_title('Relación Población vs Área')

# Activa la cuadrícula con transparencia 0.3
ax4.grid(True, alpha=0.3)

# Ajusta automáticamente los espacios entre subplots para que no se encimen
plt.tight_layout()

# Muestra la figura completa en pantalla
plt.show()



