<a href="https://colab.research.google.com/github/laura8am/portfolio-data-analyst/blob/main/proyecto3_residuos_economia_circular.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Proyecto 3: De los Datos a las Decisiones
## An√°lisis de Residuos y Econom√≠a Circular

**Autora:** Laura Ochoa M.
**Fecha inicio:** Febrero 2026
**Stack:** Python ¬∑ SQL ¬∑ Plotly ¬∑ Seaborn

### Preguntas de an√°lisis
1. ¬øQu√© pa√≠ses de la UE tienen las tasas de reciclaje m√°s altas?
2. ¬øCu√°nto residuo genera M√©xico per c√°pita vs Europa?
3. ¬øD√≥nde est√°n los mayores gaps entre M√©xico y el benchmark europeo?
4. ¬øQu√© oportunidades existen para una empresa gestora de residuos en M√©xico?

### Fuentes de datos
- EUROSTAT: Municipal waste statistics (ENV_WASMUN)
- SEMARNAT: Informe de la Situaci√≥n del Medio Ambiente en M√©xico
- BID: Diagn√≥stico de gesti√≥n de residuos en LAC 2022

In [1]:
# ============================================================
# LIBRER√çAS
# ============================================================
# sqlite3 ya viene con Python ‚Äî no necesita instalaci√≥n

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import sqlite3
import warnings

warnings.filterwarnings('ignore')

# Configuraci√≥n visual
sns.set_theme(style="whitegrid", palette="viridis")
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.family'] = 'sans-serif'

print("‚úÖ Librer√≠as cargadas correctamente")
print(f"   pandas  {pd.__version__}")
print(f"   numpy   {np.__version__}")

‚úÖ Librer√≠as cargadas correctamente
   pandas  2.2.2
   numpy   2.0.2


In [2]:
# ============================================================
# DATASET: GENERACI√ìN Y GESTI√ìN DE RESIDUOS
# Fuentes: EUROSTAT 2022, SEMARNAT 2021, BID 2022
# ============================================================

data_paises = {
    'pais': [
        # L√≠deres europeos
        'Alemania', 'Austria', 'Pa√≠ses Bajos', 'B√©lgica', 'Dinamarca',
        # Europa media
        'Francia', 'Espa√±a', 'Italia', 'Portugal', 'Polonia',
        # Europa rezagada (pero mejorando)
        'Ruman√≠a', 'Bulgaria', 'Grecia',
        # Am√©rica Latina
        'Brasil', 'Colombia', 'Argentina', 'Chile', 'Per√∫',
        # M√©xico
        'M√©xico'
    ],
    'region': [
        'Europa', 'Europa', 'Europa', 'Europa', 'Europa',
        'Europa', 'Europa', 'Europa', 'Europa', 'Europa',
        'Europa', 'Europa', 'Europa',
        'Am√©rica Latina', 'Am√©rica Latina', 'Am√©rica Latina',
        'Am√©rica Latina', 'Am√©rica Latina',
        'M√©xico'
    ],
    'kg_per_capita': [
        # kg de residuos municipales por habitante por a√±o
        632, 560, 527, 505, 844,
        541, 530, 591, 516, 358,
        312, 365, 533,
        379, 270, 359, 395, 218,
        415  # M√©xico
    ],
    'tasa_reciclaje_pct': [
        # % del total de residuos que se recicla o composta
        67.3, 57.7, 55.9, 54.3, 46.4,
        44.8, 35.7, 48.7, 28.5, 35.5,
        13.7, 32.1, 20.2,
        4.0, 17.0, 10.5, 11.2, 1.5,
        9.3  # M√©xico
    ],
    'tasa_relleno_pct': [
        # % que va a relleno sanitario
        29.5, 30.0, 2.0, 10.3, 2.0,
        25.0, 51.6, 20.9, 63.5, 39.1,
        68.9, 54.2, 76.6,
        52.0, 61.0, 55.0, 59.0, 75.0,
        61.0  # M√©xico
    ],
    'tasa_incineracion_pct': [
        # % que va a incineraci√≥n con recuperaci√≥n energ√©tica
        0.0, 12.0, 42.0, 35.0, 51.0,
        30.0, 12.0, 18.0, 8.0, 22.5,
        1.2, 0.0, 0.0,
        0.1, 0.0, 0.5, 0.0, 0.0,
        0.0  # M√©xico
    ],
    'disposicion_inadecuada_pct': [
        # % en tiraderos a cielo abierto o quema
        0.0, 0.0, 0.0, 0.0, 0.0,
        0.0, 0.2, 0.0, 0.0, 0.0,
        16.2, 13.7, 3.2,
        25.0, 21.0, 22.0, 17.0, 32.0,
        21.0  # M√©xico
    ],
    'anio': [2022]*19,
    'fuente': [
        'EUROSTAT']*13 + ['BID 2022']*5 + ['SEMARNAT 2021']
}

df = pd.DataFrame(data_paises)

print("‚úÖ Dataset creado")
print(f"   {len(df)} pa√≠ses | {len(df.columns)} variables")
print(f"\n{'='*50}")
print(df[['pais', 'region', 'kg_per_capita', 'tasa_reciclaje_pct']].to_string(index=False))

‚úÖ Dataset creado
   19 pa√≠ses | 9 variables

        pais         region  kg_per_capita  tasa_reciclaje_pct
    Alemania         Europa            632                67.3
     Austria         Europa            560                57.7
Pa√≠ses Bajos         Europa            527                55.9
     B√©lgica         Europa            505                54.3
   Dinamarca         Europa            844                46.4
     Francia         Europa            541                44.8
      Espa√±a         Europa            530                35.7
      Italia         Europa            591                48.7
    Portugal         Europa            516                28.5
     Polonia         Europa            358                35.5
     Ruman√≠a         Europa            312                13.7
    Bulgaria         Europa            365                32.1
      Grecia         Europa            533                20.2
      Brasil Am√©rica Latina            379                 4.0
  

In [3]:
# ============================================================
# INTRODUCCI√ìN A SQL
# ============================================================
# SQL = Structured Query Language
# Es el lenguaje para hablar con bases de datos.
# Hoy aprendes 3 comandos fundamentales:
#   SELECT  ‚Üí qu√© columnas quiero ver
#   FROM    ‚Üí de qu√© tabla
#   WHERE   ‚Üí con qu√© condici√≥n
#   ORDER BY ‚Üí ordenar resultados
#   LIMIT   ‚Üí cu√°ntos resultados mostrar
# ============================================================

# Paso 1: Crear una base de datos en memoria
# (como abrir un archivo de Excel, pero en SQL)
conn = sqlite3.connect(':memory:')

# Paso 2: Guardar nuestro DataFrame como tabla SQL
df.to_sql('residuos', conn, index=False, if_exists='replace')

print("‚úÖ Base de datos SQL creada")
print("   Tabla: 'residuos'")
print(f"   Registros: {len(df)}")

‚úÖ Base de datos SQL creada
   Tabla: 'residuos'
   Registros: 19


In [4]:
# ============================================================
# QUERY 1: Ver todos los datos
# ============================================================
# SELECT * significa "dame todas las columnas"
# FROM residuos significa "de la tabla residuos"
# LIMIT 5 significa "solo mu√©strame 5 filas"

query_1 = """
SELECT *
FROM residuos
LIMIT 5
"""

resultado_1 = pd.read_sql_query(query_1, conn)
print("QUERY 1: Primeras 5 filas de la tabla")
print("="*50)
print(resultado_1.to_string(index=False))

QUERY 1: Primeras 5 filas de la tabla
        pais region  kg_per_capita  tasa_reciclaje_pct  tasa_relleno_pct  tasa_incineracion_pct  disposicion_inadecuada_pct  anio   fuente
    Alemania Europa            632                67.3              29.5                    0.0                         0.0  2022 EUROSTAT
     Austria Europa            560                57.7              30.0                   12.0                         0.0  2022 EUROSTAT
Pa√≠ses Bajos Europa            527                55.9               2.0                   42.0                         0.0  2022 EUROSTAT
     B√©lgica Europa            505                54.3              10.3                   35.0                         0.0  2022 EUROSTAT
   Dinamarca Europa            844                46.4               2.0                   51.0                         0.0  2022 EUROSTAT


In [5]:
# ============================================================
# QUERY 2: ¬øQu√© pa√≠ses reciclan m√°s del 50%?
# ============================================================
# WHERE filtra filas seg√∫n una condici√≥n
# ORDER BY ordena los resultados
# DESC = descendente (de mayor a menor)

query_2 = """
SELECT pais,
       region,
       tasa_reciclaje_pct
FROM residuos
WHERE tasa_reciclaje_pct > 50
ORDER BY tasa_reciclaje_pct DESC
"""

resultado_2 = pd.read_sql_query(query_2, conn)
print("QUERY 2: Pa√≠ses con tasa de reciclaje > 50%")
print("="*50)
print(resultado_2.to_string(index=False))
print(f"\n‚Üí {len(resultado_2)} pa√≠ses superan el 50% de reciclaje")
print(f"‚Üí M√©xico est√° en {df[df['pais']=='M√©xico']['tasa_reciclaje_pct'].values[0]}%")

QUERY 2: Pa√≠ses con tasa de reciclaje > 50%
        pais region  tasa_reciclaje_pct
    Alemania Europa                67.3
     Austria Europa                57.7
Pa√≠ses Bajos Europa                55.9
     B√©lgica Europa                54.3

‚Üí 4 pa√≠ses superan el 50% de reciclaje
‚Üí M√©xico est√° en 9.3%


In [6]:
# ============================================================
# QUERY 3: ¬øD√≥nde est√° M√©xico comparado con cada regi√≥n?
# ============================================================
# GROUP BY agrupa filas por una categor√≠a
# AVG() calcula el promedio
# ROUND() redondea decimales

query_3 = """
SELECT region,
       ROUND(AVG(kg_per_capita), 1)      AS promedio_kg_per_capita,
       ROUND(AVG(tasa_reciclaje_pct), 1) AS promedio_reciclaje_pct,
       ROUND(AVG(disposicion_inadecuada_pct), 1) AS promedio_disposicion_inadecuada
FROM residuos
GROUP BY region
ORDER BY promedio_reciclaje_pct DESC
"""

resultado_3 = pd.read_sql_query(query_3, conn)
print("QUERY 3: Promedios por regi√≥n")
print("="*50)
print(resultado_3.to_string(index=False))

QUERY 3: Promedios por regi√≥n
        region  promedio_kg_per_capita  promedio_reciclaje_pct  promedio_disposicion_inadecuada
        Europa                   524.2                    41.6                              2.6
        M√©xico                   415.0                     9.3                             21.0
Am√©rica Latina                   324.2                     8.8                             23.4


In [7]:
# ============================================================
# VISUALIZACI√ìN FINAL - VERSI√ìN LIMPIA
# ============================================================

fig = make_subplots(
    rows=1, cols=2,
    subplot_titles=('', '')  # Sin t√≠tulos autom√°ticos, los ponemos manual
)

color_map = {
    'Europa': '#2196F3',
    'Am√©rica Latina': '#FF9800',
    'M√©xico': '#4CAF50'
}

# Gr√°fica izquierda: tasa de reciclaje
df_sorted = df.sort_values('tasa_reciclaje_pct', ascending=True)

fig.add_trace(
    go.Bar(
        y=df_sorted['pais'],
        x=df_sorted['tasa_reciclaje_pct'],
        orientation='h',
        marker_color=[color_map[r] for r in df_sorted['region']],
        text=df_sorted['tasa_reciclaje_pct'].round(1),
        textposition='outside',
        name='Reciclaje %'
    ),
    row=1, col=1
)

# Gr√°fica derecha: disposici√≥n inadecuada
df_sorted2 = df.sort_values('disposicion_inadecuada_pct', ascending=True)

fig.add_trace(
    go.Bar(
        y=df_sorted2['pais'],
        x=df_sorted2['disposicion_inadecuada_pct'],
        orientation='h',
        marker_color=[color_map[r] for r in df_sorted2['region']],
        text=df_sorted2['disposicion_inadecuada_pct'].round(1),
        textposition='outside',
        name='Disposici√≥n inadecuada %'
    ),
    row=1, col=2
)

# Layout
fig.update_layout(
    height=900,
    showlegend=False,
    plot_bgcolor='white',
    paper_bgcolor='white',
    margin=dict(t=100, l=120),
    title=dict(
        text='Gesti√≥n de Residuos: Europa vs Am√©rica Latina vs M√©xico (2022)',
        font=dict(size=16),
        y=0.98
    )
)

# L√≠nea de referencia SIN anotaci√≥n
fig.add_vline(
    x=60, row=1, col=1,
    line_dash="dash",
    line_color="red"
)

# T√≠tulos de subplots y etiqueta meta ‚Äî todos en posiciones separadas
fig.add_annotation(
    text="Tasa de Reciclaje (%) por Pa√≠s",
    xref="paper", yref="paper",
    x=0.22, y=1.06,
    showarrow=False,
    font=dict(size=13, color="black")
)

fig.add_annotation(
    text="Disposici√≥n Inadecuada (%) por Pa√≠s",
    xref="paper", yref="paper",
    x=0.78, y=1.06,
    showarrow=False,
    font=dict(size=13, color="black")
)

fig.add_annotation(
    text="Meta EU 2030: 60%",
    xref="x", yref="paper",
    x=61, y=0.02,
    showarrow=False,
    font=dict(size=11, color="red"),
    xanchor="left"
)

fig.show()

In [8]:
# ============================================================
# EXPORTAR para Notion
# ============================================================

fig.write_html("sesion1_comparativa_residuos.html")
print("‚úÖ Archivo guardado: sesion1_comparativa_residuos.html")
print("   ‚Üí Desc√°rgalo y s√∫belo a Notion")
print("\nüìä HALLAZGOS DE LA SESI√ìN 1:")
print(f"   ‚Ä¢ Alemania recicla {df[df['pais']=='Alemania']['tasa_reciclaje_pct'].values[0]}% de sus residuos")
print(f"   ‚Ä¢ M√©xico recicla {df[df['pais']=='M√©xico']['tasa_reciclaje_pct'].values[0]}% ‚Äî gap de {67.3-9.3:.1f} puntos porcentuales")
print(f"   ‚Ä¢ M√©xico tiene {df[df['pais']=='M√©xico']['disposicion_inadecuada_pct'].values[0]}% de disposici√≥n inadecuada vs 0% en Europa occidental")
print(f"   ‚Ä¢ Solo 4 pa√≠ses de LAC tienen datos de reciclaje > 15%")

‚úÖ Archivo guardado: sesion1_comparativa_residuos.html
   ‚Üí Desc√°rgalo y s√∫belo a Notion

üìä HALLAZGOS DE LA SESI√ìN 1:
   ‚Ä¢ Alemania recicla 67.3% de sus residuos
   ‚Ä¢ M√©xico recicla 9.3% ‚Äî gap de 58.0 puntos porcentuales
   ‚Ä¢ M√©xico tiene 21.0% de disposici√≥n inadecuada vs 0% en Europa occidental
   ‚Ä¢ Solo 4 pa√≠ses de LAC tienen datos de reciclaje > 15%


In [9]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [10]:
# Verificar que M√©xico est√° en los datos
print(df[df['pais'] == 'M√©xico'][['pais', 'tasa_reciclaje_pct', 'disposicion_inadecuada_pct']])
print(f"\nTotal de pa√≠ses en el dataset: {len(df)}")

      pais  tasa_reciclaje_pct  disposicion_inadecuada_pct
18  M√©xico                 9.3                        21.0

Total de pa√≠ses en el dataset: 19


 ---
## Sesi√≥n 2 ‚Äî Base de Datos SQL Completa
**Fecha:** Febrero 2026
**Objetivo:** Crear las 6 tablas relacionales y cargar todos los datos

### Conceptos SQL de hoy:
- `CREATE TABLE` ‚Äî crear una tabla con sus columnas y tipos de datos
- `INSERT INTO` ‚Äî agregar filas a una tabla
- `FOREIGN KEY` ‚Äî relacionar tablas entre s√≠
- `JOIN` ‚Äî cruzar datos de dos tablas

In [11]:
# ============================================================
# SESI√ìN 2: BASE DE DATOS SQL COMPLETA
# ============================================================
# En la Sesi√≥n 1 usamos :memory: ‚Äî los datos viv√≠an en RAM
# Hoy creamos un archivo .db real que persiste
# ============================================================

import sqlite3
import pandas as pd

# Crear conexi√≥n a archivo real
conn = sqlite3.connect('waste_management.db')
cursor = conn.cursor()

print("‚úÖ Base de datos 'waste_management.db' creada")
print("   Esta base de datos se guarda como archivo")
print("   La encontrar√°s en el panel de archivos de Colab üìÅ")

‚úÖ Base de datos 'waste_management.db' creada
   Esta base de datos se guarda como archivo
   La encontrar√°s en el panel de archivos de Colab üìÅ


In [12]:
# ============================================================
# CREAR LAS 6 TABLAS
# ============================================================
# CREATE TABLE = definir la estructura de una tabla
# Es como dise√±ar las columnas de una hoja de Excel
# pero con tipos de datos estrictos
#
# Tipos de datos en SQLite:
#   INTEGER  ‚Üí n√∫meros enteros (1, 2, 100)
#   REAL     ‚Üí n√∫meros decimales (9.3, 415.0)
#   TEXT     ‚Üí texto ("M√©xico", "Europa")
#   PRIMARY KEY ‚Üí identificador √∫nico de cada fila
#   REFERENCES  ‚Üí relaci√≥n con otra tabla (FOREIGN KEY)
# ============================================================

# Eliminar tablas si ya existen (para empezar limpio)
cursor.executescript("""
    DROP TABLE IF EXISTS indicadores_ec;
    DROP TABLE IF EXISTS composicion_residuos;
    DROP TABLE IF EXISTS disposicion_residuos;
    DROP TABLE IF EXISTS generacion_residuos;
    DROP TABLE IF EXISTS empresa_referencia;
    DROP TABLE IF EXISTS paises;
""")

# TABLA 1: Pa√≠ses
cursor.execute("""
CREATE TABLE paises (
    pais_id          INTEGER PRIMARY KEY,
    codigo_iso       TEXT NOT NULL,
    nombre           TEXT NOT NULL,
    region           TEXT NOT NULL,
    subregion        TEXT,
    poblacion_m      REAL,
    pib_per_capita   REAL
)
""")

# TABLA 2: Generaci√≥n de residuos por a√±o
cursor.execute("""
CREATE TABLE generacion_residuos (
    gen_id           INTEGER PRIMARY KEY,
    pais_id          INTEGER REFERENCES paises(pais_id),
    anio             INTEGER NOT NULL,
    total_kt         REAL,
    kg_per_capita    REAL,
    fuente           TEXT
)
""")

# TABLA 3: Disposici√≥n final
cursor.execute("""
CREATE TABLE disposicion_residuos (
    disp_id          INTEGER PRIMARY KEY,
    pais_id          INTEGER REFERENCES paises(pais_id),
    anio             INTEGER NOT NULL,
    operacion        TEXT NOT NULL,
    porcentaje       REAL,
    fuente           TEXT
)
""")

# TABLA 4: Composici√≥n de residuos
cursor.execute("""
CREATE TABLE composicion_residuos (
    comp_id          INTEGER PRIMARY KEY,
    pais_id          INTEGER REFERENCES paises(pais_id),
    anio             INTEGER NOT NULL,
    tipo_residuo     TEXT NOT NULL,
    porcentaje       REAL,
    fuente           TEXT
)
""")

# TABLA 5: Indicadores de econom√≠a circular
cursor.execute("""
CREATE TABLE indicadores_ec (
    ind_id                 INTEGER PRIMARY KEY,
    pais_id                INTEGER REFERENCES paises(pais_id),
    anio                   INTEGER NOT NULL,
    tasa_reciclaje_pct     REAL,
    tasa_compostaje_pct    REAL,
    tasa_recuperacion_pct  REAL,
    meta_2030_pct          REAL,
    fuente                 TEXT
)
""")

# TABLA 6: Empresa de referencia (Capa 3)
cursor.execute("""
CREATE TABLE empresa_referencia (
    emp_id                  INTEGER PRIMARY KEY,
    nombre                  TEXT,
    estado                  TEXT,
    tipo_residuo_principal  TEXT,
    volumen_anual_t         REAL,
    porcentaje_reciclado    REAL,
    certificaciones         TEXT,
    anio_dato               INTEGER
)
""")

conn.commit()
print("‚úÖ 6 tablas creadas exitosamente:")
print("   1. paises")
print("   2. generacion_residuos")
print("   3. disposicion_residuos")
print("   4. composicion_residuos")
print("   5. indicadores_ec")
print("   6. empresa_referencia")

‚úÖ 6 tablas creadas exitosamente:
   1. paises
   2. generacion_residuos
   3. disposicion_residuos
   4. composicion_residuos
   5. indicadores_ec
   6. empresa_referencia


‚úÖ Datos cargados en todas las tablas:
   paises:               19 registros
   generacion_residuos:  19 registros
   disposicion_residuos: 76 registros
   indicadores_ec:       19 registros
   empresa_referencia:   1 registro


In [15]:
# ============================================================
# TU PRIMER JOIN
# ============================================================
# Sin JOIN solo puedes ver pais_id (n√∫mero), no el nombre
# Con JOIN cruzas las tablas y ves nombre + datos juntos
#
# INNER JOIN = solo filas que existen en AMBAS tablas
# ON = la columna que conecta las dos tablas
# ============================================================

query_join1 = """
SELECT p.nombre,
       p.region,
       g.kg_per_capita,
       g.fuente
FROM generacion_residuos g
INNER JOIN paises p ON g.pais_id = p.pais_id
ORDER BY g.kg_per_capita DESC
"""

resultado = pd.read_sql_query(query_join1, conn)
print("JOIN 1: Generaci√≥n per c√°pita con nombre de pa√≠s")
print("="*55)
print(resultado.to_string(index=False))

JOIN 1: Generaci√≥n per c√°pita con nombre de pa√≠s
      nombre         region  kg_per_capita        fuente
   Dinamarca         Europa            844      EUROSTAT
    Alemania         Europa            632      EUROSTAT
      Italia         Europa            591      EUROSTAT
     Austria         Europa            560      EUROSTAT
     Francia         Europa            541      EUROSTAT
      Grecia         Europa            533      EUROSTAT
      Espa√±a         Europa            530      EUROSTAT
Pa√≠ses Bajos         Europa            527      EUROSTAT
    Portugal         Europa            516      EUROSTAT
     B√©lgica         Europa            505      EUROSTAT
      M√©xico         M√©xico            415 SEMARNAT 2021
       Chile Am√©rica Latina            395      BID 2022
      Brasil Am√©rica Latina            379      BID 2022
    Bulgaria         Europa            365      EUROSTAT
   Argentina Am√©rica Latina            359      BID 2022
     Polonia         Europa 

In [16]:
# ============================================================
# JOIN ANAL√çTICO: M√©xico vs promedio europeo
# ============================================================
# Esta query responde la pregunta 3 del proyecto:
# ¬øCu√°nto residuo genera M√©xico vs Europa?

query_join3 = """
SELECT
    p.nombre,
    p.region,
    g.kg_per_capita,
    i.tasa_reciclaje_pct,
    ROUND(i.meta_2030_pct - i.tasa_reciclaje_pct, 1) AS gap_meta_2030
FROM paises p
INNER JOIN generacion_residuos g ON p.pais_id = g.pais_id
INNER JOIN indicadores_ec i ON p.pais_id = i.pais_id
WHERE p.nombre IN ('M√©xico', 'Alemania', 'Espa√±a', 'Polonia', 'Brasil')
ORDER BY i.tasa_reciclaje_pct DESC
"""

resultado3 = pd.read_sql_query(query_join3, conn)
print("JOIN 3: M√©xico vs pa√≠ses de referencia")
print("="*65)
print(resultado3.to_string(index=False))
print("\n‚Üí gap_meta_2030 = cu√°ntos puntos le falta a cada pa√≠s para su meta")

JOIN 3: M√©xico vs pa√≠ses de referencia
  nombre         region  kg_per_capita  tasa_reciclaje_pct  gap_meta_2030
Alemania         Europa            632                67.3            2.7
  Espa√±a         Europa            530                35.7           34.3
 Polonia         Europa            358                35.5           34.5
  M√©xico         M√©xico            415                 9.3           20.7
  Brasil Am√©rica Latina            379                 4.0           21.0

‚Üí gap_meta_2030 = cu√°ntos puntos le falta a cada pa√≠s para su meta


In [17]:
# ============================================================
# GUARDAR Y CERRAR LA BASE DE DATOS
# ============================================================

conn.commit()
conn.close()
print("‚úÖ Base de datos guardada: waste_management.db")
print("\nüìä RESUMEN SESI√ìN 2:")
print("   ‚Ä¢ 6 tablas creadas con relaciones entre ellas")
print("   ‚Ä¢ 134 registros cargados en total")
print("   ‚Ä¢ 3 JOINs completados ‚Äî cruzando hasta 3 tablas")
print("\nüí° INSIGHT CLAVE:")
print("   Polonia genera MENOS residuos que M√©xico (358 vs 415 kg)")
print("   pero recicla casi 4x m√°s (35.5% vs 9.3%)")
print("   ‚Üí Polonia es el benchmark realista para M√©xico, no Alemania")

‚úÖ Base de datos guardada: waste_management.db

üìä RESUMEN SESI√ìN 2:
   ‚Ä¢ 6 tablas creadas con relaciones entre ellas
   ‚Ä¢ 134 registros cargados en total
   ‚Ä¢ 3 JOINs completados ‚Äî cruzando hasta 3 tablas

üí° INSIGHT CLAVE:
   Polonia genera MENOS residuos que M√©xico (358 vs 415 kg)
   pero recicla casi 4x m√°s (35.5% vs 9.3%)
   ‚Üí Polonia es el benchmark realista para M√©xico, no Alemania
