# Ejercicio 1: Importación, limpieza, transformación y exportación de datos (base Chinook)

## Importación

In [None]:
from sqlalchemy import create_engine, text
import pandas as pd

# Conexión a la base de datos Chinook
engine = create_engine("mysql+pymysql://root:1234@localhost:3307/chinook")

# Consultamos las tablas relevantes
df_customers = pd.read_sql("SELECT CustomerId, FirstName, LastName, Country FROM Customer", engine)
df_invoices = pd.read_sql("SELECT InvoiceId, CustomerId, Total, BillingCountry, InvoiceDate FROM Invoice", engine)
df_customers.head()

## Limpieza de datos

In [None]:
# Limpieza de datos
print("Duplicados (clientes):", df_customers.duplicated().sum())
print("Nulos (clientes):\n", df_customers.isnull().sum())
df_customers = df_customers.drop_duplicates()

print("Duplicados (facturas):", df_invoices.duplicated().sum())
print("Nulos (facturas):\n", df_invoices.isnull().sum())
df_invoices = df_invoices.drop_duplicates()

## Transformación de datos

In [None]:
# Transformación de datos
df_country_sales = df_invoices.groupby("BillingCountry")["Total"].sum().reset_index()
df_country_sales.columns = ["País", "TotalFacturado"]
df_country_sales = df_country_sales.sort_values("TotalFacturado", ascending=False)
df_country_sales.head()

## Exportación

In [None]:
# Exportación a tabla temporal
df_country_sales.to_sql("ventas_pais_temp", con=engine, if_exists="replace", index=False)
print("Exportación completada: 'ventas_pais_temp'")

# Ejercicio 2: Importación, limpieza, transformación y exportación desde API

## Importación

In [None]:
import requests

# API de Open-Meteo para Veracruz
lat, lon = 19.5, -96.9
url = f"https://api.open-meteo.com/v1/forecast?latitude={lat}&longitude={lon}&current_weather=true&hourly=temperature_2m"
resp = requests.get(url).json()

df_weather = pd.DataFrame({
    "time": resp["hourly"]["time"],
    "temp_C": resp["hourly"]["temperature_2m"]
})
df_weather.head()

## Limpieza de datos

In [None]:
# Limpieza de datos
print("Duplicados (weather):", df_weather.duplicated().sum())
print("Nulos (weather):\n", df_weather.isnull().sum())
df_weather = df_weather.drop_duplicates().dropna()

## Transformación

In [None]:
# Transformación: clasificar clima
df_weather["time"] = pd.to_datetime(df_weather["time"])

def clasificar_temp(temp):
    if temp < 15:
        return "Frío"
    elif temp < 25:
        return "Templado"
    else:
        return "Caluroso"

df_weather["clima_categoria"] = df_weather["temp_C"].apply(clasificar_temp)
df_weather.head()

## Exportación

In [None]:
# Exportación a tabla temporal
df_weather.to_sql("weather_temp", engine, if_exists="replace", index=False)
print("Datos del clima exportados a 'weather_temp'.")