### **Solución Detallada: Optimización de Consultas SQL para Empresa de Logística**

In [1]:
# %% [markdown]
# # Optimización de Consultas SQL para Empresa de Logística
# ### Caso de Uso: Base de datos de envíos (RDBMS)
# **Herramientas:**
# - Python 3.8+
# - SQLAlchemy (para conexión a MySQL/PostgreSQL)
# - pandas (para análisis de resultados)
# - `EXPLAIN ANALYZE` (opcional, desde el cliente SQL directamente)

# %% [markdown]
# ## 1. Conexión a la Base de Datos
from sqlalchemy import create_engine
import pandas as pd

# Reemplaza con tus credenciales
engine = create_engine('mysql+pymysql://usuario:contraseña@localhost:3306/logistica_db')

# %% [markdown]
# ## 2. Consultas Originales (Problemas)
original_queries = {
    "q1": "SELECT * FROM envios WHERE estado = 'Entregado';",
    "q2": "SELECT * FROM envios WHERE YEAR(fecha_creacion) = 2023;",
    "q3": "SELECT e.id_envio, c.nombre FROM envios e JOIN clientes c ON e.id_cliente = c.id_cliente;"
}

# Ejecutar una consulta de ejemplo (q1) y medir tiempo
%time df_q1 = pd.read_sql(original_queries["q1"], engine)
print(f"Filas recuperadas: {len(df_q1)}")

# %% [markdown]
# ## 3. Optimizaciones Aplicadas
# ### 3.1. Creación de Índices
with engine.connect() as conn:
    conn.execute("CREATE INDEX IF NOT EXISTS idx_envios_estado ON envios(estado);")
    conn.execute("CREATE INDEX IF NOT EXISTS idx_clientes_id ON clientes(id_cliente);")
    conn.execute("CREATE INDEX IF NOT EXISTS idx_fecha_creacion_desc ON envios(fecha_creacion DESC);")

# %% [markdown]
# ### 3.2. Consultas Optimizadas
optimized_queries = {
    "q1_opt": "SELECT id_envio, estado FROM envios WHERE estado = 'Entregado';",
    "q2_opt": """
        SELECT * FROM envios
        WHERE fecha_creacion >= '2023-01-01' AND fecha_creacion < '2024-01-01';
    """,
    "q3_opt": """
        SELECT e.id_envio, c.nombre
        FROM envios e USE INDEX (idx_envios_estado)
        JOIN clientes c USE INDEX (idx_clientes_id)
        ON e.id_cliente = c.id_cliente;
    """
}

# Ejecutar consulta optimizada (q1_opt)
%time df_q1_opt = pd.read_sql(optimized_queries["q1_opt"], engine)
print(f"Filas recuperadas (optimizada): {len(df_q1_opt)}")

# %% [markdown]
# ## 4. Análisis de Rendimiento
# ### 4.1. Comparación de Tiempos
results = []
for q_name, q_sql in original_queries.items():
    start_time = %timeit -o -q pd.read_sql(q_sql, engine)
    results.append({"Consulta": q_name, "Tipo": "Original", "Tiempo (ms)": start_time.best * 1000})

for q_name, q_sql in optimized_queries.items():
    start_time = %timeit -o -q pd.read_sql(q_sql, engine)
    results.append({"Consulta": q_name, "Tipo": "Optimizada", "Tiempo (ms)": start_time.best * 1000})

df_results = pd.DataFrame(results)
print(df_results.pivot(index="Consulta", columns="Tipo", values="Tiempo (ms)"))

# %% [markdown]
# ### 4.2. Uso de `EXPLAIN ANALYZE` (Opcional)
# Ejecutar en el cliente SQL directamente:
explain_query = """
EXPLAIN ANALYZE
SELECT e.id_envio, c.nombre FROM envios e JOIN clientes c ON e.id_cliente = c.id_cliente;
"""
df_explain = pd.read_sql(explain_query, engine)
print(df_explain.iloc[0]["EXPLAIN ANALYZE"])

# %% [markdown]
# ## 5. Exportar Resultados
df_results.to_csv("resultados_optimizacion.csv", index=False)
print("¡Análisis exportado a 'resultados_optimizacion.csv'!")

OperationalError: (pymysql.err.OperationalError) (2003, "Can't connect to MySQL server on 'localhost' ([WinError 10061] No se puede establecer una conexión ya que el equipo de destino denegó expresamente dicha conexión)")
(Background on this error at: https://sqlalche.me/e/20/e3q8)

NameError: name 'df_q1' is not defined