# üìä Gu√≠a Pr√°ctica 1 - An√°lisis de Compras P√∫blicas (Ecuador)
**Autor:** Wendy Llivichuzhca

Esta notebook documenta y ejecuta las visualizaciones de datos de compras p√∫blicas del Ecuador.
Aqu√≠ aprender√°s a:
- Cargar datos desde la API de Compras P√∫blicas.
- Preprocesar y limpiar los datos.
- Visualizar estad√≠sticas descriptivas.
- Crear gr√°ficos interactivos con Plotly.
- Exportar los datos filtrados.

Esta notebook est√° dise√±ada como un **tutorial paso a paso**, para que puedas modificar y experimentar con los filtros y an√°lisis.

In [None]:
# -----------------------------
# 0Ô∏è‚É£ Librer√≠as necesarias
# -----------------------------
import pandas as pd
import requests
import plotly.express as px
from datetime import datetime
from IPython.display import display
from ipywidgets import interact, widgets

## 1Ô∏è‚É£ Configuraci√≥n de filtros
Aqu√≠ definimos los valores posibles para los filtros: a√±o, provincia, tipo de contrataci√≥n y palabra clave. Puedes modificarlos directamente o usar los widgets interactivos m√°s abajo.

In [None]:
# Valores posibles para filtros
a√±os = [str(a) for a in range(2015, 2026)]
provincias = ["Todos", "AZUAY", "BOL√çVAR", "CA√ëAR", "CARCHI", "CHIMBORAZO", "COTOPAXI",
              "EL ORO", "ESMERALDAS", "GAL√ÅPAGOS", "GUAYAS", "IMBABURA", "LOJA", "LOS R√çOS",
              "MANAB√ç", "MORONA SANTIAGO", "NAPO", "ORELLANA", "PASTAZA", "PICHINCHA",
              "SANTA ELENA", "SANTO DOMINGO DE LOS TS√ÅCHILAS", "SUCUMB√çOS", "TUNGURAHUA",
              "ZAMORA CHINCHIPE"]
tipos_contratacion = ["Todos", "Subasta Inversa Electr√≥nica", "Menor Cuant√≠a", "Cotizaci√≥n",
                      "Contrataci√≥n directa", "Licitaci√≥n", "Cat√°logo electr√≥nico", "Bienes y Servicios √∫nicos"]

# Valores por defecto
anio = '2022'
provincia = 'Todos'
tipo = 'Todos'
palabra = ''

### üéõÔ∏è Filtros interactivos (opcional)
Si deseas seleccionar filtros sin editar el c√≥digo, puedes usar los widgets interactivos.

In [None]:
def seleccionar_filtros():
    a = widgets.Dropdown(options=a√±os, value='2022', description='A√±o:')
    p = widgets.Dropdown(options=provincias, value='Todos', description='Provincia:')
    t = widgets.Dropdown(options=tipos_contratacion, value='Todos', description='Tipo:')
    k = widgets.Text(value='', description='Palabra:')
    return a, p, t, k

anio_widget, provincia_widget, tipo_widget, palabra_widget = seleccionar_filtros()
display(anio_widget, provincia_widget, tipo_widget, palabra_widget)

## 2Ô∏è‚É£ Funci√≥n para cargar datos desde la API
Esta funci√≥n hace la solicitud a la API de Compras P√∫blicas usando los filtros seleccionados y devuelve un DataFrame limpio.

In [None]:
def cargar_datos(year, region, tipo, palabra):
    """Carga datos de la API de Compras P√∫blicas con filtros"""
    url = "https://datosabiertos.compraspublicas.gob.ec/PLATAFORMA/api/get_analysis"
    params = {
        "year": year,
        "region": None if region == "Todos" else region,
        "type": None if tipo == "Todos" else tipo,
        "keyword": palabra if palabra else None
    }
    resp = requests.get(url, params=params)
    if resp.status_code != 200:
        print("‚ùå Error al consultar la API")
        return pd.DataFrame()
    data = resp.json()
    if not data:
        print("‚ö†Ô∏è No se encontraron datos con estos filtros")
        return pd.DataFrame()
    df = pd.DataFrame(data)
    return df

## 3Ô∏è‚É£ Carga y preprocesamiento de datos
Se realiza limpieza, renombrado de columnas, conversi√≥n de tipos y creaci√≥n de nuevas columnas para an√°lisis por mes y a√±o.

In [None]:
# Usar valores de widgets si se desea
anio = anio_widget.value
provincia = provincia_widget.value
tipo = tipo_widget.value
palabra = palabra_widget.value

df = cargar_datos(anio, provincia, tipo, palabra)

if df.empty:
    print("‚ö†Ô∏è No hay datos para los filtros seleccionados")
else:
    rename_map = {"province": "region", "type": "internal_type", "amount": "total", "date": "date"}
    df.rename(columns={k:v for k,v in rename_map.items() if k in df.columns}, inplace=True)

    if 'total' in df.columns:
        df['total'] = pd.to_numeric(df['total'], errors='coerce')
    if 'date' in df.columns:
        df['date'] = pd.to_datetime(df['date'], errors='coerce')
        df['month'] = df['date'].dt.month
        df['year'] = df['date'].dt.year

    df.drop_duplicates(inplace=True)
    df.dropna(subset=['total'], inplace=True)

    display(df.head())

## 4Ô∏è‚É£ M√©tricas generales
Calculamos total de registros, monto total y promedio, y mostramos un resumen estad√≠stico.

In [None]:
if not df.empty:
    total_registros = len(df)
    monto_total = df['total'].sum()
    monto_promedio = df['total'].mean()

    print(f"Total de registros: {total_registros}")
    print(f"Monto total: ${monto_total:,.2f}")
    print(f"Monto promedio: ${monto_promedio:,.2f}")

    display(df.describe())

## 5Ô∏è‚É£ Visualizaciones Interactivas con Plotly
Se crean gr√°ficos de barras, l√≠nea y pastel para analizar montos totales, evoluci√≥n mensual y proporci√≥n de contratos.

In [None]:
# a) Monto total por tipo de contrataci√≥n
if {'internal_type','total'}.issubset(df.columns):
    df_tipo = df.groupby('internal_type')['total'].sum().reset_index()
    fig1 = px.bar(df_tipo, x='internal_type', y='total',
                  title='Monto total por tipo de contrataci√≥n',
                  color_discrete_sequence=['#36BF8D'])
    fig1.show()

In [None]:
# b) Evoluci√≥n mensual de montos
if {'month','total'}.issubset(df.columns):
    df_mes = df.groupby('month')['total'].sum().reset_index()
    fig2 = px.line(df_mes, x='month', y='total',
                   title='Evoluci√≥n mensual de montos totales',
                   markers=True, color_discrete_sequence=['#36BF8D'])
    fig2.show()

In [None]:
# c) Barras apiladas tipo √ó mes
if {'month','internal_type','total'}.issubset(df.columns):
    df_tipo_mes = df.groupby(['month','internal_type'])['total'].sum().reset_index()
    fig3 = px.bar(df_tipo_mes, x='month', y='total', color='internal_type', barmode='stack',
                  title='Monto total por tipo de contrataci√≥n y mes')
    fig3.show()

In [None]:
# d) Proporci√≥n de contratos
if 'internal_type' in df.columns:
    fig4 = px.pie(df, names='internal_type',
                  title='Proporci√≥n de contratos por tipo de contrataci√≥n',
                  color_discrete_sequence=px.colors.sequential.Greens)
    fig4.show()

In [None]:
# e) Montos totales por tipo de contrataci√≥n por a√±o
if {'year','internal_type','total'}.issubset(df.columns):
    df_year = df.groupby(['year','internal_type'])['total'].sum().reset_index()
    fig5 = px.bar(df_year, x='year', y='total', color='internal_type', barmode='stack',
                  title='Montos totales por tipo de contrataci√≥n por a√±o')
    fig5.show()

## 6Ô∏è‚É£ Exportaci√≥n de datos
Puedes exportar los datos filtrados a CSV para an√°lisis externo.

In [None]:
if not df.empty:
    filename = f"compras_publicas_{anio}.csv"
    df.to_csv(filename, index=False, encoding='utf-8')
    print(f"‚úÖ Datos exportados a {filename}")

## 7Ô∏è‚É£ Conclusiones
- Los tipos de contrataci√≥n m√°s utilizados se destacan en los gr√°ficos.
- Se observan variaciones mensuales de los montos.
- La relaci√≥n entre monto y n√∫mero de contratos evidencia concentraci√≥n de gasto.
- La descarga de datos permite an√°lisis m√°s profundo fuera de la notebook.
- Esta notebook facilita la comprensi√≥n visual y anal√≠tica de la gesti√≥n de compras p√∫blicas en Ecuador.