<a href="https://colab.research.google.com/github/lucacamus13/dashboard-ARG/blob/main/inflaci%C3%B3n_ARG.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install streamlit




In [1]:
import pandas as pd
import requests
from io import BytesIO
from datetime import datetime

# Inflación

In [2]:
import pandas as pd
import requests
from io import BytesIO
from datetime import datetime

def obtener_datos_indec_completo():
    """
    Lee las 3 hojas principales del Excel del INDEC:
    - Hoja 0: Variación mensual
    - Hoja 1: Variación interanual
    - Hoja 2: Índices IPC
    """
    url = "https://www.indec.gob.ar/ftp/cuadros/economia/sh_ipc_07_25.xls"

    try:
        print(f"Descargando Excel desde: {url}")

        response = requests.get(url, timeout=30)
        response.raise_for_status()

        print(f"✓ Archivo descargado: {len(response.content)} bytes")

        # Leer las 3 hojas principales
        hojas_datos = {}
        nombres_hojas = [
            'Variación mensual IPC Nacional',
            'Var. interanual IPC Nacional',
            'Índices IPC Cobertura Nacional'
        ]

        for i, nombre in enumerate(nombres_hojas):
            try:
                df = pd.read_excel(BytesIO(response.content), sheet_name=i, engine='xlrd')
                hojas_datos[nombre] = df
                print(f"✓ Hoja {i} '{nombre}': {len(df)} filas x {len(df.columns)} columnas")
            except Exception as e:
                print(f"❌ Error leyendo hoja {i}: {e}")

        return hojas_datos

    except Exception as e:
        print(f"❌ Error: {e}")
        return {}

def extraer_nivel_general_de_hoja(df, nombre_hoja):
    """
    Extrae datos de 'Nivel general' de cualquier hoja
    """
    if df.empty:
        return pd.DataFrame()

    print(f"\n=== PROCESANDO {nombre_hoja.upper()} ===")

    # Buscar fila con fechas
    fila_fechas = None
    for i, fila in df.iterrows():
        fechas_count = sum(1 for val in fila if isinstance(val, datetime))
        if fechas_count > 10:
            fila_fechas = i
            break

    # Buscar fila "Nivel general"
    fila_nivel_general = None
    for i, fila in df.iterrows():
        if pd.notna(fila.iloc[0]) and str(fila.iloc[0]).strip() == 'Nivel general':
            fila_nivel_general = i
            break

    if fila_fechas is None or fila_nivel_general is None:
        print(f"❌ No se encontraron datos en {nombre_hoja}")
        return pd.DataFrame()

    print(f"✓ Fechas en fila {fila_fechas}, Nivel general en fila {fila_nivel_general}")

    # Extraer fechas y valores
    fechas = df.iloc[fila_fechas].values[1:]  # Saltar primera columna
    valores = df.iloc[fila_nivel_general].values[1:]  # Saltar primera columna

    # Crear DataFrame
    datos = []
    for fecha, valor in zip(fechas, valores):
        if pd.notna(fecha) and pd.notna(valor) and isinstance(fecha, datetime):
            datos.append({
                'fecha': fecha,
                'valor': float(valor)
            })

    if datos:
        df_resultado = pd.DataFrame(datos).sort_values('fecha').reset_index(drop=True)
        print(f"✓ {len(df_resultado)} registros extraídos")
        return df_resultado

    return pd.DataFrame()

def combinar_datos_inflacion(hojas_datos):
    """
    Combina datos de las 3 hojas en un DataFrame completo
    """
    print("\n=== COMBINANDO DATOS DE LAS 3 HOJAS ===")

    # Extraer datos de cada hoja
    datos_combinados = {}

    # Hoja 0: Variación mensual
    if 'Variación mensual IPC Nacional' in hojas_datos:
        df_mensual = extraer_nivel_general_de_hoja(
            hojas_datos['Variación mensual IPC Nacional'],
            'Variación mensual'
        )
        if not df_mensual.empty:
            datos_combinados['variacion_mensual'] = df_mensual.set_index('fecha')['valor']

    # Hoja 1: Variación interanual
    if 'Var. interanual IPC Nacional' in hojas_datos:
        df_interanual = extraer_nivel_general_de_hoja(
            hojas_datos['Var. interanual IPC Nacional'],
            'Variación interanual'
        )
        if not df_interanual.empty:
            datos_combinados['variacion_interanual'] = df_interanual.set_index('fecha')['valor']

    # Hoja 2: Índices IPC
    if 'Índices IPC Cobertura Nacional' in hojas_datos:
        df_indices = extraer_nivel_general_de_hoja(
            hojas_datos['Índices IPC Cobertura Nacional'],
            'Índices IPC'
        )
        if not df_indices.empty:
            datos_combinados['ipc_indice'] = df_indices.set_index('fecha')['valor']

    if not datos_combinados:
        print("❌ No se pudieron extraer datos de ninguna hoja")
        return pd.DataFrame()

    # Combinar todos los datos
    df_final = pd.DataFrame(datos_combinados)
    df_final = df_final.reset_index()

    # Rellenar valores faltantes si es necesario
    df_final = df_final.dropna(subset=['fecha'])

    print(f"✓ DataFrame final: {len(df_final)} registros")
    print(f"✓ Columnas: {list(df_final.columns)}")

    return df_final

def actualizar_inflacion_completa():
    """
    Función principal que obtiene datos completos de inflación
    """
    print("=== OBTENIENDO DATOS COMPLETOS DE INFLACIÓN DEL INDEC ===")

    # Descargar y leer todas las hojas
    hojas_datos = obtener_datos_indec_completo()

    if not hojas_datos:
        return None

    # Combinar datos de las 3 hojas
    df_completo = combinar_datos_inflacion(hojas_datos)

    if df_completo.empty:
        print("❌ No se pudieron procesar los datos")
        return None

    # Guardar datos
    df_completo.to_csv("inflacion_argentina_completa.csv", index=False)
    print(f"\n✅ ÉXITO: Datos completos guardados en 'inflacion_argentina_completa.csv'")

    # Mostrar resumen
    mostrar_resumen_completo(df_completo)

    return df_completo

def mostrar_resumen_completo(df):
    """
    Mostrar resumen completo de los datos
    """
    if df is None or df.empty:
        return

    print(f"\n=== RESUMEN COMPLETO DE INFLACIÓN ===")
    print(f"Total registros: {len(df)}")
    print(f"Período: {df['fecha'].min().strftime('%Y-%m')} a {df['fecha'].max().strftime('%Y-%m')}")
    print(f"Columnas disponibles: {list(df.columns)}")

    # Mostrar datos de las columnas disponibles
    columnas_numericas = [col for col in df.columns if col != 'fecha']

    for col in columnas_numericas:
        if col in df.columns and df[col].notna().any():
            print(f"\n{col.upper()}:")
            print(f"  Promedio: {df[col].mean():.2f}")
            print(f"  Máximo: {df[col].max():.2f}")
            print(f"  Mínimo: {df[col].min():.2f}")

    # Últimos 6 meses
    print(f"\n=== ÚLTIMOS 6 MESES ===")
    ultimos = df.tail(6)

    for _, row in ultimos.iterrows():
        fecha = row['fecha'].strftime('%Y-%m')
        linea = f"{fecha}:"

        if 'variacion_mensual' in df.columns and pd.notna(row.get('variacion_mensual')):
            linea += f" {row['variacion_mensual']:+.1f}% mensual"

        if 'variacion_interanual' in df.columns and pd.notna(row.get('variacion_interanual')):
            linea += f" | {row['variacion_interanual']:+.1f}% anual"

        if 'ipc_indice' in df.columns and pd.notna(row.get('ipc_indice')):
            linea += f" | IPC: {row['ipc_indice']:.1f}"

        print(linea)

def obtener_solo_variacion_mensual():
    """
    Función simple para obtener solo variaciones mensuales (más rápida)
    """
    hojas_datos = obtener_datos_indec_completo()

    if 'Variación mensual IPC Nacional' in hojas_datos:
        df_mensual = extraer_nivel_general_de_hoja(
            hojas_datos['Variación mensual IPC Nacional'],
            'Variación mensual'
        )
        if not df_mensual.empty:
            df_mensual.columns = ['fecha', 'variacion_mensual']
            return df_mensual

    return pd.DataFrame()

def obtener_solo_indices():
    """
    Función simple para obtener solo índices IPC
    """
    hojas_datos = obtener_datos_indec_completo()

    if 'Índices IPC Cobertura Nacional' in hojas_datos:
        df_indices = extraer_nivel_general_de_hoja(
            hojas_datos['Índices IPC Cobertura Nacional'],
            'Índices IPC'
        )
        if not df_indices.empty:
            df_indices.columns = ['fecha', 'ipc_indice']
            return df_indices

    return pd.DataFrame()

# Ejecutar
if __name__ == "__main__":
    # Opción completa (todas las hojas)
    df_completo = actualizar_inflacion_completa()

    if df_completo is not None:
        print(f"\n✅ DATOS DISPONIBLES:")
        print("  DataFrame completo: inflacion_argentina_completa.csv")
        print("\n🔧 USO EN CÓDIGO:")
        print("  # Datos completos")
        print("  df = pd.read_csv('inflacion_argentina_completa.csv')")
        print("\n  # O usar funciones específicas:")
        print("  from indec_scraper import obtener_solo_variacion_mensual")
        print("  df_mensual = obtener_solo_variacion_mensual()")

=== OBTENIENDO DATOS COMPLETOS DE INFLACIÓN DEL INDEC ===
Descargando Excel desde: https://www.indec.gob.ar/ftp/cuadros/economia/sh_ipc_07_25.xls
✓ Archivo descargado: 2283520 bytes
✓ Hoja 0 'Variación mensual IPC Nacional': 215 filas x 103 columnas
✓ Hoja 1 'Var. interanual IPC Nacional': 215 filas x 92 columnas
✓ Hoja 2 'Índices IPC Cobertura Nacional': 215 filas x 104 columnas

=== COMBINANDO DATOS DE LAS 3 HOJAS ===

=== PROCESANDO VARIACIÓN MENSUAL ===
✓ Fechas en fila 4, Nivel general en fila 8
✓ 102 registros extraídos

=== PROCESANDO VARIACIÓN INTERANUAL ===
✓ Fechas en fila 4, Nivel general en fila 8
✓ 91 registros extraídos

=== PROCESANDO ÍNDICES IPC ===
✓ Fechas en fila 4, Nivel general en fila 8
✓ 103 registros extraídos
✓ DataFrame final: 103 registros
✓ Columnas: ['fecha', 'variacion_mensual', 'variacion_interanual', 'ipc_indice']

✅ ÉXITO: Datos completos guardados en 'inflacion_argentina_completa.csv'

=== RESUMEN COMPLETO DE INFLACIÓN ===
Total registros: 103
Período:

In [3]:
import plotly.graph_objects as go
import pandas as pd

# Asegurarse de que la columna 'fecha' sea de tipo datetime
df_completo['fecha'] = pd.to_datetime(df_completo['fecha'])

# Crear el gráfico de Plotly
fig = go.Figure()

# Agregar la serie de Variación Interanual (línea) - Cambiado a naranja y con zorder
fig.add_trace(go.Scatter(
    x=df_completo['fecha'],
    y=df_completo['variacion_interanual'],
    mode='lines+markers',
    name='Variación Interanual',
    yaxis='y1', # Asociar al eje Y primario
    line=dict(color='orange'), # Color de la línea naranja
    marker=dict(color='orange'), # Color de los marcadores naranja
    zorder=2 # Asegurar que la línea esté adelante (zorder mayor)
))

# Agregar la serie de Variación Mensual (barras) - Cambiado a azul y con zorder
fig.add_trace(go.Bar(
    x=df_completo['fecha'],
    y=df_completo['variacion_mensual'],
    name='Variación Mensual',
    yaxis='y2', # Asociar al eje Y secundario
    marker=dict(color='blue', opacity=0.7), # Color de las barras azules con opacidad
    zorder=1 # Asegurar que las barras estén atrás (zorder menor)
))

# Configurar los ejes y el diseño - Colores de texto en negro y eliminar grilla
fig.update_layout(
    title=dict(
        text='Variación de la Inflación en Argentina (Nivel General) - Interactivo',
        x=0.5,  # Centrar el título (0.5 es el centro horizontal)
        xanchor='center' # Anclar el centro del título al centro horizontal
    ),
    xaxis=dict(
        title='Fecha',
        titlefont=dict(color='black'), # Título del eje X en negro
        tickfont=dict(color='black'), # Etiquetas del eje X en negro
        showgrid=False # Eliminar grilla del eje X
    ),
    yaxis=dict(
        title='Variación Interanual (%)',
        titlefont=dict(color='black'), # Título del eje Y1 en negro
        tickfont=dict(color='black'), # Etiquetas del eje Y1 en negro
        showgrid=False # Eliminar grilla del eje Y1
    ),
    yaxis2=dict(
        title='Variación Mensual (%)',
        titlefont=dict(color='black'), # Título del eje Y2 en negro
        tickfont=dict(color='black'), # Etiquetas del eje Y2 en negro
        overlaying='y', # Superponer al eje Y primario
        side='right',    # Colocar en el lado derecho
        showgrid=False # Eliminar grilla del eje Y2
    ),
    legend=dict(
        x=0,
        y=1.0,
        bgcolor='rgba(255, 255, 255, 0)',
        bordercolor='rgba(255, 255, 255, 0)'
    ),
    hovermode='x unified', # Mostrar tooltip unificado al pasar el mouse
    plot_bgcolor='white', # Establecer el color de fondo del gráfico a blanco
    font=dict(family='Arial') # Establecer la fuente a Arial
)

# Mostrar el gráfico interactivo
fig.show()

# Tipo de Cambio

In [4]:
import yfinance as yf
import plotly.graph_objects as go
import pandas as pd
from datetime import datetime, timedelta

# Obtener datos del dólar blue en Argentina (ARS=X es el ticker para USD/ARS)
dolar_argentina = yf.Ticker("ARS=X")

# Obtener datos históricos de los últimos 30 días
historial = dolar_argentina.history(period="1y") # Changed period to "1y" for one year

# Asegurarse de que el índice sea de tipo datetime y renombrarlo
historial.index = pd.to_datetime(historial.index)
historial = historial.rename_axis('fecha')

# Crear el gráfico de Plotly
fig = go.Figure()

# Agregar la serie de cotización (barras)
fig.add_trace(go.Scatter( # Changed to go.Scatter
    x=historial.index,
    y=historial['Close'],
    mode='lines', # Changed mode to 'lines'
    name='Cotización del Dólar',
    line=dict(color='blue') # Set line color to blue
))

# Configurar los ejes y el diseño
fig.update_layout(
    title=dict(
        text='Cotización del Dólar Estadounidense frente al Peso Argentino (USD/ARS)\nÚltimo Año - Interactivo', # Updated title
        x=0.5,  # Centrar el título
        xanchor='center' # Anclar el centro del título
    ),
    xaxis=dict(
        title='Fecha',
        titlefont=dict(color='black'), # Título del eje X en negro
        tickfont=dict(color='black'), # Etiquetas del eje X en negro
        showgrid=False # Eliminar grilla del eje X
    ),
    yaxis=dict(
        title='Pesos Argentinos por 1 USD',
        titlefont=dict(color='black'), # Título del eje Y en negro
        tickfont=dict(color='black'), # Etiquetas del eje Y en negro
        showgrid=False # Eliminar grilla del eje Y
    ),
    legend=dict(
        x=0,
        y=1.0,
        bgcolor='rgba(255, 255, 255, 0)',
        bordercolor='rgba(255, 255, 255, 0)'
    ),
    hovermode='x unified', # Mostrar tooltip unificado
    plot_bgcolor='white', # Fondo blanco
    font=dict(family='Arial') # Fuente Arial
)

# Mostrar el gráfico interactivo
fig.show()

# Mostrar información adicional
if not historial.empty:
    ultimo_valor = historial['Close'].iloc[-1]
    ultima_fecha = historial.index[-1]
    print(f"Valor actual: ${ultimo_valor:.2f} ARS por 1 USD")
    print(f"Fecha de la última actualización: {ultima_fecha.strftime('%d-%m-%Y')}")

    if len(historial) > 1:
        variacion_porcentaje = ((ultimo_valor / historial['Close'].iloc[0]) - 1) * 100
        print(f"Variación en el período: {variacion_porcentaje:.2f}%")
    else:
        print("No hay suficientes datos para calcular la variación en el período.")
else:
    print("No se pudieron obtener datos del tipo de cambio.")

Valor actual: $1320.00 ARS por 1 USD
Fecha de la última actualización: 23-08-2025
Variación en el período: 39.83%


# Actividad

In [33]:
import pandas as pd
import requests
from io import BytesIO
from datetime import datetime
import numpy as np

def descargar_y_limpiar_emae():
    """
    Descarga y limpia los datos del EMAE desde el sitio del INDEC
    Estructura conocida: encabezados en fila 3, años en columna A, meses en columna B
    """
    url = "https://www.indec.gob.ar/ftp/cuadros/economia/sh_emae_mensual_base2004.xls"

    try:
        print("Descargando datos del EMAE...")
        response = requests.get(url, timeout=30)
        response.raise_for_status()

        print("Procesando archivo Excel...")
        # Leer el archivo Excel sin encabezados
        excel_data = pd.read_excel(BytesIO(response.content), engine='xlrd', header=None)

        print(f"Dimensiones del archivo: {excel_data.shape}")

        # Los encabezados están en la fila 3 (índice 2)
        encabezados_row = 2
        print(f"\nEncabezados en fila {encabezados_row + 1}:")
        for col in range(min(8, len(excel_data.columns))):
            val = excel_data.iloc[encabezados_row, col]
            if pd.notna(val):
                print(f"  Columna {col}: {val}")

        # Procesar los datos desde la fila 6 (índice 5)
        datos_procesados = []

        # Mapeo de nombres de meses
        meses = {
            'enero': 1, 'febrero': 2, 'marzo': 3, 'abril': 4,
            'mayo': 5, 'junio': 6, 'julio': 7, 'agosto': 8,
            'septiembre': 9, 'octubre': 10, 'noviembre': 11, 'diciembre': 12
        }

        print(f"\nProcesando datos desde la fila 6...")

        año_actual = None # Initialize year

        # Start from row 6 (index 5) as data starts from there
        for idx in range(5, len(excel_data)):
            row = excel_data.iloc[idx]

            # Columna A (índice 0): Año (may appear only on the first row of a year)
            # Columna B (índice 1): Mes
            año_val = row.iloc[0]
            mes_val = row.iloc[1]

            # Update current year if available
            if pd.notna(año_val):
                año_str = str(año_val).strip()
                if año_str.isdigit() and len(año_str) == 4:
                    año_actual = int(año_str)
                else:
                    año_actual = None # Reset if not a valid year format

            # Process only if we have a valid year and month
            if año_actual is not None and pd.notna(mes_val):
                mes_nombre = str(mes_val).strip().lower()
                if mes_nombre in meses:
                    mes_num = meses[mes_nombre]

                    # Filter from February 2004
                    if año_actual < 2004 or (año_actual == 2004 and mes_num < 2):
                        continue

                    # Format date as 'dd/mm/aaaa'
                    fecha = f"01/{mes_num:02d}/{año_actual}"

                    # Extraer las 6 columnas de datos (columnas C a H, índices 2 a 7)
                    valores = []
                    for col_idx in range(2, 8):  # Columnas C a H
                        try:
                            if col_idx < len(row):
                                val = row.iloc[col_idx]
                                if pd.notna(val):
                                    # Convertir a float, manejando diferentes formatos
                                    val_str = str(val).replace(',', '.')
                                    # Remover espacios y caracteres no numéricos (excepto punto, signo menos)
                                    val_clean = ''.join(c for c in val_str if c.isdigit() or c in '.-')
                                    if val_clean and val_clean.replace('.', '').replace('-', '').isdigit():
                                        valores.append(float(val_clean))
                                    else:
                                        valores.append(np.nan)
                                else:
                                    valores.append(np.nan)
                            else:
                                valores.append(np.nan)
                        except Exception as e:
                            print(f"Error procesando valor en fila {idx}, columna {col_idx}: {e}")
                            valores.append(np.nan)

                    # Crear registro
                    registro = {
                        'fecha': fecha,
                        'indice_serie_original': valores[0] if len(valores) > 0 else np.nan,
                        'var_respecto_año_anterior': valores[1] if len(valores) > 1 else np.nan,
                        'indice_desestacionalizado': valores[2] if len(valores) > 2 else np.nan,
                        'var_respecto_mes_anterior': valores[3] if len(valores) > 3 else np.nan,
                        'indice_tendencia_ciclo': valores[4] if len(valores) > 4 else np.nan,
                        'var_tendencia_mes_anterior': valores[5] if len(valores) > 5 else np.nan
                    }

                    datos_procesados.append(registro)

                    # Mostrar algunos registros para verification
                    if len(datos_procesados) <= 5 or len(datos_procesados) % 50 == 0:
                         print(f"  {fecha}: {año_actual}-{mes_nombre} -> {[round(v, 1) if not pd.isna(v) else 'NaN' for v in valores[:3]]}")


        # Crear DataFrame final
        if datos_procesados:
            df_limpio = pd.DataFrame(datos_procesados)

            # Convert 'fecha' to datetime for sorting
            df_limpio['fecha_sort'] = pd.to_datetime(df_limpio['fecha'], format='%d/%m/%Y')
            df_limpio = df_limpio.sort_values('fecha_sort')
            df_limpio = df_limpio.drop('fecha_sort', axis=1)

            # Resetear índice
            df_limpio = df_limpio.reset_index(drop=True)

            print(f"\nDataFrame creado exitosamente!")
            print(f"Número de registros: {len(df_limpio)}")
            print(f"Período: {df_limpio['fecha'].iloc[0]} a {df_limpio['fecha'].iloc[-1]}")

            # Verificar that we start from February 2004
            primera_fecha = pd.to_datetime(df_limpio['fecha'].iloc[0], format='%d/%m/%Y')
            if primera_fecha.year == 2004 and primera_fecha.month == 2:
                print("✓ Confirmado: Los datos comienzan en febrero de 2004")
            else:
                print(f"⚠️ Atención: Los datos comienzan en {primera_fecha.strftime('%B %Y')}")


            return df_limpio
        else:
            print("No se pudieron procesar los datos")
            return None

    except Exception as e:
        print(f"Error al descargar o procesar los datos: {e}")
        import traceback
        traceback.print_exc()
        return None

def mostrar_info_dataframe(df):
    """
    Muestra información detallada del DataFrame
    """
    if df is not None:
        print("\n" + "="*60)
        print("INFORMACIÓN DEL DATAFRAME")
        print("="*60)
        print(f"Shape: {df.shape}")
        print(f"\nColumnas:")
        for col in df.columns:
            print(f"  - {col}")

        print(f"\nPrimeras 5 filas:")
        print(df.head())

        print(f"\nÚltimas 5 filas:")
        print(df.tail())

        print(f"\nInformación de tipos de datos:")
        print(df.info())

        print(f"\nEstadísticas descriptivas:")
        print(df.describe())

# Ejecutar el proceso
if __name__ == "__main__":
    # Descargar y limpiar los datos
    df_emae = descargar_y_limpiar_emae()

    if df_emae is not None:
        # Mostrar información del DataFrame
        mostrar_info_dataframe(df_emae)

        # Guardar como CSV
        nombre_archivo = f"emae_datos_limpios_{datetime.now().strftime('%Y%m%d')}.csv"
        df_emae.to_csv(nombre_archivo, index=False, encoding='utf-8')
        print(f"\nArchivo guardado como: {nombre_archivo}")

        # Guardar como Excel
        nombre_archivo_excel = f"emae_datos_limpios_{datetime.now().strftime('%Y%m%d')}.xlsx"
        df_emae.to_excel(nombre_archivo_excel, index=False)
        print(f"Archivo guardado como: {nombre_archivo_excel}")
    else:
        print("No se pudo crear el DataFrame")

Descargando datos del EMAE...
Procesando archivo Excel...
Dimensiones del archivo: (265, 8)

Encabezados en fila 3:
  Columna 0: Período
  Columna 2: Índice Serie Original
2004=100
  Columna 3: Var % respecto a igual período del año anterior
  Columna 4: Índice Serie Desestacionalizada
2004=100
  Columna 5: Var % respecto al mes anterior
  Columna 6: Índice Serie Tendencia-Ciclo
2004=100
  Columna 7: Var % respecto al mes anterior

Procesando datos desde la fila 6...
  01/02/2004: 2004-febrero -> [90.2, 0.0, 98.2]
  01/03/2004: 2004-marzo -> [101.9, 0.0, 97.8]
  01/04/2004: 2004-abril -> [102.6, 0.0, 95.1]
  01/05/2004: 2004-mayo -> [109.9, 0.0, 96.9]
  01/06/2004: 2004-junio -> [105.7, 0.0, 98.7]
  01/03/2008: 2008-marzo -> [132.3, 2.4, 133.3]
  01/05/2012: 2012-mayo -> [157.4, -5.3, 140.2]
  01/07/2016: 2016-julio -> [143.7, -5.3, 144.4]
  01/09/2020: 2020-septiembre -> [127.2, -5.7, 130.7]
  01/11/2024: 2024-noviembre -> [148.1, 1.2, 150.6]

DataFrame creado exitosamente!
Número de 

In [34]:
df_emae

Unnamed: 0,fecha,indice_serie_original,var_respecto_año_anterior,indice_desestacionalizado,var_respecto_mes_anterior,indice_tendencia_ciclo,var_tendencia_mes_anterior
0,01/02/2004,90.186179,0.000000,98.182867,-0.255845,96.648290,0.621850
1,01/03/2004,101.883298,0.000000,97.784388,-0.405854,97.318642,0.693600
2,01/04/2004,102.567430,0.000000,95.129053,-2.715500,98.015884,0.716453
3,01/05/2004,109.877504,0.000000,96.891162,1.852336,98.740023,0.738798
4,01/06/2004,105.662406,0.000000,98.650311,1.815592,99.489725,0.759268
...,...,...,...,...,...,...,...
252,01/02/2025,141.160093,5.629332,153.378984,0.724647,151.413009,0.452763
253,01/03/2025,150.380892,5.479625,150.575664,-1.827708,152.007691,0.392755
254,01/04/2025,159.115637,8.046957,152.735548,1.434418,152.524114,0.339735
255,01/05/2025,165.068610,5.289033,152.440207,-0.193368,152.976638,0.296690


In [37]:
import plotly.graph_objects as go
import pandas as pd

# Ensure the 'fecha' column is in datetime format for plotting
df_emae['fecha_dt'] = pd.to_datetime(df_emae['fecha'], format='%d/%m/%Y')

# Create the Plotly figure
fig = go.Figure()

# Add the trace for 'indice_desestacionalizado' (line)
fig.add_trace(go.Scatter(
    x=df_emae['fecha_dt'],
    y=df_emae['indice_desestacionalizado'],
    mode='lines',
    name='EMAE (Índice Desestacionalizado)',
    yaxis='y1', # Associate with the primary Y axis
    line=dict(color='green') # Set line color
))

# Add the trace for 'var_respecto_mes_anterior' (bars)
fig.add_trace(go.Bar(
    x=df_emae['fecha_dt'],
    y=df_emae['var_respecto_mes_anterior'],
    name='EMAE (Variación Mensual)',
    yaxis='y2', # Associate with the secondary Y axis
    marker=dict(color='blue', opacity=0.7) # Set bar color and opacity
))


# Configure axes and layout
fig.update_layout(
    title=dict(
        text='EMAE (Índice Desestacionalizado y Variación Mensual) - Interactivo',
        x=0.5,
        xanchor='center'
    ),
    xaxis=dict(
        title='Fecha',
        titlefont=dict(color='black'),
        tickfont=dict(color='black'),
        showgrid=False
    ),
    yaxis=dict(
        title='Índice Desestacionalizado (Base 2004=100)',
        titlefont=dict(color='black'),
        tickfont=dict(color='black'),
        showgrid=False
    ),
    yaxis2=dict(
        title='Variación Mensual (%)',
        titlefont=dict(color='black'),
        tickfont=dict(color='black'),
        overlaying='y', # Superimpose on the primary Y axis
        side='right',    # Place on the right side
        showgrid=False # Eliminate grid for the secondary Y axis
    ),
    legend=dict(
        x=0,
        y=1.0,
        bgcolor='rgba(255, 255, 255, 0)',
        bordercolor='rgba(255, 255, 255, 0)'
    ),
    hovermode='x unified',
    plot_bgcolor='white',
    font=dict(family='Arial')
)

# Show the interactive plot
fig.show()

# Drop the temporary datetime column
df_emae = df_emae.drop('fecha_dt', axis=1)