<a href="https://colab.research.google.com/github/cesar-ramosh/Gobernanzas-de-datos/blob/main/Sector_Precios.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Gobernanza de datos - Sector Precios

## Instrucciones para el Analista del Sector Precios
- Deberá contar con una cuenta Gmail
- Deberá acceder al repositorio de Drive para cargar los datos en bruto al archivo: `01. Base Sector Precios.xlsx`

## Preámbulo

El archivo Jupyter Notebook `Sector Precios.ipynb` está organizado de manera estructurada en diversas secciones para abordar el análisis y procesamiento de datos del sector de precios. La secuencia del código se desglosa de la siguiente forma:

1. **Conexión con la Carpeta de Google Drive**: Esta sección facilita la integración con archivos alojados en Google Drive, asegurando una operatividad eficiente en el entorno de trabajo.

2. **Importación de Datos**: Se implementan funciones específicas para la importación de conjuntos de datos clave, estableciendo así el fundamento para análisis posteriores.

3. **Cálculo de Inflación**: Aquí se introduce una función para determinar indicadores inflacionarios como la inflación mensual, a 12 meses y acumulada.

4. **Índice de Precios al Consumidor por Departamento**: Enfocada en cada departamento, esta sección aborda la limpieza de datos y el cálculo de indicadores inflacionarios correspondientes.

5. **Índice de Precios al Consumidor por División**: Similar a la sección anterior pero centrada en divisiones específicas, abarca la limpieza de datos y el cálculo de inflación.

6. **Índice de Precios al Consumidor - Alimentos**: Se concentra en productos alimenticios, realizando limpieza de datos y cálculos inflacionarios asociados.

7. **Índice de Precios al Consumidor por Productos**: Aborda un conjunto de 397 productos, efectuando limpieza de datos y análisis inflacionarios específicos.

8. **Índice de Precios Histórico (Base 2016 y Base 1992)**: Se dedica al análisis histórico, con limpieza de datos y cálculos inflacionarios según diferentes bases.

9. **Cálculo de la Incidencia de la Inflación**: Examina el impacto inflacionario en diversas categorías, incluyendo departamentos, alimentos y no alimentos, así como divisiones específicas.

10. **Exportación de Resultados**: Se incluyen funciones para exportar los resultados a un archivo Excel, facilitando su posterior análisis y difusión.

11. **Gráficos Interactivos para Reportes**: Integración de herramientas para generar gráficos que complementan y visualizan los hallazgos analíticos.

---

* En el proceso de limpieza de datos se procedió e eliminar los datos pérdidos y uniformar todo el conjunto de datos en un data frame de serie de tiempo.

# Conexión carpeta de Google Drive

In [151]:
# Enlazar Google Drive con Google Colaboratory - Notebook
from google.colab import drive
import pandas as pd

drive.mount('/content/drive')
%cd /content/drive/MyDrive/Sector Precios/

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
/content/drive/MyDrive/Sector Precios


In [152]:
%cd /content/drive/MyDrive/Sector Precios/

/content/drive/MyDrive/Sector Precios


# Importación de datos

In [153]:
# Cargar la segunda hoja en un DataFrame de Pandas y utilizar la primera columna como índice de fechas
# 398 productos
IPC_Productos = pd.read_excel('01. Base Sector Precios.xlsx', sheet_name='Bolivia_Productos')
#IPC_Productos = pd.read_excel('01. Base Sector Precios.xlsx', sheet_name='Bolivia_Productos', index_col=0)
# 13 variables divisiones
IPC_Division = pd.read_excel('01. Base Sector Precios.xlsx', sheet_name='Divisiones')
#IPC_Division = pd.read_excel('01. Base Sector Precios.xlsx', sheet_name='Divisiones', index_col=0)
# 9 departamentos + Nacional
IPC_Ciudad = pd.read_excel('01. Base Sector Precios.xlsx', sheet_name='Ciudades')
# 3 variables
IPC_Alimento = pd.read_excel('01. Base Sector Precios.xlsx', sheet_name='Alimentos')
#IPC_Alimento = pd.read_excel('01. Base Sector Precios.xlsx', sheet_name='Alimentos', index_col=0)
IPC_Historical = pd.read_excel('01. Base Sector Precios.xlsx', sheet_name='ipc_nal_histo')
#IPC_Alimento = pd.read_excel('01. Base Sector Precios.xlsx', sheet_name='Alimentos', index_col=0)

In [154]:
# Ponderadores de cada actividad
w0_divis = pd.read_excel('04. Ponderaciones.xlsx', sheet_name='Divisiones')
w0_depto = pd.read_excel('04. Ponderaciones.xlsx', sheet_name='Ciudad')
w0_alimen = pd.read_excel('04. Ponderaciones.xlsx', sheet_name='Alimento_No')
w0_produc = pd.read_excel('04. Ponderaciones.xlsx', sheet_name='Productos')
#suma = w0_alimen['W0'].sum()

# Función para el cálculo de la inflación mensual, a 12 meses y acumulada

In [155]:
import pandas as pd

def calcular_inflacion(df, columna_variable, columna_fecha):
    # Hacer una copia del DataFrame para evitar modificar el original
    df = df.copy()

    # Calcular la tasa de crecimiento mensual
    df[f'imes_{columna_variable}'] = df[columna_variable].pct_change() * 100

    # Calcular la tasa de crecimiento a 12 meses
    df[f'i12m_{columna_variable}'] = df[columna_variable].pct_change(periods=12) * 100

    # Convertir la columna de fecha a formato "datetime" si no está en ese formato
    if not pd.api.types.is_datetime64_any_dtype(df[columna_fecha]):
        df[columna_fecha] = pd.to_datetime(df[columna_fecha])

    # Extraer el año de la columna de fecha
    df['year'] = df[columna_fecha].dt.year

    # Crear la función para el año de referencia
    min_year = df['year'].min()
    max_year = df['year'].max()

    for year in range(min_year, max_year):
        base_col = f"base_{year}"
        df[base_col] = df.loc[(df['year'] == year) & (df[columna_fecha].dt.month == 12), columna_variable].values[0]

    # Calcular la tasa de crecimiento acumulada utilizando el enfoque de referencia anual
    for year in range(min_year + 1, max_year + 1):
        prev_year = year - 1
        df.loc[df['year'] == year, f'icum_{columna_variable}'] = ((df[columna_variable] / df[f"base_{prev_year}"]) - 1) * 100

    # Eliminar las variables auxiliares
    df = df.drop(['year'] + [f"base_{year}" for year in range(min_year, max_year)], axis=1)

    return df

# Índice Precios al Consumidor por departamento

## Limpieza de datos

In [156]:
import pandas as pd
# Eliminar observaciones que contienen valores nulos how=all
#IPC_Ciudad = IPC_Ciudad.dropna(axis=0)
IPC_Ciudad = IPC_Ciudad.dropna(how='all')
IPC_Ciudad.head(2)

Unnamed: 0,mes,Bolivia,Sucre,La Paz,Cochabamba,Oruro,Potosí,Tarija,Santa Cruz,Beni,Pando
0,1993-01-01,26.163202,,28.874885,21.911197,,,,25.606815,,
1,1993-02-01,26.412003,,29.372096,22.088338,,,,25.646317,,


## Cálculo inflación IPC por ciudades

In [157]:
Infla_bol = calcular_inflacion(IPC_Ciudad, 'Bolivia', 'mes')
Infla_bol = Infla_bol.iloc[:, [0, 11, 12, 13]]
Infla_scr = calcular_inflacion(IPC_Ciudad, 'Sucre', 'mes')
Infla_scr = Infla_scr.iloc[:, [11, 12, 13]]
Infla_lpz = calcular_inflacion(IPC_Ciudad, 'La Paz', 'mes')
Infla_lpz = Infla_lpz.iloc[:, [11, 12, 13]]
Infla_cba = calcular_inflacion(IPC_Ciudad, 'Cochabamba', 'mes')
Infla_cba = Infla_cba.iloc[:, [11, 12, 13]]
Infla_oru = calcular_inflacion(IPC_Ciudad, 'Oruro', 'mes')
Infla_oru = Infla_oru.iloc[:, [11, 12, 13]]
Infla_pot = calcular_inflacion(IPC_Ciudad, 'Potosí', 'mes')
Infla_pot = Infla_pot.iloc[:, [11, 12, 13]]
Infla_tar = calcular_inflacion(IPC_Ciudad, 'Tarija', 'mes')
Infla_tar = Infla_tar.iloc[:, [11, 12, 13]]
Infla_scz = calcular_inflacion(IPC_Ciudad, 'Santa Cruz', 'mes')
Infla_scz = Infla_scz.iloc[:, [11, 12, 13]]
Infla_ben = calcular_inflacion(IPC_Ciudad, 'Beni', 'mes')
Infla_ben = Infla_ben.iloc[:, [11, 12, 13]]
Infla_pdo = calcular_inflacion(IPC_Ciudad, 'Pando', 'mes')
Infla_pdo = Infla_pdo.iloc[:, [11, 12, 13]]
# Concatenar los DataFrames en uno solo
infla_depto = pd.concat([Infla_bol, Infla_scr, Infla_lpz, Infla_cba, Infla_oru, Infla_pot, Infla_tar, Infla_scz, Infla_ben, Infla_pdo], axis=1)
import pandas as pd
# Eliminar observaciones que contienen valores nulos
#infla_depto = infla_depto.dropna(axis=0)
infla_depto = infla_depto.dropna(how='all')
# Formato de fechas
infla_depto['mes'] = infla_depto['mes'].dt.strftime('%b-%y')
# Redondear los decimales
infla_depto = infla_depto.round(10)

# Índice Precios al Consumidor por división

## Limpieza de datos

In [158]:
import pandas as pd
# Eliminar observaciones que contienen valores nulos
#IPC_Division = IPC_Division.dropna(axis=0)
IPC_Division = IPC_Division.dropna(how='all')
IPC_Division.head(2)

Unnamed: 0,mes,Bolivia,Alimentos y bebidas no alcohólicas,Bebidas alcohólicas y tabaco,Prendas de vestir y calzado,Vivienda y servicios básicos,"Muebles, bienes y servicios domésticos",Salud,Transporte,Comunicaciones,Recreación y cultura,Educación,Alimentos y bebidas consumidos fuera del hogar,Bienes y servicios diversos
0,1992-03-01,24.551016,20.787881,,35.001393,26.626877,23.769239,20.629507,,,31.287264,25.521613,,31.305815
1,1992-04-01,24.61568,20.773083,,35.11096,27.021873,23.85508,20.909262,,,31.496949,25.783236,,31.641182


## Cálculo inflación por división

In [159]:
Infla_bol = calcular_inflacion(IPC_Division, 'Bolivia', 'mes')
Infla_bol = Infla_bol.iloc[:, [0, 14, 15, 16]]
Infla_abnh = calcular_inflacion(IPC_Division, 'Alimentos y bebidas no alcohólicas', 'mes')
Infla_abnh = Infla_abnh.iloc[:, [14, 15, 16]]
Infla_bayt = calcular_inflacion(IPC_Division, 'Bebidas alcohólicas y tabaco', 'mes')
Infla_bayt = Infla_bayt.iloc[:, [14, 15, 16]]
Infla_pvyc = calcular_inflacion(IPC_Division, 'Prendas de vestir y calzado', 'mes')
Infla_pvyc = Infla_pvyc.iloc[:, [14, 15, 16]]
Infla_vysb = calcular_inflacion(IPC_Division, 'Vivienda y servicios básicos', 'mes')
Infla_vysb = Infla_vysb.iloc[:, [14, 15, 16]]
Infla_mbsd = calcular_inflacion(IPC_Division, 'Muebles, bienes y servicios domésticos', 'mes')
Infla_mbsd = Infla_mbsd.iloc[:, [14, 15, 16]]
Infla_salu = calcular_inflacion(IPC_Division, 'Salud', 'mes')
Infla_salu = Infla_salu.iloc[:, [14, 15, 16]]
Infla_tran = calcular_inflacion(IPC_Division, 'Transporte', 'mes')
Infla_tran = Infla_tran.iloc[:, [14, 15, 16]]
Infla_comu = calcular_inflacion(IPC_Division, 'Comunicaciones', 'mes')
Infla_comu = Infla_comu.iloc[:, [14, 15, 16]]
Infla_reyc = calcular_inflacion(IPC_Division, 'Recreación y cultura', 'mes')
Infla_reyc = Infla_reyc.iloc[:, [14, 15, 16]]
Infla_educ = calcular_inflacion(IPC_Division, 'Educación', 'mes')
Infla_educ = Infla_educ.iloc[:, [14, 15, 16]]
Infla_acfh = calcular_inflacion(IPC_Division, 'Alimentos y bebidas consumidos fuera del hogar', 'mes')
Infla_acfh = Infla_acfh.iloc[:, [14, 15, 16]]
Infla_bysd = calcular_inflacion(IPC_Division, 'Bienes y servicios diversos', 'mes')
Infla_bysd = Infla_bysd.iloc[:, [14, 15, 16]]
# Concatenar los DataFrames en uno solo
infla_divis = pd.concat([Infla_bol, Infla_abnh, Infla_bayt, Infla_pvyc, Infla_vysb, Infla_mbsd, Infla_salu, Infla_tran, Infla_comu, Infla_reyc, Infla_educ, Infla_acfh, Infla_bysd], axis=1)
import pandas as pd
# Eliminar observaciones que contienen valores nulos
#infla_divis = infla_divis.dropna(axis=0)
infla_divis = infla_divis.dropna(how='all')
# Formato de fechas
#infla_divis['mes'] = infla_divis['mes'].dt.strftime('%b-%y')
infla_divis.loc[:, 'mes'] = infla_divis['mes'].dt.strftime('%b-%y')
# Redondear los decimales
infla_divis = infla_divis.round(10)
#infla_divis = infla_divis.round(2)

# Índice Precios al Consumidor - Alimentos

## Limpieza de datos

In [160]:
import pandas as pd
# Eliminar observaciones que contienen valores nulos
#IPC_Alimento = IPC_Alimento.dropna(axis=0)
IPC_Alimento = IPC_Alimento.dropna(how='all')
IPC_Alimento.head(2)

Unnamed: 0,mes,IPC general,Alimentos,No alimentos
0,1992-03-01,24.551019,20.766725,28.431095
1,1992-04-01,24.615683,20.751941,28.600619


## Cálculo inflación Alimentos

In [161]:
Infla_gral = calcular_inflacion(IPC_Alimento, 'IPC general', 'mes')
Infla_gral = Infla_gral.iloc[:, [0, 4, 5, 6]]
Infla_alim = calcular_inflacion(IPC_Alimento, 'Alimentos', 'mes')
Infla_alim = Infla_alim.iloc[:, [4, 5, 6]]
Infla_nalim = calcular_inflacion(IPC_Alimento, 'No alimentos', 'mes')
Infla_nalim = Infla_nalim.iloc[:, [4, 5, 6]]

# Concatenar los DataFrames en uno solo
infla_alimen = pd.concat([Infla_gral, Infla_alim, Infla_nalim], axis=1)
import pandas as pd
# Eliminar observaciones que contienen valores nulos
#infla_alimen = infla_alimen.dropna(axis=0)
infla_alimen = infla_alimen.dropna(how='all')
# Formato de fechas
infla_alimen.loc[:, 'mes'] = infla_alimen['mes'].dt.strftime('%b-%y')
# Redondear los decimales
infla_alimen = infla_alimen.round(10)

# Índice de precios al consumidor por productos (397 productos)

## Limpieza de datos

In [162]:
import pandas as pd
# Eliminar observaciones que contienen valores nulos
#IPC_Productos = IPC_Productos.dropna(axis=0)
IPC_Productos = IPC_Productos.dropna(how='all')
IPC_Productos.head(2)

Unnamed: 0,mes,IPC general,Pan corriente,Pan especial,Galletas,Panetón,Torta,Empanada al horno,Queques,Llauchas,...,Servicio de guarderías,Seguro relacionado con la salud,Seguro relacionado con el transporte,Servicios de asesoramiento jurídico,Gastos en pompas fúnebres y en otros servicios de funerales,Pago por fotocopias y otras reproducciones de documentos,Emisión de certificados,Roseta de inspección vehicular,Cédula de identidad CI,Servicios religiosos
0,2017-12-01,100.86024,1.944171,0.245399,0.505634,0.093038,0.202355,0.191127,0.043872,0.027014,...,0.111559,0.070172,0.089397,0.050412,0.039202,0.065664,0.040209,0.013366,0.016013,0.000761
1,2018-01-01,101.167616,1.944034,0.244824,0.509821,0.093293,0.201589,0.19248,0.043617,0.026634,...,0.113687,0.070172,0.090389,0.049549,0.039969,0.064478,0.040181,0.013366,0.016013,0.000761


## Cálculo de la inflación de los 397 productos

In [163]:
import pandas as pd

# Supongamos que tienes un DataFrame llamado IPC_Productos con 398 variables.
variables = IPC_Productos.columns.tolist()
variables = [var for var in variables if var != "mes"]

infla_resultados = pd.DataFrame()  # Dataframe para almacenar los resultados

for variable in variables:
    infla = calcular_inflacion(IPC_Productos, variable, 'mes')
    infla = infla[['mes', f'imes_{variable}', f'i12m_{variable}', f'icum_{variable}']]

    # Combina los resultados en un DataFrame más grande
    infla_resultados = pd.concat([infla_resultados, infla], axis=1)

# Ahora, infla_resultados contendrá las columnas de inflación para todas las variables
import pandas as pd
# Eliminar observaciones que contienen valores nulos
#infla_produc = infla_resultados.dropna(axis=0)
infla_produc = infla_resultados.dropna(how='all')
# Formato de fechas
# Eliminar la variable repetida
infla_produc = infla_produc.loc[:, ~infla_produc.columns.duplicated(keep='first')]
infla_produc.loc[:, 'mes'] = infla_produc['mes'].dt.strftime('%b-%y')
# Redondear los decimales
infla_produc = infla_produc.round(10)


# Índice de precios histórico

## Limpieza de datos

In [164]:
import pandas as pd
# Eliminar observaciones que contienen valores nulos
#IPC_Productos = IPC_Productos.dropna(axis=0)
IPC_Historical = IPC_Historical.dropna(how='all')
IPC_Historical.head(2)

Unnamed: 0,mes,IPC_2016,IPC_1991
0,1937-01-31,1.42362e-08,6.43298e-08
1,1937-02-28,1.45877e-08,6.59182e-08


## Cálculo de la inflación histórica base 2016 y 1992

In [165]:
Infla_2016 = calcular_inflacion(IPC_Historical, 'IPC_2016', 'mes')
Infla_2016 = Infla_2016.iloc[:, [0, 3, 4, 5]]
Infla_1991 = calcular_inflacion(IPC_Historical, 'IPC_1991', 'mes')
Infla_1991 = Infla_1991.iloc[:, [3, 4, 5]]


# Concatenar los DataFrames en uno solo
infla_histo = pd.concat([Infla_2016, Infla_1991], axis=1)
import pandas as pd
# Eliminar observaciones que contienen valores nulos
#infla_alimen = infla_alimen.dropna(axis=0)
infla_histo = infla_histo.dropna(how='all')
# Formato de fechas
infla_histo.loc[:, 'mes'] = infla_histo['mes'].dt.strftime('%b-%Y')
# Redondear los decimales
infla_histo = infla_histo.round(10)
infla_histo.to_excel('mi_dataframe.xlsx', index=False)


In a future version, `df.iloc[:, i] = newvals` will attempt to set the values inplace instead of always setting a new array. To retain the old behavior, use either `df[df.columns[i]] = newvals` or, if columns are non-unique, `df.isetitem(i, newvals)`



# Organización dataframes (Por inflación mensual, a doce meses, y acumulada)



In [166]:
#===============================================#
# Seleccionamos las lista de todas las variables de departamentos.
variables_depto = infla_depto.columns.tolist()
# Creamos un dataframe con todas las inflaciones mensual/12meses/acumulada por departamento
depto_imes = infla_depto[ ['mes'] + [variable for variable in infla_depto.columns if variable.startswith('imes_')] ]
depto_imes = depto_imes.rename(columns=lambda x: x.replace('imes_', '') if x.startswith('imes_') else x) # Retornamos nombre original
depto_imes.set_index('mes', inplace=True)
depto_imes = depto_imes.dropna(how='all')
depto_i12m = infla_depto[ ['mes'] + [variable for variable in infla_depto.columns if variable.startswith('i12m_')] ]
depto_i12m = depto_i12m.rename(columns=lambda x: x.replace('i12m_', '') if x.startswith('i12m_') else x) # Retornamos nombre original
depto_i12m.set_index('mes', inplace=True)
depto_i12m = depto_i12m.dropna(how='all')
depto_icum = infla_depto[ ['mes'] + [variable for variable in infla_depto.columns if variable.startswith('icum_')] ]
depto_icum = depto_icum.rename(columns=lambda x: x.replace('icum_', '') if x.startswith('icum_') else x) # Retornamos nombre original
depto_icum.set_index('mes', inplace=True)
depto_icum = depto_icum.dropna(how='all')
#===============================================#
# Seleccionamos las lista de todas las variables de divisiones.
variables_divis = infla_divis.columns.tolist()
# Creamos un dataframe con todas las inflaciones mensual/12meses/acumulada por divisiones
divis_imes = infla_divis[ ['mes'] + [variable for variable in infla_divis.columns if variable.startswith('imes_')] ]
divis_imes = divis_imes.rename(columns=lambda x: x.replace('imes_', '') if x.startswith('imes_') else x) # Retornamos nombre original
divis_imes.set_index('mes', inplace=True)
divis_imes = divis_imes.dropna(how='all')
divis_i12m = infla_divis[ ['mes'] + [variable for variable in infla_divis.columns if variable.startswith('i12m_')] ]
divis_i12m = divis_i12m.rename(columns=lambda x: x.replace('i12m_', '') if x.startswith('i12m_') else x) # Retornamos nombre original
divis_i12m.set_index('mes', inplace=True)
divis_i12m = divis_i12m.dropna(how='all')
divis_icum = infla_divis[ ['mes'] + [variable for variable in infla_divis.columns if variable.startswith('icum_')] ]
divis_icum = divis_icum.rename(columns=lambda x: x.replace('icum_', '') if x.startswith('icum_') else x) # Retornamos nombre original
divis_icum.set_index('mes', inplace=True)
divis_icum = divis_icum.dropna(how='all')
#===============================================#
# Seleccionamos las lista de todas las variables de productos.
variables_produc = infla_produc.columns.tolist()
# Creamos un dataframe con todas las inflaciones mensual/12meses/acumulada por productos
produc_imes = infla_produc[ ['mes'] + [variable for variable in infla_produc.columns if variable.startswith('imes_')] ]
produc_imes = produc_imes.rename(columns=lambda x: x.replace('imes_', '') if x.startswith('imes_') else x) # Retornamos nombre original
produc_imes.set_index('mes', inplace=True)
produc_imes = produc_imes.dropna(how='all')
produc_i12m = infla_produc[ ['mes'] + [variable for variable in infla_produc.columns if variable.startswith('i12m_')] ]
produc_i12m = produc_i12m.rename(columns=lambda x: x.replace('i12m_', '') if x.startswith('i12m_') else x) # Retornamos nombre original
produc_i12m.set_index('mes', inplace=True)
produc_i12m = produc_i12m.dropna(how='all')
produc_icum = infla_produc[ ['mes'] + [variable for variable in infla_produc.columns if variable.startswith('icum_')] ]
produc_icum = produc_icum.rename(columns=lambda x: x.replace('icum_', '') if x.startswith('icum_') else x) # Retornamos nombre original
produc_icum.set_index('mes', inplace=True)
produc_icum = produc_icum.dropna(how='all')
#===============================================#
# Seleccionamos las lista de todas las variables de alimentos.
variables_alimen = infla_alimen.columns.tolist()
# Creamos un dataframe con todas las inflaciones mensual/12meses/acumulada por alimentos
alimen_imes = infla_alimen[ ['mes'] + [variable for variable in infla_alimen.columns if variable.startswith('imes_')] ]
alimen_imes = alimen_imes.rename(columns=lambda x: x.replace('imes_', '') if x.startswith('imes_') else x) # Retornamos nombre original
alimen_imes.set_index('mes', inplace=True)
alimen_imes = alimen_imes.dropna(how='all')
alimen_i12m = infla_alimen[ ['mes'] + [variable for variable in infla_alimen.columns if variable.startswith('i12m_')] ]
alimen_i12m = alimen_i12m.rename(columns=lambda x: x.replace('i12m_', '') if x.startswith('i12m_') else x) # Retornamos nombre original
alimen_i12m.set_index('mes', inplace=True)
alimen_i12m = alimen_i12m.dropna(how='all')
alimen_icum = infla_alimen[ ['mes'] + [variable for variable in infla_alimen.columns if variable.startswith('icum_')] ]
alimen_icum = alimen_icum.rename(columns=lambda x: x.replace('icum_', '') if x.startswith('icum_') else x) # Retornamos nombre original
alimen_icum.set_index('mes', inplace=True)
alimen_icum = alimen_icum.dropna(how='all')
#===============================================#
#===============================================#
# Seleccionamos las lista de todas las variables de inflación histórica.
variables_histo = infla_histo.columns.tolist()
# Creamos un dataframe con todas las inflaciones mensual/12meses/acumulada por base 1991 y 2016
histo_imes = infla_histo[ ['mes'] + [variable for variable in infla_histo.columns if variable.startswith('imes_')] ]
histo_imes = histo_imes.rename(columns=lambda x: x.replace('imes_', '') if x.startswith('imes_') else x) # Retornamos nombre original
histo_imes.set_index('mes', inplace=True)
histo_imes = histo_imes.dropna(how='all')
histo_i12m = infla_histo[ ['mes'] + [variable for variable in infla_histo.columns if variable.startswith('i12m_')] ]
histo_i12m = histo_i12m.rename(columns=lambda x: x.replace('i12m_', '') if x.startswith('i12m_') else x) # Retornamos nombre original
histo_i12m.set_index('mes', inplace=True)
histo_i12m = histo_i12m.dropna(how='all')
histo_icum = infla_histo[ ['mes'] + [variable for variable in infla_histo.columns if variable.startswith('icum_')] ]
histo_icum = histo_icum.rename(columns=lambda x: x.replace('icum_', '') if x.startswith('icum_') else x) # Retornamos nombre original
histo_icum.set_index('mes', inplace=True)
histo_icum = histo_icum.dropna(how='all')
#===============================================#

# Cálculo de la incidencia de la inflación (_mensual_, _a doce meses_ y _acumulada_)

## Incidencia por departamento


In [167]:
# Utilizamos los dataframe de ponderadores y aplicamos a la inflación mensual; a doce meses; y acumulada
# Para la inflación mensual
depto_imes_inc = pd.DataFrame()
depto_imes_inc['Bolivia'] = depto_imes['Bolivia']       *w0_depto.iloc[0, 0] / 100
depto_imes_inc['Sucre'] = depto_imes['Sucre']           *w0_depto.iloc[0, 1] / 100
depto_imes_inc['La Paz'] = depto_imes['La Paz']         *w0_depto.iloc[0, 2] / 100
depto_imes_inc['Cochabamba'] = depto_imes['Cochabamba'] *w0_depto.iloc[0, 3] / 100
depto_imes_inc['Oruro'] = depto_imes['Oruro']           *w0_depto.iloc[0, 4] / 100
depto_imes_inc['Potosí'] = depto_imes['Potosí']         *w0_depto.iloc[0, 5] / 100
depto_imes_inc['Tarija'] = depto_imes['Tarija']         *w0_depto.iloc[0, 6] / 100
depto_imes_inc['Santa Cruz'] = depto_imes['Santa Cruz'] *w0_depto.iloc[0, 7] / 100
depto_imes_inc['Beni'] = depto_imes['Beni']             *w0_depto.iloc[0, 8] / 100
depto_imes_inc['Pando'] = depto_imes['Pando']           *w0_depto.iloc[0, 9] / 100
# Para la inflación a doce meses
depto_i12m_inc = pd.DataFrame()
depto_i12m_inc['Bolivia'] = depto_i12m['Bolivia']       *w0_depto.iloc[0, 0] / 100
depto_i12m_inc['Sucre'] = depto_i12m['Sucre']           *w0_depto.iloc[0, 1] / 100
depto_i12m_inc['La Paz'] = depto_i12m['La Paz']         *w0_depto.iloc[0, 2] / 100
depto_i12m_inc['Cochabamba'] = depto_i12m['Cochabamba'] *w0_depto.iloc[0, 3] / 100
depto_i12m_inc['Oruro'] = depto_i12m['Oruro']           *w0_depto.iloc[0, 4] / 100
depto_i12m_inc['Potosí'] = depto_i12m['Potosí']         *w0_depto.iloc[0, 5] / 100
depto_i12m_inc['Tarija'] = depto_i12m['Tarija']         *w0_depto.iloc[0, 6] / 100
depto_i12m_inc['Santa Cruz'] = depto_i12m['Santa Cruz'] *w0_depto.iloc[0, 7] / 100
depto_i12m_inc['Beni'] = depto_i12m['Beni']             *w0_depto.iloc[0, 8] / 100
depto_i12m_inc['Pando'] = depto_i12m['Pando']           *w0_depto.iloc[0, 9] / 100
# Para la inflación acumulada
depto_icum_inc = pd.DataFrame()
depto_icum_inc['Bolivia'] = depto_icum['Bolivia']       *w0_depto.iloc[0, 0] / 100
depto_icum_inc['Sucre'] = depto_icum['Sucre']           *w0_depto.iloc[0, 1] / 100
depto_icum_inc['La Paz'] = depto_icum['La Paz']         *w0_depto.iloc[0, 2] / 100
depto_icum_inc['Cochabamba'] = depto_icum['Cochabamba'] *w0_depto.iloc[0, 3] / 100
depto_icum_inc['Oruro'] = depto_icum['Oruro']           *w0_depto.iloc[0, 4] / 100
depto_icum_inc['Potosí'] = depto_icum['Potosí']         *w0_depto.iloc[0, 5] / 100
depto_icum_inc['Tarija'] = depto_icum['Tarija']         *w0_depto.iloc[0, 6] / 100
depto_icum_inc['Santa Cruz'] = depto_icum['Santa Cruz'] *w0_depto.iloc[0, 7] / 100
depto_icum_inc['Beni'] = depto_icum['Beni']             *w0_depto.iloc[0, 8] / 100
depto_icum_inc['Pando'] = depto_icum['Pando']           *w0_depto.iloc[0, 9] / 100

## Incidencia por categoria de alimentos y no alimentos

In [168]:
# Utilizamos los dataframe de ponderadores y aplicamos a la inflación mensual; a doce meses; y acumulada
# Para la inflación mensual
alimen_imes_inc = pd.DataFrame()
alimen_imes_inc['IPC general'] = alimen_imes['IPC general']   *w0_alimen.iloc[0, 0] / 100
alimen_imes_inc['Alimentos'] = alimen_imes['Alimentos']       *w0_alimen.iloc[0, 1] / 100
alimen_imes_inc['No alimentos'] = alimen_imes['No alimentos'] *w0_alimen.iloc[0, 2] / 100
# Para la inflación a doce meses
alimen_i12m_inc = pd.DataFrame()
alimen_i12m_inc['IPC general'] = alimen_i12m['IPC general']   *w0_alimen.iloc[0, 0] / 100
alimen_i12m_inc['Alimentos'] = alimen_i12m['Alimentos']       *w0_alimen.iloc[0, 1] / 100
alimen_i12m_inc['No alimentos'] = alimen_i12m['No alimentos'] *w0_alimen.iloc[0, 2] / 100
# Para la inflación acumulada
alimen_icum_inc = pd.DataFrame()
alimen_icum_inc['IPC general'] = alimen_icum['IPC general']   *w0_alimen.iloc[0, 0] / 100
alimen_icum_inc['Alimentos'] = alimen_icum['Alimentos']       *w0_alimen.iloc[0, 1] / 100
alimen_icum_inc['No alimentos'] = alimen_icum['No alimentos'] *w0_alimen.iloc[0, 2] / 100


## Incidencia por divisiones

In [169]:
# Para la inflación mensual
divis_imes_inc = pd.DataFrame()
divis_imes_inc['Bolivia'] = divis_imes['Bolivia']                                                               *w0_divis.iloc[0, 0] / 100
divis_imes_inc['Alimentos y bebidas no alcohólicas'] = divis_imes['Alimentos y bebidas no alcohólicas']         *w0_divis.iloc[0, 1] / 100
divis_imes_inc['Bebidas alcohólicas y tabaco'] = divis_imes['Bebidas alcohólicas y tabaco']                     *w0_divis.iloc[0, 2] / 100
divis_imes_inc['Prendas de vestir y calzado'] = divis_imes['Prendas de vestir y calzado']                     *w0_divis.iloc[0, 3] / 100
divis_imes_inc['Vivienda y servicios básicos'] = divis_imes['Vivienda y servicios básicos']                     *w0_divis.iloc[0, 4] / 100
divis_imes_inc['Muebles, bienes y servicios domésticos'] = divis_imes['Muebles, bienes y servicios domésticos'] *w0_divis.iloc[0, 5] / 100
divis_imes_inc['Salud'] = divis_imes['Salud']                                                                   *w0_divis.iloc[0, 6] / 100
divis_imes_inc['Transporte'] = divis_imes['Transporte']                                                         *w0_divis.iloc[0, 7] / 100
divis_imes_inc['Comunicaciones'] = divis_imes['Comunicaciones']                                                 *w0_divis.iloc[0, 8] / 100
divis_imes_inc['Recreación y cultura'] = divis_imes['Recreación y cultura']                                     *w0_divis.iloc[0, 9] / 100
divis_imes_inc['Educación'] = divis_imes['Educación']                                                           *w0_divis.iloc[0, 10] / 100
divis_imes_inc['Alimentos y bebidas consumidos fuera del hogar'] = divis_imes['Alimentos y bebidas consumidos fuera del hogar'] *w0_divis.iloc[0, 11] / 100
divis_imes_inc['Bienes y servicios diversos'] = divis_imes['Bienes y servicios diversos']                       *w0_divis.iloc[0, 12] / 100
# Para la inflación a doce meses
divis_i12m_inc = pd.DataFrame()
divis_i12m_inc['Bolivia'] = divis_i12m['Bolivia']                                                               *w0_divis.iloc[0, 0] / 100
divis_i12m_inc['Alimentos y bebidas no alcohólicas'] = divis_i12m['Alimentos y bebidas no alcohólicas']         *w0_divis.iloc[0, 1] / 100
divis_i12m_inc['Bebidas alcohólicas y tabaco'] = divis_i12m['Bebidas alcohólicas y tabaco']                     *w0_divis.iloc[0, 2] / 100
divis_i12m_inc['Prendas de vestir y calzado'] = divis_i12m['Prendas de vestir y calzado']                     *w0_divis.iloc[0, 3] / 100
divis_i12m_inc['Vivienda y servicios básicos'] = divis_i12m['Vivienda y servicios básicos']                     *w0_divis.iloc[0, 4] / 100
divis_i12m_inc['Muebles, bienes y servicios domésticos'] = divis_i12m['Muebles, bienes y servicios domésticos'] *w0_divis.iloc[0, 5] / 100
divis_i12m_inc['Salud'] = divis_i12m['Salud']                                                                   *w0_divis.iloc[0, 6] / 100
divis_i12m_inc['Transporte'] = divis_i12m['Transporte']                                                         *w0_divis.iloc[0, 7] / 100
divis_i12m_inc['Comunicaciones'] = divis_i12m['Comunicaciones']                                                 *w0_divis.iloc[0, 8] / 100
divis_i12m_inc['Recreación y cultura'] = divis_i12m['Recreación y cultura']                                     *w0_divis.iloc[0, 9] / 100
divis_i12m_inc['Educación'] = divis_i12m['Educación']                                                           *w0_divis.iloc[0, 10] / 100
divis_i12m_inc['Alimentos y bebidas consumidos fuera del hogar'] = divis_i12m['Alimentos y bebidas consumidos fuera del hogar'] *w0_divis.iloc[0, 11] / 100
divis_i12m_inc['Bienes y servicios diversos'] = divis_i12m['Bienes y servicios diversos']                       *w0_divis.iloc[0, 12] / 100
# Para la inflación acumulada
divis_icum_inc = pd.DataFrame()
divis_icum_inc['Bolivia'] = divis_icum['Bolivia']                                                               *w0_divis.iloc[0, 0] / 100
divis_icum_inc['Alimentos y bebidas no alcohólicas'] = divis_icum['Alimentos y bebidas no alcohólicas']         *w0_divis.iloc[0, 1] / 100
divis_icum_inc['Bebidas alcohólicas y tabaco'] = divis_icum['Bebidas alcohólicas y tabaco']                     *w0_divis.iloc[0, 2] / 100
divis_icum_inc['Prendas de vestir y calzado'] = divis_icum['Prendas de vestir y calzado']                     *w0_divis.iloc[0, 3] / 100
divis_icum_inc['Vivienda y servicios básicos'] = divis_icum['Vivienda y servicios básicos']                     *w0_divis.iloc[0, 4] / 100
divis_icum_inc['Muebles, bienes y servicios domésticos'] = divis_icum['Muebles, bienes y servicios domésticos'] *w0_divis.iloc[0, 5] / 100
divis_icum_inc['Salud'] = divis_icum['Salud']                                                                   *w0_divis.iloc[0, 6] / 100
divis_icum_inc['Transporte'] = divis_icum['Transporte']                                                         *w0_divis.iloc[0, 7] / 100
divis_icum_inc['Comunicaciones'] = divis_icum['Comunicaciones']                                                 *w0_divis.iloc[0, 8] / 100
divis_icum_inc['Recreación y cultura'] = divis_icum['Recreación y cultura']                                     *w0_divis.iloc[0, 9] / 100
divis_icum_inc['Educación'] = divis_icum['Educación']                                                           *w0_divis.iloc[0, 10] / 100
divis_icum_inc['Alimentos y bebidas consumidos fuera del hogar'] = divis_icum['Alimentos y bebidas consumidos fuera del hogar'] *w0_divis.iloc[0, 11] / 100
divis_icum_inc['Bienes y servicios diversos'] = divis_icum['Bienes y servicios diversos']                       *w0_divis.iloc[0, 12] / 100


# ***Exportación de resultados a Excel***

In [170]:
# Supongamos que tienes un DataFrame llamado df y deseas guardarlo en un archivo llamado 'mi_dataframe.xlsx' en tu carpeta de Google Drive.
ruta_archivo = '/content/drive/MyDrive/Sector Precios/Resultados Sector Precios.xlsx'
infla_depto.to_excel(ruta_archivo, sheet_name="inflación departamento", index=False)  # El argumento index=False evita que se guarde el índice en el archivo Excel.

# Carga el archivo Excel existente.
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    infla_divis.to_excel(writer, sheet_name="inflación divisiones", index=False)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    infla_alimen.to_excel(writer, sheet_name="inflación alimentos", index=False)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    infla_produc.to_excel(writer, sheet_name="inflación productos", index=False)


## Exportar todos los dataframes de incidencia _mensual_, _a doce meses_ y _acumulada_ por categoria
- Departamento
- Divisiones
- Alimentos

In [171]:
# Incidencias
# Incidencia departamental
ruta_archivo = '/content/drive/MyDrive/Sector Precios/Resultados Incidencia Desagregado.xlsx'
depto_imes_inc.to_excel(ruta_archivo, sheet_name="inc. mens. depto", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    depto_i12m_inc.to_excel(writer, sheet_name="inc. a12m. depto", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    depto_icum_inc.to_excel(writer, sheet_name="inc. acum. depto", index=True)
# Incidencia alimentos y no alimentos
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    alimen_imes_inc.to_excel(writer, sheet_name="inc. mens. alim.", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    alimen_i12m_inc.to_excel(writer, sheet_name="inc. a12m. alim.", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    alimen_icum_inc.to_excel(writer, sheet_name="inc. acum. alim.", index=True)
    # Incidencia divisiones
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    divis_imes_inc.to_excel(writer, sheet_name="inc. mens. división", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    divis_i12m_inc.to_excel(writer, sheet_name="inc. a12m. división", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    divis_icum_inc.to_excel(writer, sheet_name="inc. acum. división", index=True)

## Exportar todos los dataframes de _inflación mensual_, _a doce meses_ y _acumulada_ por categoria
- Departamento
- Divisiones
- Alimentos
- Productos

In [172]:
# Supongamos que tienes un DataFrame llamado df y deseas guardarlo en un archivo llamado 'mi_dataframe.xlsx' en tu carpeta de Google Drive.
# Inflación departamental
ruta_archivo = '/content/drive/MyDrive/Sector Precios/Resultados Precios Desagregado.xlsx'
depto_imes.to_excel(ruta_archivo, sheet_name="inf. mens. depto", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    depto_i12m.to_excel(writer, sheet_name="inf. a12m. depto", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    depto_icum.to_excel(writer, sheet_name="inf. acum. depto", index=True)
# Inflación por Divisiones
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    divis_imes.to_excel(writer, sheet_name="inf. mens. división", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    divis_i12m.to_excel(writer, sheet_name="inf. a12m. división", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    divis_icum.to_excel(writer, sheet_name="inf. acum. división", index=True)
# Inflación por Productos (397)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    produc_imes.to_excel(writer, sheet_name="inf. mens. producto", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    produc_i12m.to_excel(writer, sheet_name="inf. a12m. producto", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    produc_icum.to_excel(writer, sheet_name="inf. acum. producto", index=True)
# Inflación por Alimentos
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    alimen_imes.to_excel(writer, sheet_name="inf. mens. alim.", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    alimen_i12m.to_excel(writer, sheet_name="inf. a12m. alim.", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    alimen_icum.to_excel(writer, sheet_name="inf. acum. alim.", index=True)
#   Inflación histórica por año base 2016 y 1991
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    histo_imes.to_excel(writer, sheet_name="inf. mens. histo.", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    histo_i12m.to_excel(writer, sheet_name="inf. a12m. histo.", index=True)
with pd.ExcelWriter(ruta_archivo, mode='a', engine='openpyxl') as writer:
    histo_icum.to_excel(writer, sheet_name="inf. acum. histo.", index=True)

## Conversión de datos de frecuencia Mensual a Anual

In [173]:
depto_icum

Unnamed: 0_level_0,Bolivia,Sucre,La Paz,Cochabamba,Oruro,Potosí,Tarija,Santa Cruz,Beni,Pando
mes,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
Jan-94,0.831143,,0.626764,0.992367,,,,1.083888,,
Feb-94,1.380217,,1.507842,1.640425,,,,1.160431,,
Mar-94,1.294237,,1.289606,1.855445,,,,0.987268,,
Apr-94,1.789721,,1.031197,4.050229,,,,1.488398,,
May-94,2.411207,,1.289172,5.333402,,,,2.274409,,
...,...,...,...,...,...,...,...,...,...,...
May-23,0.571063,0.205679,0.886875,0.060877,0.579615,-0.138078,-0.833202,0.755358,0.429766,0.146397
Jun-23,0.790519,0.543418,1.071079,0.209135,0.917164,0.020206,-0.638980,1.023831,0.471664,0.513782
Jul-23,1.160961,1.473701,1.475524,0.764633,1.397877,0.982814,0.256141,1.126014,0.448224,0.594219
Aug-23,1.551645,1.492067,2.288560,1.217029,1.813805,1.437749,0.124570,1.182909,0.747483,0.508372


In [174]:
histo_icum

Unnamed: 0_level_0,IPC_2016,IPC_1991
mes,Unnamed: 1_level_1,Unnamed: 2_level_1
Jan-1938,5.494629,5.494536
Feb-1938,8.241319,8.241804
Mar-1938,9.340494,9.340711
Apr-1938,16.483262,16.483469
May-1938,15.933674,15.934016
...,...,...
May-2023,0.571063,0.571063
Jun-2023,0.790519,0.790519
Jul-2023,1.160961,1.160961
Aug-2023,1.551645,1.551645


In [175]:
depto_icum_anual = depto_icum

In [176]:
# Convertir el índice 'mensual month-year Jan-09' a formato de fecha
depto_icum_anual.index = pd.to_datetime(depto_icum_anual.index, format='%b-%y')

# Crear la columna 'yearly' con el año de cada fila
depto_icum_anual['yearly'] = depto_icum_anual.index.year

# Agrupar por año, y tomar el último valor de cada año para cada variable
depto_icum_last_year_value = depto_icum_anual.groupby(depto_icum_anual.index.year).last()
# Eliminar la variable auxiliar "yearly"
#depto_icum_last_year_value = depto_icum_last_year_value.drop(columns=['yearly'])

depto_icum_last_year_value

Unnamed: 0_level_0,Bolivia,Sucre,La Paz,Cochabamba,Oruro,Potosí,Tarija,Santa Cruz,Beni,Pando,yearly
mes,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
1994,8.521696,,8.247584,11.389796,,,,6.675599,,,1994
1995,12.577858,,11.010992,13.485024,,,,14.335475,,,1995
1996,7.949922,,7.354512,8.612764,,,,8.438004,,,1996
1997,6.730938,,6.18508,5.840005,,,,8.820858,,,1997
1998,4.392166,,3.782233,3.899333,,,,5.58212,,,1998
1999,3.133487,,2.369236,3.232848,,,,4.053967,,,1999
2000,3.411911,,3.197058,3.667819,,,,3.499551,,,2000
2001,0.924897,,0.588998,1.036298,,,,1.31916,,,2001
2002,2.445905,,1.696689,3.022006,,,,2.875502,,,2002
2003,3.938803,,3.512547,4.417661,,,,3.752906,,,2003


In [177]:
histo_icum_anual = histo_icum

In [178]:
# Convertir el índice 'mensual month-year Jan-09' a formato de fecha
histo_icum_anual.index = pd.to_datetime(histo_icum_anual.index, format='%b-%Y')

# Crear la columna 'yearly' con el año de cada fila
histo_icum_anual['yearly'] = histo_icum_anual.index.year

# Agrupar por año, y tomar el último valor de cada año para cada variable
histo_icum_last_year_value = histo_icum_anual.groupby(histo_icum_anual.index.year).last()
# Eliminar la variable auxiliar "yearly"
#depto_icum_last_year_value = depto_icum_last_year_value.drop(columns=['yearly'])

histo_icum_last_year_value.head(10)

# Gráficos de las variables para reportes

## Configuración Gráficas Por departamento

In [179]:
from pandas._libs.tslibs.period import Period
df2 = depto_icum_last_year_value.query('yearly >= 2009').filter(items=['yearly', 'Bolivia','Sucre','La Paz',	'Cochabamba',	'Oruro',	'Potosí',	'Tarija',	'Santa Cruz',	'Beni',	'Pando']).reset_index()
df2['mescp'] = 1
df2.loc[df2['yearly']<2006, 'mescp'] = 0
df2.loc[df2['yearly']==2020, 'mescp'] = 0
# Colores anteriores
#df2['colors'] = '#d1ceeb'
#df2['colors'] = '#DC143C'
#df2['colors'] = '#C90016'
df2['colors'] = '#AF4035'
#df2.loc[df2['mescp'] > 0, 'colors'] = '#090382'
df2.loc[df2['mescp'] > 0, 'colors'] = '#002E63'
df2.tail(20)

Unnamed: 0,mes,yearly,Bolivia,Sucre,La Paz,Cochabamba,Oruro,Potosí,Tarija,Santa Cruz,Beni,Pando,mescp,colors
0,2009,2009,0.263903,-0.16184,-0.245054,0.540079,-1.28107,-2.347963,0.254283,0.958176,-0.550408,-4.260042,1,#002E63
1,2010,2010,7.18185,7.786219,6.976608,7.370431,7.65449,7.346263,7.106646,7.468945,3.674872,5.972747,1,#002E63
2,2011,2011,6.903542,6.353547,7.66618,6.342859,7.585848,7.815096,9.356695,6.420273,5.253332,9.501815,1,#002E63
3,2012,2012,4.540112,3.409843,5.029448,5.98408,3.52078,4.043065,4.053635,3.963048,1.519713,1.979937,1,#002E63
4,2013,2013,6.479683,8.400975,7.2147,6.16493,9.02886,7.546586,8.310275,5.809019,3.399959,1.936533,1,#002E63
5,2014,2014,5.194248,4.53691,4.034262,7.442834,3.865096,4.067775,9.084704,4.761118,5.553369,2.029914,1,#002E63
6,2015,2015,2.953146,2.960001,4.603151,4.082901,1.792393,1.221698,1.743358,1.412362,2.999359,-0.5392,1,#002E63
7,2016,2016,4.002939,4.899343,4.600009,4.869843,3.49471,5.696221,7.512187,2.747716,1.452062,0.826266,1,#002E63
8,2017,2017,2.714668,2.457785,1.975067,4.005971,1.72092,1.511708,11.731364,1.863317,1.837252,-1.824674,1,#002E63
9,2018,2018,1.507067,1.494139,1.87431,1.598757,1.410021,0.913092,1.658194,1.178464,0.544421,2.352107,1,#002E63


In [180]:
import plotly.graph_objects as go

fig = go.Figure()
fig.add_trace(go.Bar(x=df2.yearly, y=df2["Bolivia"], name="Depto_inflation_bol",
                marker_color=df2.colors, marker_line=dict(width=0.5, color='#000000') ))
fig.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='Bolivia: Inflación, 2009-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )

In [181]:
import plotly.graph_objects as go

# Suponiendo que tienes una columna 'values' en tu DataFrame df2 con los valores que deseas mostrar
fig = go.Figure()

# Añade la columna 'text' con los valores que quieres mostrar en cada barra
df2['text'] = df2["Bolivia"].round(2)  # Ajusta el redondeo según lo necesites

fig.add_trace(go.Bar(
    x=df2.yearly,
    y=df2["Bolivia"],
    name="Depto_inflation_bol",
    marker_color=df2.colors,
    marker_line=dict(width=0.5, color='#000000'),
    text=df2['text'],  # Añade la propiedad 'text' aquí
    textposition='outside',  # Esto determina la posición del texto en las barras
    textfont=dict(
        family="Arial",  # Puedes cambiar a la fuente que prefieras
        size=16,  # Tamaño del texto
        color="black",  # Puedes cambiar a un color más oscuro si lo prefieres
    )
))

# Resto del código para actualizar el layout
fig.update_layout(
    font_family='Arial',
    font_color="#000000",
    plot_bgcolor='white',
    separators=',',
    title_text='Bolivia: Inflación, 2009-2023',
    title_font=dict(color='#000000', size=30),
    xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
    yaxis=dict(
        title='En porcentaje',
        titlefont_size=20,
        tickfont_size=18,
        linecolor="#000000",
        ticks='outside',
        nticks=10,
        zeroline=True,
        zerolinewidth=1.5,
        zerolinecolor='#d62f15'
    ),
    hoverlabel=dict(font_size=20, font_family="Arial"),
    hovermode="x"
)

fig.show()



In [182]:
import plotly.graph_objects as go

# Suponiendo que tienes una columna 'values' en tu DataFrame df2 con los valores que deseas mostrar
fig = go.Figure()

# Añade la columna 'text' con los valores que quieres mostrar en cada barra
df2['text'] = df2["Bolivia"].round(2)  # Ajusta el redondeo según lo necesites

bar_trace = go.Bar(
    x=df2.yearly,
    y=df2["Bolivia"],
    name="Depto_inflation_bol",
    marker_color=df2.colors,
    marker_line=dict(width=0.5, color='#000000'),
    text=df2['text'],  # Añade la propiedad 'text' aquí
    textposition='outside',  # Esto determina la posición del texto en las barras
    textfont=dict(
        family="Arial",  # Puedes cambiar a la fuente que prefieras
        size=16,  # Tamaño del texto
        color="black",  # Puedes cambiar a un color más oscuro si lo prefieres
    )
)

fig.add_trace(bar_trace)

# Agregar el texto "A septiembre" en la última barra
last_value = df2["Bolivia"].iloc[-1]  # Obtener el último valor de la columna "Bolivia"
fig.add_annotation(
    x=df2.yearly.iloc[-1],  # Posición x de la última barra
    y=last_value,  # Posición y del último valor
    text="A septiembre",  # Texto a mostrar
    #showarrow=True,  # Mostrar una flecha hacia el texto (opcional)
    showarrow=False,  # Mostrar una flecha hacia el texto (opcional)
        font=dict(
        family="Arial",
        size=15,
        color="black"
    ),
    arrowhead=7,  # Tipo de flecha (opcional)
    #ax=0,  # Posición x de inicio de la flecha (opcional)
    #ay=-140  # Posición y de inicio de la flecha (opcional)
    yshift=-80  # Mover el texto hacia abajo para que esté por debajo de la barra
)

# Resto del código para actualizar el layout
fig.update_layout(
    font_family='Arial',
    font_color="#000000",
    plot_bgcolor='white',
    separators=',',
    title_text='Bolivia: Inflación, 2009-2023',
    title_font=dict(color='#000000', size=30),
    xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
    yaxis=dict(
        title='En porcentaje',
        titlefont_size=20,
        tickfont_size=18,
        linecolor="#000000",
        ticks='outside',
        nticks=10,
        zeroline=True,
        zerolinewidth=1.5,
        zerolinecolor='#d62f15'
    ),
    hoverlabel=dict(font_size=20, font_family="Arial"),
    hovermode="x"
)

fig.show()


In [183]:
import plotly.graph_objects as go

fig = go.Figure()
fig.add_trace(go.Bar(x=df2.yearly, y=df2["Sucre"], name="Depto_inflation_sucr",
                marker_color=df2.colors, marker_line=dict(width=0.5, color='#000000') ))
fig.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='Sucre: Inflación, 2009-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )

In [184]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df2.yearly, y=df2["La Paz"], name="Depto_inflation_lpz",
                marker_color=df2.colors, marker_line=dict(width=0.5, color='#000000') ))
fig.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='La Paz: Inflación, 2009-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )

In [185]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df2.yearly, y=df2["Cochabamba"], name="Depto_inflation_cbba",
                marker_color=df2.colors, marker_line=dict(width=0.5, color='#000000') ))
fig.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='Cochabamba: Inflación, 2009-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )

In [186]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df2.yearly, y=df2["Oruro"], name="Depto_inflation_orur",
                marker_color=df2.colors, marker_line=dict(width=0.5, color='#000000') ))
fig.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='Oruro: Inflación, 2009-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )

In [187]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df2.yearly, y=df2["Potosí"], name="Depto_inflation_ptsi",
                marker_color=df2.colors, marker_line=dict(width=0.5, color='#000000') ))
fig.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='Potosí: Inflación, 2009-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )

In [188]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df2.yearly, y=df2["Tarija"], name="Depto_inflation_tarj",
                marker_color=df2.colors, marker_line=dict(width=0.5, color='#000000') ))
fig.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='Tarija: Inflación, 2009-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )

In [189]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df2.yearly, y=df2["Santa Cruz"], name="Depto_inflation_tarj",
                marker_color=df2.colors, marker_line=dict(width=0.5, color='#000000') ))
fig.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='Santa Cruz: Inflación, 2009-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )

In [190]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df2.yearly, y=df2["Beni"], name="Depto_inflation_beni",
                marker_color=df2.colors, marker_line=dict(width=0.5, color='#000000') ))
fig.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='Beni: Inflación, 2009-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )

In [191]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df2.yearly, y=df2["Pando"], name="Depto_inflation_pand",
                marker_color=df2.colors, marker_line=dict(width=0.5, color='#000000') ))
fig.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='Pando: Inflación, 2009-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )

## Gráficos de la inflación histórica

In [236]:
from pandas._libs.tslibs.period import Period
df3 = histo_icum_last_year_value.query('yearly >= 1985').filter(items=['yearly', 'IPC_2016','IPC_1991']).reset_index()
df3['mescp'] = 1
df3.loc[df3['yearly']<2006, 'mescp'] = 0
df3.loc[df3['yearly']==2020, 'mescp'] = 0
# Colores anteriores
#df2['colors'] = '#d1ceeb'
#df2['colors'] = '#DC143C'
#df2['colors'] = '#C90016'
df3['colors'] = '#AF4035'
#df2.loc[df2['mescp'] > 0, 'colors'] = '#090382'
df3.loc[df3['mescp'] > 0, 'colors'] = '#002E63'

In [269]:
fig3 = go.Figure()

# Redondear los valores de inflación en su DataFrame
df3["IPC_2016"] = df3["IPC_2016"].round(1)

fig3.add_trace(go.Bar(x=df3.yearly, y=df3["IPC_2016"], name="Inflación histórica",
                marker_color=df3.colors, marker_line=dict(width=0.5, color='#000000') ))
fig3.update_layout(font_family = 'Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                  title_text='Bolivia: Inflación histórica, 1985-2023',
                  title_font = dict(color='#000000', size=30),
                  xaxis=dict(title='Año', titlefont_size=20, tickfont_size=20),
                  yaxis=dict(title='En porcentaje', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15', range=[0, 100] ),
                  hoverlabel=dict(font_size=20,font_family="Arial"),
                  hovermode="x"
                  )
# Agregar anotación para 1985
fig3.add_annotation(
    x=1985,  # Año 1985
    y=100,  # Inflación 8000%
    text="Inflación 8170%",
    showarrow=True,
    arrowhead=7,
    ax=0,
    ay=-20
)

# Añadir líneas horizontales y texto para 1985
fig3.add_shape(
    dict(
        type="line",
        x0=df3.yearly[0] -0.6,  # Año 1985
        x1=df3.yearly[0] + 0.6,  # Longitud de la línea
        y0=95,  # Valor de inflación en 1985
        y1=91,
        line=dict(color="BLACK", width=3)
    )
)

# Añadir etiquetas solo para valores después de 2006
for index, row in df3.iterrows():
    if row['yearly'] > 2006:  # Asumiendo que el nombre de la columna del año es 'yearly'.
        fig3.add_annotation(
            x=row['yearly'],  # Año
            y=row['IPC_2016'] +3,  # Valor de inflación
            text=f"{row['IPC_2016']}%",  # Texto de la etiqueta con formato
            showarrow=False,
            font=dict(size=15, color="black")
)



# Añadir líneas horizontales y texto para 1985
fig3.add_shape(
    dict(
        type="line",
        x0=df3.yearly[0] -0.6,  # Año 1985
        x1=df3.yearly[0] + 0.6,  # Longitud de la línea
        y0=92,  # Valor de inflación en 1985
        y1=88,
        line=dict(color="BLACK", width=3)
    )
)



In [230]:
x = df1_C.loc['Jan-18':, :].index
y1 = round(df1.loc['Jan-18':, "Población ocupada"], ndigits=0)
y2 = round(df1.loc['Jan-18':, "Población económicamente inactiva"], ndigits=0)
y3 = round(df1.loc['Jan-18':, "Población desocupada"], ndigits=0)

fig2 = go.Figure()

# Agrega líneas para las variables
fig2.add_trace(go.Scatter(x=x, y=y1, mode='lines+markers', name="PO", line=dict(color='#5B9BD5', width=2)))
fig2.add_trace(go.Scatter(x=x, y=y2, mode='lines+markers', name="PEI", line=dict(color='#002060', width=2)))

# Agrega la tercera variable al eje y secundario (yaxis2)
fig2.add_trace(go.Scatter(x=x, y=y3, mode='lines+markers', name="PD", line=dict(color='#70AD47', width=2), yaxis='y2'))

# Establece el rango del eje y primario
yaxis_range = [1000, max(y1.max(), y2.max()) * 1.1]  # Puedes ajustar el factor de multiplicación según tus necesidades
fig2.update_yaxes(range=yaxis_range)

# Configura el eje-y secundario
fig2.update_layout(yaxis2=dict(overlaying='y', side='right'))

# Set layout
fig2.update_layout(font_family='Arial', font_color="#000000", plot_bgcolor='white', separators=',',
                   title_text='Población Ocupada, Población Económicamente Inactiva y Población Desocupada',
                   title_font=dict(color='#000000', size=30),
                   xaxis=dict(title='Mes', titlefont_size=20, tickfont_size=15),
                   yaxis=dict(title='En miles de personas', titlefont_size=20, tickfont_size=18, linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='#d62f15'),
                   yaxis2=dict(title='En miles de personas', titlefont_size=20, tickfont_size=18, overlaying='y', side='right', linecolor="#000000", ticks='outside', nticks=10, zeroline=True, zerolinewidth=1.5, zerolinecolor='red'),
                   hoverlabel=dict(font_size=15, font_family="Arial"),
                   hovermode="x",
                   legend=dict(
                       x=0.1,
                       y=1.0,
                       traceorder='normal',
                       font=dict(family='Arial', size=20),
                   )
)

fig2.show()

## Gráfico de Inflación: mensual, acumulada y a 12 meses

In [194]:
import pandas as pd
import plotly.express as px

# Asumiendo que 'infla_depto' contiene los datos de inflación
#fig = px.area(infla_depto, x="mes", y=infla_depto.columns[1:], title="Inflación por Departamento")
fig = px.area(infla_depto, x="mes", y=infla_depto.columns[1:4], title="Inflación por Departamento") # Bolivia
# Agregar un slider para la fecha "mes"
fig.update_xaxes(rangeslider_visible=True)

# Personalizar etiquetas y leyenda, fondo blanco y tamaño de letra a 18
fig.update_layout(
    yaxis_title="En porcentaje",
    xaxis_title="Período",
    legend_title="Departamento",
    plot_bgcolor='white',  # Fondo blanco
    font=dict(family="LaTeX", size=18),  # Tipo de fuente en formato LaTeX y tamaño 18
    height=900,  # Ajustar la altura de la figura
    width=1200,   # Ajustar el ancho de la figura
    barmode='group'  # Configurar el modo de barras para que no sean acumuladas
)

# Mostrar el gráfico
fig.show()