# Estadística descriptica y el análisis de datos

Utilizaremos el Índice de Precios al Consumidos *(IPC)* ~ este mide los precios que pagan mensualmente los consumidores urbanos por una selección de productos y servicios. [Cada mes se publica una nueva observación, formando una serie de tiempo continua].

> La tasa de inflación entre dos periodos de tiempo cualquiera se mide por los cambios porcentuales en el índice de precios.

> Por ejemplo, si el precio del pan el año pasado era de $1.00 y el precio hoy es de $1.01, entonces la inflación es del 1.00%. El IPC se publica típicamente de manera interanual, lo que significa que se informa como la diferencia entre la observación mensual actual y la observación de hace 12 meses.

In [None]:
# Importemos los datos del CPI
import pandas_datareader as pdr

# Selección de periodo
start_date = '1950-01-01'
end_date = '2023-01-23'

# Creación de un datafreame y descargando su información
cpi = pdr.DataReader('CPIAUCSL', 'fred', start_date, end_date)

# Obtención de los 5 últimos registros
cpi.tail()

# Comprobemos cuántos valores 'nan' tiene el dataframe
count_nan = cpi['CPIAUCSL'].isnull().sum()
# Imprimamos el resultado
print('Número de valores "nan" en el dataframe: ' + str(count_nan))

# Transformando CPI por año
cpi = cpi.pct_change(periods= 12, axis = 0) * 100
# Borramos los valores 'nan' de los registros
cpi = cpi.dropna()

Número de valores "nan" en el dataframe: 0


Unnamed: 0_level_0,CPIAUCSL
DATE,Unnamed: 1_level_1
2022-09-01,8.205752
2022-10-01,7.757261
2022-11-01,7.13138
2022-12-01,6.410832
2023-01-01,6.340296


Utilizamos el cambio proporcional entre el valor actual y el de hace 12 periodos (normalmente, si el índice es mensual).

YoY = Year-over-Year (término en inglés equivalente a interanual).

In [9]:
# Calculemos la media del CPI de los últomos 20 años
cpi_latest = cpi.iloc[-240:]
mean = cpi_latest['CPIAUCSL'].mean()

print("La media de los datos: " + str(mean), '%')

La media de los datos: 2.4945282480797544 %
