
    # Análisis de Series Temporales de Productos de Amazon

    Este notebook presenta un análisis de los lanzamientos de productos de Amazon a lo largo de los años. El objetivo es entender la tendencia, estacionalidad y homocedasticidad de la serie temporal, y proponer un modelo ARIMA adecuado para su modelado.

    ## Exploración Inicial de los Datos
    

In [None]:

import pandas as pd

# Cargar los datos
file_path = 'Amazon Products - Sheet1.csv'
data = pd.read_csv(file_path)

# Mostrar las primeras filas
data.head()
    


    ## Transformación de los Datos en Serie Temporal

    Transformamos los datos para crear una serie temporal que represente el número de lanzamientos de productos por año.
    

In [None]:

import matplotlib.pyplot as plt
import seaborn as sns

# Crear la serie temporal
product_launches_per_year = data['Launch Year'].value_counts().sort_index()

# Graficar la serie temporal
sns.set(style="whitegrid")
plt.figure(figsize=(10, 6))
product_launches_per_year.plot(kind='line')
plt.title('Número de Lanzamientos de Productos de Amazon por Año')
plt.xlabel('Año')
plt.ylabel('Cantidad de Lanzamientos')
plt.grid(True)
plt.show()
    


    ## Análisis de Tendencia y Estacionalidad

    Realizamos una descomposición de la serie temporal para identificar la tendencia y la estacionalidad.
    

In [None]:

from statsmodels.tsa.seasonal import seasonal_decompose

# Descomposición de la serie temporal
decomposition = seasonal_decompose(product_launches_per_year, model='additive')

# Graficar la descomposición
plt.figure(figsize=(14, 8))
plt.subplot(411)
plt.plot(decomposition.trend, label='Tendencia')
plt.legend(loc='best')
plt.xticks(rotation=45)
plt.subplot(412)
plt.plot(decomposition.seasonal, label='Estacionalidad')
plt.legend(loc='best')
plt.xticks(rotation=45)
plt.subplot(413)
plt.plot(decomposition.resid, label='Residual')
plt.legend(loc='best')
plt.xticks(rotation=45)
plt.subplot(414)
plt.plot(product_launches_per_year, label='Observado')
plt.legend(loc='best')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
    


    ## Prueba de Dickey-Fuller para Estacionariedad

    Utilizamos la prueba de Dickey-Fuller aumentada para evaluar si la serie temporal es estacionaria.
    

In [None]:

from statsmodels.tsa.stattools import adfuller

# Prueba de Dickey-Fuller aumentada
adf_test = adfuller(product_launches_per_year)

# Resultados de la prueba
adf_results = {
    'Prueba Estadística': adf_test[0],
    'P-valor': adf_test[1],
    'Lags Utilizados': adf_test[2],
    'Número de Observaciones': adf_test[3],
    'Valores Críticos': adf_test[4]
}
adf_results
    


    ## Análisis de Homocedasticidad

    Evaluamos si la varianza de la serie temporal es constante a lo largo del tiempo.
    

In [None]:

import numpy as np

# Calcular la varianza móvil
rolling_var = product_launches_per_year.rolling(window=5).var()

# Graficar la varianza móvil
plt.figure(figsize=(10, 6))
plt.plot(rolling_var)
plt.title('Varianza Móvil de la Serie Temporal (Ventana de 5 Años)')
plt.xlabel('Año')
plt.ylabel('Varianza')
plt.grid(True)
plt.show()
    


    ## Sugerencia de Modelo ARIMA

    Basándonos en el análisis anterior, sugerimos un modelo ARIMA para modelar la serie temporal. También discutimos las ventajas y desventajas del modelo propuesto.
    

In [None]:

from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

# Diferenciar la serie
differenced_series = product_launches_per_year.diff().dropna()

# Graficar ACF y PACF
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(12, 8))
plot_acf(differenced_series, ax=ax1, lags=10)
plot_pacf(differenced_series, ax=ax2, lags=10)
plt.tight_layout()
plt.show()
    


    ### Conclusión y Ventajas/Desventajas del Modelo ARIMA

    **Modelo Sugerido**: ARIMA(1,1,1)

    **Ventajas**:
    - Flexibilidad en el modelado de diferentes patrones temporales.
    - Interpretabilidad de los parámetros.
    - Adecuado para pronósticos a corto plazo.

    **Desventajas**:
    - Supone linealidad en las relaciones temporales.
    - Sensible a outliers.
    - Requiere estacionariedad de la serie.
    - Puede no capturar relaciones complejas o no lineales.

    Este modelo es un punto de partida y puede requerir ajustes según una evaluación más detallada.
    

In [None]:
# Calcular la varianza móvil con una ventana de 5 años
rolling_var = product_launches_per_year.rolling(window=5).var()

# Graficar la varianza móvil
plt.figure(figsize=(10, 6))
plt.plot(rolling_var)
plt.title('Varianza Móvil de la Serie Temporal (Ventana de 5 Años)')
plt.xlabel('Año')
plt.ylabel('Varianza')
plt.grid(True)
plt.show()

# Calcular y mostrar la varianza media
mean_variance = np.mean(rolling_var)
mean_variance

### Análisis de ACF y PACF
Realizamos los gráficos de Autocorrelación (ACF) y Autocorrelación Parcial (PACF) para determinar los valores adecuados para los parámetros \(p\) y \(q\) del modelo ARIMA.

In [None]:
# Diferenciar la serie para obtener estacionariedad
differenced_series = product_launches_per_year.diff().dropna()

# Graficar ACF y PACF
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(12, 8))

# Autocorrelación (ACF)
plot_acf(differenced_series, ax=ax1, lags=20)

# Autocorrelación Parcial (PACF)
plot_pacf(differenced_series, ax=ax2, lags=20)

plt.tight_layout()
plt.show()

### Propuesta del Modelo ARIMA
Basado en el análisis anterior, proponemos un modelo ARIMA(1,1,1). Este modelo se elige considerando los resultados de la prueba de Dickey-Fuller, los gráficos de ACF y PACF, y la naturaleza de la serie temporal.

**Ventajas y Desventajas del Modelo ARIMA(1,1,1)**:
- **Ventajas**:
  - Flexibilidad para capturar una variedad de patrones temporales.
  - Interpretabilidad clara de los parámetros.
  - Adecuado para pronósticos a corto plazo.
- **Desventajas**:
  - Supone una relación lineal entre las observaciones.
  - Sensibilidad a outliers.
  - Requiere estacionariedad.
  - Puede no capturar relaciones complejas o no lineales.

### Propuesta del Modelo ARIMA
Basado en el análisis anterior, proponemos un modelo ARIMA(1,1,1). Este modelo se sugiere debido a la necesidad de una diferenciación para lograr estacionariedad (d=1), y las observaciones en los gráficos de ACF y PACF sugieren p=1 y q=1.

#### Ventajas y Desventajas del Modelo ARIMA(1,1,1)
**Ventajas**:
- Flexibilidad para modelar diferentes patrones temporales.
- Interpretabilidad clara de los parámetros del modelo.
- Adecuado para pronósticos a corto plazo.

**Desventajas**:
- Supone una relación lineal entre observaciones.
- Sensible a outliers y anomalías.
- Requiere estacionariedad de la serie.
- Puede no ser adecuado para patrones complejos o no lineales.

Es importante considerar estas ventajas y desventajas al aplicar el modelo ARIMA a este conjunto de datos.