### Statsmodels: Introdução
Statsmodels é uma biblioteca Python usada para modelagem estatística. Ela oferece ferramentas para estimar modelos de regressão, séries temporais e realizar testes estatísticos.

Nesta seção, veremos exemplos básicos de:
- Regressão linear simples
- Regressão múltipla
- Testes estatísticos (como o teste t)
- Modelagem de séries temporais (ARIMA)

---

#### 1. **Regressão Linear Simples**

In [3]:
import statsmodels.api as sm
import numpy as np

# Gerar dados de exemplo
np.random.seed(0)
X = np.random.rand(100)
Y = 2 * X + np.random.normal(0, 0.1, 100)

# Adicionar um intercepto (termo constante)
X = sm.add_constant(X)

# Ajustar o modelo de regressão linear
model = sm.OLS(Y, X)
results = model.fit()

# Resumo dos resultados
print(results.summary())

                            OLS Regression Results                            
Dep. Variable:                      y   R-squared:                       0.971
Model:                            OLS   Adj. R-squared:                  0.971
Method:                 Least Squares   F-statistic:                     3262.
Date:                Fri, 10 Jan 2025   Prob (F-statistic):           4.88e-77
Time:                        11:28:38   Log-Likelihood:                 88.744
No. Observations:                 100   AIC:                            -173.5
Df Residuals:                      98   BIC:                            -168.3
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const          0.0222      0.019      1.149      0.2

#### 2. Regressão Múltipla
A regressão múltipla envolve mais de uma variável independente para prever a variável dependente.

In [4]:
# Gerar dados de exemplo
X1 = np.random.rand(100)
X2 = np.random.rand(100)
Y = 2 * X1 + 3 * X2 + np.random.normal(0, 0.1, 100)

# Organizar as variáveis independentes em um array
X = np.column_stack((X1, X2))
X = sm.add_constant(X)  # Adicionar o intercepto

# Ajustar o modelo de regressão múltipla
model = sm.OLS(Y, X)
results = model.fit()

# Resumo dos resultados
print(results.summary())

                            OLS Regression Results                            
Dep. Variable:                      y   R-squared:                       0.991
Model:                            OLS   Adj. R-squared:                  0.991
Method:                 Least Squares   F-statistic:                     5413.
Date:                Fri, 10 Jan 2025   Prob (F-statistic):          3.15e-100
Time:                        11:29:18   Log-Likelihood:                 90.476
No. Observations:                 100   AIC:                            -175.0
Df Residuals:                      97   BIC:                            -167.1
Df Model:                           2                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const         -0.0081      0.025     -0.318      0.7

#### 3. Testes Estatísticos

In [5]:
from scipy import stats

# Dados de exemplo
data = np.random.normal(0, 1, 100)

# Teste t para a média
t_statistic, p_value = stats.ttest_1samp(data, 0)
print("Estatística t:", t_statistic)
print("Valor p:", p_value)


Estatística t: -0.5160617008954193
Valor p: 0.606962022418332


#### 4. Modelagem de Séries Temporais (ARIMA)
Statsmodels tem ferramentas para modelar séries temporais. Aqui, usamos o modelo ARIMA (AutoRegressive Integrated Moving Average) para uma série temporal fictícia.

In [6]:
import pandas as pd
from statsmodels.tsa.arima.model import ARIMA

# Gerar dados de séries temporais
np.random.seed(0)
data = np.random.randn(100)

# Converter para uma série temporal
ts = pd.Series(data)

# Ajustar o modelo ARIMA
model = ARIMA(ts, order=(1, 1, 1))
results = model.fit()

# Exibir os resultados do modelo
print(results.summary())


                               SARIMAX Results                                
Dep. Variable:                      y   No. Observations:                  100
Model:                 ARIMA(1, 1, 1)   Log Likelihood                -140.962
Date:                Fri, 10 Jan 2025   AIC                            287.923
Time:                        11:30:33   BIC                            295.709
Sample:                             0   HQIC                           291.073
                                - 100                                         
Covariance Type:                  opg                                         
                 coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
ar.L1         -0.0464      0.111     -0.418      0.676      -0.264       0.171
ma.L1         -0.8923      0.057    -15.600      0.000      -1.004      -0.780
sigma2         0.9929      0.142      6.995      0.0