# Statsmodels Kütüphanesi Rehberi

## Statsmodels Nedir?

`statsmodels`, Python'da istatistiksel modellerin tahmin edilmesi, test edilmesi ve analiz edilmesi için kullanılan güçlü bir kütüphanedir. Özellikle ekonometri ve istatistiksel modelleme alanlarında derinlemesine analizler yapmak için tasarlanmıştır. Pandas ve NumPy ile sorunsuz bir şekilde entegre çalışır.

## Neden Statsmodels Kullanmalıyız?

- **Kapsamlı İstatistiksel Modeller:** Lineer modeller, genelleştirilmiş lineer modeller (GLM), zaman serisi analizleri (ARIMA, VAR), lojistik regresyon ve daha birçok modeli içerir.
- **Detaylı Sonuç Raporları:** Model sonuçlarını (katsayılar, standart hatalar, p-değerleri, R-kare vb.) içeren ayrıntılı özet tablolar sunar.
- **Formül Tabanlı Modelleme:** R dilindekine benzer şekilde, formüller kullanarak model tanımlamayı destekler (Patsy kütüphanesi aracılığıyla).
- **Güvenilirlik ve Doğruluk:** İstatistiksel hesaplamalar konusunda test edilmiş ve güvenilir bir kütüphanedir.

https://www.statsmodels.org/stable/user-guide.html adresinden yardım alabilirsiniz

## Kurulum

In [2]:
!pip install statsmodels



## Temel Kullanım Örnekleri

### 1. Lineer Regresyon (Ordinary Least Squares - OLS)

In [3]:
import statsmodels.api as sm
import numpy as np

# Örnek veri oluşturalım
X = np.random.rand(100, 1) # Bağımsız değişken
X = sm.add_constant(X)      # Modele sabit terim (intercept) ekliyoruz
y = 2 * X[:, 1] + 1 + np.random.randn(100) # Bağımlı değişken (y = 2x + 1 + gürültü)

# OLS modelini kuralım ve eğitelim
model = sm.OLS(y, X)
results = model.fit()

# Model sonuçlarını yazdıralım
print(results.summary())

                            OLS Regression Results                            
Dep. Variable:                      y   R-squared:                       0.216
Model:                            OLS   Adj. R-squared:                  0.208
Method:                 Least Squares   F-statistic:                     27.04
Date:                Sat, 16 Aug 2025   Prob (F-statistic):           1.09e-06
Time:                        21:39:10   Log-Likelihood:                -141.93
No. Observations:                 100   AIC:                             287.9
Df Residuals:                      98   BIC:                             293.1
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const          0.9755      0.192      5.076      0.0

### 2. Lojistik Regresyon

In [4]:
import statsmodels.api as sm
import numpy as np

# Örnek veri oluşturalım
X = np.random.rand(100, 1) * 10 - 5 # Bağımsız değişken
X = sm.add_constant(X)
beta = np.array([0.5, 1.5]) # Gerçek katsayılar
p = 1 / (1 + np.exp(-X @ beta)) # Olasılıkları hesapla
y = np.random.binomial(1, p) # 0 veya 1 olarak sınıf etiketleri oluştur

# Lojistik regresyon modelini kuralım (Logit)
model = sm.Logit(y, X)
results = model.fit()

# Model sonuçlarını yazdıralım
print(results.summary())

Optimization terminated successfully.
         Current function value: 0.152437
         Iterations 9
                           Logit Regression Results                           
Dep. Variable:                      y   No. Observations:                  100
Model:                          Logit   Df Residuals:                       98
Method:                           MLE   Df Model:                            1
Date:                Sat, 16 Aug 2025   Pseudo R-squ.:                  0.7795
Time:                        21:39:19   Log-Likelihood:                -15.244
converged:                       True   LL-Null:                       -69.135
Covariance Type:            nonrobust   LLR p-value:                 3.000e-25
                 coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
const          0.6373      0.520      1.226      0.220      -0.381       1.656
x1             1.9789      0.

### 3. Zaman Serisi Analizi (ARIMA)

In [1]:
import statsmodels.api as sm
import numpy as np

# Örnek zaman serisi verisi oluşturalım
n_sample = 100
x = np.arange(n_sample)
y = 2 * x + np.random.randn(n_sample) * 10

# ARIMA(p,d,q) modelini kuralım. Örnek olarak ARIMA(1,1,0) kullanalım.
model = sm.tsa.ARIMA(y, order=(1, 1, 0))
results = model.fit()

# Model sonuçlarını yazdıralım
print(results.summary())

# Gelecek 5 adım için tahmin yapalım
forecast = results.forecast(steps=5)
print("Gelecek 5 adım için tahminler:")
print(forecast)

                               SARIMAX Results                                
Dep. Variable:                      y   No. Observations:                  100
Model:                 ARIMA(1, 1, 0)   Log Likelihood                -395.416
Date:                Sat, 16 Aug 2025   AIC                            794.832
Time:                        21:42:51   BIC                            800.022
Sample:                             0   HQIC                           796.932
                                - 100                                         
Covariance Type:                  opg                                         
                 coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
ar.L1         -0.3992      0.100     -3.993      0.000      -0.595      -0.203
sigma2       172.1846     20.075      8.577      0.000     132.839     211.531
Ljung-Box (L1) (Q):                   3.62   Jarque-