Lojistik regresyon, isminde “regresyon” geçmesine rağmen bir sınıflandırma algoritmasıdır. Yani görseldeki hayvanın kedi mi, köpek mi olduğu veya verilmiş olan bilgilerin bir erkeğe mi yoksa bir kadına mı ait olduğunu tahmin etme gibi iki sınıflı sınıflandırma problemlerinde sıkça kullanılır.

Lojistik regresyonun, lineer regresyon ile arasındaki en büyük farkı iki sınıfı birbirinden ayıracak çizgiyi nasıl uyguladığıdır (fit). Lineer regresyon, optimum çizgiyi çizmek için “En Küçük Kareler Yöntemi” (Least Squares) kullanırken, lojistik regresyon “Maksimum Olabilirlik” (Maximum Likelihood) kullanır.
![Logisticregression](https://miro.medium.com/v2/resize:fit:1400/format:webp/1*FgUTutnPXhx92LqdQVcMcw.jpeg)


Lojistik regresyon, sınıflandırma yapmak için Sigmoid (Lojistik) Fonksiyonu kullanır. Sigmoid fonksiyonu “S” şeklinde bir eğridir.

![](https://miro.medium.com/v2/resize:fit:1400/format:webp/1*NloTSPs4pCMYDZ8G1kxhoQ.png)

In [None]:

# Gerekli kütüphanelerin içe aktarılması
import numpy as np 
from sklearn.linear_model import LogisticRegression
import matplotlib.pyplot as plt
import seaborn as sns



# X ve y değerlerinin oluşturulması
x = np.arange(100).reshape(-1, 1)
y = np.array([0]*50 + [1]*50)




# Verisetinin train ve test olarak ayrılması
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(x,y, test_size =.3)



# Modelin eğitilmesi
model = LogisticRegression().fit(X_train,y_train)


y_pred = model.predict(X_test)



# Accuracy score değerinin hesaplanması
from sklearn.metrics import accuracy_score

print("Accucarcy score: ", accuracy_score(y_test,y_pred))


# Karmaşıklık matrisinin ısı haritası olarak çizilmesi
from sklearn.metrics import confusion_matrix

sns.heatmap(confusion_matrix(y_test,y_pred),annot=True)
plt.show()

Accuracy score: 0.96666…

![](https://miro.medium.com/v2/resize:fit:1400/format:webp/1*enFmq7V3pvuNkxnzxZnZbg.png)

# Avantajları:
* Lojistik regresyonun uygulanması, yorumlanması kolaydır.
* Veri seti doğrusal olarak ayrılabiliyorsa oldukça iyi performans gösterir.
* Overfitting’e daha az meyillidir ama büyük veri setlerinde overfit olabilir.


# Dezavantajları:
* Gözlem sayısı özellik sayısından azsa, Lojistik Regresyon kullanılmamalıdır, aksi takdirde overfit olabilir.
* Lojistik regresyonun ayrım yapabilmesi için veri setinin doğrusal olarak ayrılabiliyor olması lazım.

<div style="text-align:center;">
  <p><strong>Yazar:</strong> <a href="https://www.linkedin.com/in/ahmet-tazeg%C3%BCl-66b3a11b4/" target="_blank">Ahmet Yasin Tazegül</a></p>
  <img src="https://static.wixstatic.com/media/3ef854_11e098a45f1c4895a579489e193fd160~mv2.png/v1/fill/w_771,h_771,al_c,q_90,usm_0.66_1.00_0.01,enc_auto/3ef854_11e098a45f1c4895a579489e193fd160~mv2.png" alt="ITU VBK Logo">
  <a href="https://www.ituvbk.com/" target="_blank">İTÜ VBK</a>
</div>
