In [1]:
%matplotlib inline
import matplotlib
import seaborn as sns
sns.set()
matplotlib.rcParams['savefig.dpi'] = 144

In [2]:
import numpy as np
import matplotlib.pyplot as plt 

# **Makine Öğrenimine Giriş**

Öğrenmek ne anlama geliyor? Öğrenme, bir dizi gözlem yaptığımız ve geçmiş deneyimlere dayanarak sonuçlar çıkardığımız bir süreçtir. Örneğin, daha geç otobüse bindiğimde işe geç kaldığım gibi deneyimsel verilerdeki kalıpları tanımayı öğrenebiliriz. Makine Öğrenimi, bir bilgisayara aynı şeyi yapmayı, yani verilerdeki örüntüleri bulmayı öğrettiğimiz zamandır. Buradaki fikir, insanların örüntü bulma konusunda gerçekten harika, ancak büyük miktarda veriye bakma konusunda nispeten yavaş olduklarıdır. Bilgisayarların örüntüleri bulmak için eğitilmeleri gerekir, ancak elimizdeki türden verileri (csv dosyaları, resimler, vb.) inanılmaz derecede hızlı işleyebilirler.

Makine Öğrenimi devriminin kökleri iki ana faktöre dayanmaktadır

1.Yeni üretilen büyük miktarda veri

2.Bilgisayar belleğinde ve performansında büyük bir gelişme

Makine öğreniminden yararlanmak istiyorsak, bilgisayarlara örüntüleri tanımayı öğretmeyi ve bu yeteneği gerçek dünya örüntülerini çözmek için kullanmayı öğrenmemiz gerekir. Gerçekten basit bir örnekle başlayalım.


In [None]:
X = np.linspace(0, 1, 100)
exp = np.random.choice([2, 3])
y = X**exp + np.random.randn(X.shape[0]/10)
plt.plot(X, y, '.');

Şimdi mümkün olan en basit yöntemlerden birini kullanarak, verilere bir doğru uydurarak tahminsel ilişkiyi oluşturacağız

In [None]:
p = np.polyfit(X, y, 1)
z = np.poly1d(p)
plt.plot(X, y, '.')
plt.plot(X, z(X), label=r"Model: ${:.2f}x + {:.2f}$".format(*p))
plt.plot(X, X**exp, label=r'Truth: $x^{}$'.format(exp))
plt.legend();

Artık bu veriler için bilgisayar tarafından öğrenilen bir modelimiz var, yani 
 değerini (veya bir grup değeri) kullanarak çıktıyı tahmin edebiliriz. Makine Öğrenimi bağlamında buna Doğrusal Regresyon denir ve öğrenmek için oldukça güçlü ve genel bir yöntemdir. Sadece bu örnek bile daha sonraki derslerde yanıtlayacağımız pek çok soruya kapı açmaktadır:

1. Model ne kadar iyi?
2. Modele esneklik katabilir miyiz?
3. Model genelleştirilebilir mi?
4. Bu model bize veriler hakkında ne öğretiyor?

Makine Öğrenimi, denetimli öğrenme ve denetimsiz öğrenme olmak üzere iki sınıfa ayrılır. Denetimli öğrenmede, verilerimizin özellikleri ile bir tür çıktı etiketi arasında tahmin edici bir ilişki öğrenmeye çalışıyoruz. Denetimsiz öğrenmede ise herhangi bir hedef etiket kullanmadan özelliklerimizdeki eğilimleri bulmak isteriz. Denetimsiz öğrenme tipik olarak verilerin boyutluluğunu azaltmaya dayanır.

Denetimli öğrenmenin genel amacı, daha sonra bu modeli orijinali temsil eden bir özellik matrisi oluşturabilecek etiketsiz verilere uygulamaktır. Bu da tahminler yapmamızı sağlar!

Elbette, makine öğrenimi sadece bir araçtır, dikkatle ve düşünülerek uygulanması gereken bir araçtır. Her sorun için ideal çözüm değildir. Karşılaşabileceğimiz bazı sorunlara bir göz atalım.

# **Makine Öğrenimi Zorlukları**

Modeller büyük ölçüde önyargılı olabilir ve bu nedenle genellemeyi idare edecek kadar esnek olmayabilir. Orijinal fonksiyonumuzu daha geniş bir aralıkta çizelim ve önceki modeli kullanalım.

In [None]:
X = np.linspace(0, 2, 100)
y = X**exp + np.random.randn(X.shape[0]/10)
plt.plot(X, z(X), label=r"${:.2f}x + {:.2f}$".format(*p))
plt.plot(X, y, '.', label=r'$x^{}$'.format(exp))
plt.legend();


Model, başlangıçta verilerimizi dikkate aldığımız aralık için oldukça iyi çalışıyor, ancak dikkate aldığımız aralığın dışındaki özelliklere iyi genelleme yapmayacağını görebiliyoruz. Bu genel bir sorundur; eğitim verilerimizin üzerinde tahminler yapmayı beklediğimiz iyi örneklenmiş bir dağılım içermesine dikkat etmeliyiz (ya da eğitim verilerimizin etki alanının ötesinde tahminler yapabilmemiz gerektiğini söyleyen bazı ön bilgilere sahip olmalıyız). Makine öğrenimi daha önce gördüğü verilerdeki örüntüleri bulur ve görmediği veriler üzerinde her zaman iyi tahminler yapamaz.

Modele daha fazla parametre ekleyerek bunu düzeltmeye çalışalım.


In [None]:
p = np.polyfit(X, y, 15)
z = np.poly1d(p)
plt.figure(figsize=[14, 6])
plt.plot(X, z(X), label=r"${:.2f}x^{{15}} + {:.2f}x^{{14}} + ... + {:.2f}$".format(*p[[0, 1, -1]]))
plt.plot(X, y, '.', label=r'$x^{}$'.format(exp))
plt.legend();

Mükemmel bir uyum gibi görünüyor! Belki de fazla iyi? Görünüşe göre model, gerçek olmadığını bildiğimiz verilerdeki küçük dalgalanmalara uyuyor (gerçek veriler basit bir üstelden türetilmiştir). Tekrar genelleştirmeyi deneyelim.

In [None]:
X = np.linspace(0, 2.5, 100)
y = X**exp + np.random.randn(X.shape[0])/10
plt.plot(X, z(X), label=r"model")
plt.plot(X, y, '.', label=r'$x^{}$'.format(exp))
plt.legend();


Yine mi! Bu oldukça kötü. Bu, modele çok fazla esneklik tanıdığımız ve verideki genelleştirilemeyen gürültüye uyduğu bir aşırı uyum örneğidir.

# **Scikit-Learn**

Makine öğrenimini gerçekleştirmek için scikit-learn paketini kullanacağız ve farklı makine öğrenimi modellerine ve yardımcı programlarına birleşik sınıf tabanlı bir arayüz sunacağız. Scikit-learn, makine öğrenimi için gerekli yöntemleri uygulayan bir Estimator sınıfı fikrine dayanmaktadır.

Her tahmin edici nesnesi, argüman olarak bir özellik matrisi X ve bir etiket vektörü y kabul eden bir fit yönteminin yanı sıra bir argüman olarak bir özellik matrisi X kabul eden bir tahmin yöntemini uygulayacaktır. Bir örnek üzerinden gidelim.

Öncelikle istediğimiz tahmin ediciyi içe aktarmamız gerekecek, bu durumda bir LinearRegression (bunu her ad alanı için yalnızca bir kez yapmamız gerekir, bu yalnızca bir Python sınıfıdır).

In [None]:
from sklearn.linear_model import LinearRegression

Şimdi bu sınıfın bir örneğini oluşturabilir ve herhangi bir hiper parametreyi oluşturmaya aktarabiliriz. LinearRegression'ın fit_intercept ve normalize olmak üzere iki ana hiper parametresi vardır. Bunların varsayılan değerleri vardır, ancak biz bunları burada açıkça belirteceğiz.

In [None]:
lr = LinearRegression(fit_intercept=True, normalize=False)
lr

Şimdi bu nesneyi daha önceki verilerimize uydurmak için kullanabiliriz. Bunu yapmak için fit yöntemini kullanacağız. X vektörünü, tek boyutlu bir vektör yerine tek sütunlu bir özellik matrisi olacak şekilde yeniden şekillendirmemiz gerekecek.

In [None]:
lr.fit(X.reshape(-1, 1), y)


Fit metodu fit işlemini gerçekleştirir ve fit edilen parametreleri nesnenin durumuna dahili olarak kaydeder. İstersek bunları görebiliriz.

In [None]:
lr.coef_, lr.intercept_

Parametreleri örneğin içine kaydetmek, tüm nesneyi seçmemize ve parametreleri modelin içine kaydetmemize izin verdiği için son derece kullanışlıdır.

Son olarak tahminler yapmak için predict metodunu kullanabiliriz.

In [None]:
predictions = lr.predict(X.reshape(-1, 1))
plt.plot(X, y, '.', label='data')
plt.plot(X, predictions, label='model')
plt.legend();

Doğrusal modelleri daha sonraki bir derste daha ayrıntılı olarak inceleyeceğiz, ancak bu modeli daha iyi hale getirmek istiyorsak, bazı daha iyi özellikler tasarlamamız gerekecek. Nereye gittiğimize dair bir fikir edinmek için biraz daha scikit-learn makinesi kullanalım.

In [None]:
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures

pipe = Pipeline([
    ('polynomial_transform', PolynomialFeatures(3)),
    ('linear_fit', LinearRegression())
])

pipe.fit(X.reshape(-1, 1), y)

predictions = pipe.predict(X.reshape(-1, 1))
plt.plot(X, y, '.', label='data')
plt.plot(X, predictions, label='model')
plt.legend();

Bu genelleştirilebilir mi?

In [None]:
X = np.linspace(0, 4, 100)
y = X**exp + np.random.randn(X.shape[0])/10
predictions = pipe.predict(X.reshape(-1, 1))
plt.plot(X, y, '.', label='data')
plt.plot(X, predictions, label='model')
plt.legend();