# Ön Hazırlıklar (✗)

- toc: true 
- badges: true
- comments: true
- categories: [jupyter]
- image: images/chart-preview.png

# **Ön Hazırlıklar**

  Derin öğrenmeye başlamak için birkaç tane temel beceriyi geliştireceğiz. Tüm
makine öğrenmesi veriden bilgi cekmek ile ilgilidir. Bu yüzden veri depolama, işleme ve veri ön işleme gibi pratik becerileri öğrenerek başlayacağız.

  Üstelik, makine öğrenmesi tipik olarak satırların örneklere ve sütunların 
niteliklere karşılık geldiği tablolar olarak düşünebildiğimiz geniş veri kümeleriyle çalışmayı gerektirir. Lineer cebir, tablo halindeki veri ile çalışmak için bize güçlü bir dizi teknikler verir. Çok ayrıntıya girmeyeceğiz ve daha ziyade matris işlemleri ve onların uygulamalarının temeline odaklanacağız.

  Ek olarak, derin öğrenme optimizasyon ile ilgilidir. Bazı parametreler ile bir modele sahibiz ve verimize en iyi uyan parametreleri ve modeli bulmak istiyoruz. Bir algoritmanın her adımında her parametrenin hangi yöne gideceğini belirlemek biraz analiz(calculus) gerektirir. İleride bu konuya özetle değineceğiz. Neyse ki autograd paketi otomatik olarak bizim için türev hesaplar ve bunu da daha sonra ele alacağız.

  Makine öğrenmesi tahminler yapma ile bağlantılıdır: gözlemlediğimiz bilgiler göz önüne alındığında bazı bilinmeyen özelliklerin olası değeri nedir? Belirsizlik altında titizlikle mantık yürütmek için olasılığı hatırlamamız gerekecek.

  Son olarak, resmi dökümantasyon bu kitabın ötesinde birçok açıklama ve örnek sağlamaktadır. Bölümü bitirirken gerekli bilgiler için dökümantasyona nasıl bakacağınızı göstereceğiz. 

  Bu kitap derin öğrenmeyi doğru bir şekilde anlamak için matematiksel içeriği minimumda tutmuştur. Ama bu, kitabın matematik içermediği anlamına gelmez. Bu yüzden bu bölüm, kitabın matematiksel içeriğinin en azından çoğunu anlamalarına olanak sağlamak için temel ve sık kullanılan matematiğe hızlı bir giriş yapar. Eğer tüm matematiksel içeriği anlamak istiyorsanız Bölüm 18'e bakmanız yeterli olacaktır.

## **Veri İşleme**

  Birşey yapılması için veri depolamak ve veri işlemeye bir yol bulmamız gerekir. Genel olarak veri ile yapmamız gereken iki önemli şey vardır: (i) veriyi elde etmek, (ii) bilgisayara girdikten sonra verileri işlemek. Veri depolamanın bir yolu olmadan elde etmenin bir anlamı yok. Bu yüzden önce sentetik verileri ele alarak başlayalım. Başlamak için n-boyutlu dizi ortaya koyuyoruz. Numpy ve MXNet'te böyle bir diziye ndarray PyTorch ve TensorFlow da Tensor denir. Bu kitap boyunca ndarray ismini kullanıyoruz. ndarray bir sınıftır ve her örneğe bir ndarray diyoruz.

##### > MXNet
  Python'da en çok kullanılan bilimsel hesaplama paketi olan Numpy çalıştıysanız, bu bölümü tanıdık bulacaksınız. MXNet de ndarray bir sınıftır ve her hangi bir tensor(n boyurlu dizi) bir ndarray örneğidir. 
  MXNet'in tensorleri, Numpy'ın tensorlerine(n boyutlu dizilerine) birkaç önemli özellik ile birlikte bir genişlemesidir. İlk olarak MXNet'in tensorleri CPU, GPU ve dağıtılmış bulut mimarileri üzerinde asenkron hesaplamaları desteklerken, Numpy sadece CPU hesaplamasını destekler. İkinci olarak MXNet'in tensorleri otomatik türevi destekler. Bu özellikler derin öğrenme için MXNet'in tensorlerini uygun hale getirir. Bu kitap boyunca tensorler dediğimizde aksini ifade etmedikçe MXNet'in ndarray örneklerinden söz ediyoruz.
  


### **Başlangıç**

  Bu bölümde, bu kitabın başından sonuna kadar ilerledikçe inşa edeceğiniz temel matematik ve sayısal hesaplama araçları ile sizi hazırlamak ve çalıştırmayı amaçlıyoruz. Matematik kavramlarının veya kütüphane fonksiyonlarının bazılarını anlamaya çalışıyorsanız eğer endişelenmeyin. Aşağıdaki bölümler pratik örnekler ile birlikte bu materyali yeniden ele alacaktır. Diğer yandan eğer biraz geçmişiniz varsa ve matematiksel içeriğin daha derinine inmek istiyorsanız, bu bölümü geçebilirsiniz.


  Başlamak için MXNet'den np(numpy) ve npx(numpy_extension) modüllerini yükleyelim. Burada npx modülü Numpy gibi bir ortamda derin öğrenmeyi güçlendirmek için geliştirilmiş bir genişleme kümesi içerirken, np modülü Numpy tarafından desteklenen fonksiyonları içermektedir. Tensorleri kullanırken her zaman set_np() fonksiyonunu çağırırız. Bu MXNet'in diğer bileşenleri ile tensor işleme uyumu içindir.

In [0]:
pip install mxnet==1.6.0 #Öncelikle MXNet'i indiriyoruz.

In [0]:
from mxnet import np, npx
npx.set_np()

  Bir tensor sayısal değerlere sahip bir dizi(muhtemelen çok boyutlu) temsil eder. Matematikte bir eksenli tensor bir vektöre karşılık gelir. İki eksenli bir tensor ise matrise karşılık gelir. İkiden fazla eksenli diziler matematiksel olarak bir isme sahip değildir. Biz bunlara tensor diyoruz.

  Varsayılan değeri float olarak oluşturmasına rağmen, 0 ile başlayan ilk 12 tam sayıyı içeren bir satır vektörü olan x'i oluşturmak için 'arrange' fonksiyonunu kullanabiliriz. Bir tensordeki değerlerin hepsi tensorün bir elemanı olarak adlandırılır. Örneğin, x tensoründe 12 eleman vardır. Aksi belirtilmediği sürece yeni bir tensor ana hafızada depolanacak ve CPU tabanlı hesaplama için tasarlanacak.

In [0]:
x = np.arange(12)
x

Bir tensorün satır ve sutün sayısını öğrenmek için shape özelliğini kullanabiliriz.

In [0]:
x.shape

  Sadece bir tensorün elemenlarının toplam sayısını bilmek istersek, size özelliğini kullanabiliriz. Burada bir vektörle uğraştığımız için shape fonksiyonunun değeri ile size fonksiyonunun değeri aynı sayıyı döndürür.

In [0]:
x.size

  Bir tensorün eleman sayısını veya değerini değiştirmeden shape'ini değiştirmek için reshape fonksiyonunu kullanabiliriz. Örneğin, (12,) shape sahip x vektörünü, (3,4) shape li bir matrise dönüştürebiliriz. Bu yeni tensör tamamen aynı değerleri içerir. Ancak 3 satır ve 4 sütun olarak düzenlenmiş bir matris olarak görünürler. Yani tensörün shape i değişmesine rağmen içindeki değerler değişmez. Boyutun yeniden şekillendirilerek değiştirilmediğine dikkat edin.

In [0]:
x.reshape(3,4)

  Her boyutu manuel olarak belirterek yeniden şekillendirmeye gerek yoktur. Hedef şeklimiz (yükseklik,genişlik) olan bir matris ise genişliği bildikten sonra yükseklik kapalı bir şekilde verilir. Neden bölmeyi kendimiz yapmak zorundayız? Yukarıdaki örnekte 3 satırlık bir martis almak için hem 3 satır hemde 4 sütunlu olması gerektiğini belirttik. Neyse ki tensörler satır sayısı verildiğinde sütun sayısını,sütun sayısı verildiğinde de satır sayısını hesaplayabilir. Bunu, tensörün otomatik olarak çıkarım yapmasını istediğimiz boyutu -1 ile değiştirerek sağlıyoruz. Yani, x.reshape(3,4) olarak şekillendirmek yerine x.reshape(3,-1) veya x.reshape(-1,4) olarak yeniden şekillendirebiliriz. Hepsinde de sonuç aynıdır.
  empty metodu bir yığın hafızayı tutar ve bize girdilerinin herhangi birinin değerini değiştirmek için uğraşmadan bir matris geri verir.

In [0]:
np.empty((3,4))

  Tipik olarak, biz ya sıfırlar, birler, bazı diğer sabitler ya da belirli bir dağılımdan rasgele örneklenmiş sayılar ile başlatılmış matrisler isteyeceğiz. Tüm elemanları 0 ve (2,3,4) şeklindeki bir tensörü temsil eden bir tensörü aşağıdaki gibi oluşturabiliriz:

In [0]:
np.zeros((2,3,4))

Benzer şekilde, her elemanı 1 olan tensörleri aşağıdaki gibi oluşturabiliriz:

In [0]:
np.ones((2,3,4))

  Çoğunlukla, bazı olasılık dağılımlarından bir tensördeki her elemanın değerini rasgele örneklemek isteriz. Örneğin, bir sinir ağındaki parametreler olarak kullanılacak dizileri oluşturduğumuzda, parametrelerin değerlerini alışıla geldik bir şekilde rasgele oluşturacağız. Aşağıdaki kod parçasında (3,4) şekle sahip bir tensör oluşur. Tensörün her elemanı ortalaması 0 ve standart sapması 1 olan Gaussian(normal) dağılım dan rasgele örneklenmiştir.

In [0]:
np.random.normal(0, 1, size= (3,4))

  Sayısal değerler içeren bir Python listesi veya listeleri oluşturarak istenen tensördeki her eleman için kesin değerleri de belirtebiliriz. Burada en dıştaki liste 0 eksenine, içteki liste ise 1 eksenine karşılık gelir.

In [0]:
np.array([[2, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])

### **İşlemler**