# Makine Öğrenmesi Temelleri

## Makineler Nasıl Öğrenir

- Yapay zeka algoritmaları, büyük miktarda veriye dahaylı olarak desenleri tanımlar, kararlar alır ve sonuçları tahmin ederler.
- İnsanların öğrenme sürecine benzer şekilde, yapay zeka modelleri de hatalarından öğrenir ve deneyimleriyle daha iyi hale gelir. 

## Makinelerde Öğrenme Kavramı Nedir?

- Makine öğrenmesi,
  * bilgisayar sistemlerinin verilerden öğrenerek,
  * deneyimlerden yararlanarak
  * algoritmaları kullanarak
- belirli görevleri gerçekleştirmesini sağlayan yapay zeka alanının bir alt dalıdır.


## Makine Öğrenmesi ve Geleneksel Programlama 

- Programlama yaklaşımı 
- Kural tabanlı bilgi
- Esneklik ve Genelleme
- Değişkenlik ve adaptasyon

# Makine Öğrenmesi Yöntemleri

- **Veri kümesi (dataset)**
- **öznitelik (features) :** veri noktalarını tanımlayan özniteliklerdir. Öznitelikler makine öğrenmesi algoritmalarının modellenmesi ve tahmin yapması için kullanılan değişkenlerdir.
- **Etiketler (labels)** : gözetimli öğrenme problemlerinde hedef değişkenler olarak adlandırılır. Bir veri örneğinin etiketi özelliklere karşılık gelen gerçek çıktı veya sınıfı temsil etmektedir.
- **Model** : girdi verilerini alıp belirli bir çıktıyı verir.
- **Eğitim(Training)** : Bir makine öğrenimi modelinin veri kümesi üzerindeki örneklerle eğitilmesi sürecidir. Eğitim süreci, makine öğrenmesi modeli içerisindeki parametre ayarlarının optimize edilmesidir.
- **Doğrulama(validation)** : Eğitim sürecinde modelin performansını değerlendirir ve hiper parametrelerin ayarlanmasına yardımcı olmak için ayrılan bir veri kümesidir.
- **Test(test)** :  Modelin gerçek veri kümeleri ile test edilmesi için ayrılan veri kümesidir.


![Resim Açıklaması](images/ML_algoritma.png)

- **Sınıflandırma (Classification)** : Bir veri noktasını bir veya daha fazla sınıfa atayan bir tahmin problemidir.
- **Regresyon (Regression)** : Bir çıktı değişkeninin sürekli bir değeri tahmin etmeye çalışan bir tahmin problemidir. Regresyon problemlerinde çıktılar sayısal değerlerdir. Örn, bir evin fiyatını tahmin etmek yada borsanın fiyat tahmini
- **Öğrenme Algoritmaları (Learning Algorithms)** : Veri üzerinden örüntüleri keşfetmek ve modellemek için kullanılan matematiksel ve istatistiksel tekniklerdir.
- **Öznitelik Mühendisliği(Feature Engineering)** :
- **Hiper parametreler (Hyperparameters)** : Modelin yapılandırılması ve eğitilmesi sürecini kontrol eden parametrelerdir. Örneğin, bir sinir ağı modelindeki katman sayısı veya öğrenme hızı gibi parametreler hiper parametrelerdir.
- **Overfitting ve Underfitting** : Modelin eğitim verilerine aşırı uyum sağlaması durumuna overfitting (ezberleme) diyoruz. Test veri seti ile test ettiğimizde undefitting olma  durumu (öğrenememe).
- **Cross-Validation (Çapraz Doğrulama)** : Modelin performansını değerlendirmek için kullanılan bir tekniktir. Veri kümesi birden fazla alt kümeye bölünür ve her bir alt küme sırasıyla eğitim ve doğrulama için kullanılır. Bu sayede modelin genelleme yeteneği daha güvenilir bir şekilde değerlendirilir.
- **Derin Öğrenme (Deep Learning)** : 

Örn, birtane kanser hücresi ile ilgili bir **label** yazmak isteyelim.  Kanser hücreli yada kanser hücresiz olarak bunlara **pozitif** ve **negatif** label'lar yazmak istersek, 

**label**  <br>
- **p** : kanserli hücre <br>
- **n** : kansersiz hücre <br>

**features** <br>
- **hucreY** : hücre yarıçapı <br>
- **hucreA** : hücre alanı <br>
- **boyut**  : hücre boyutu <br>




![Resim Açıklaması](images/ML_yontemler.png)

![Resim Açıklaması](images/ML_sureci.png)

**Makine öğrenmesi uygulamaları;**
- Tıp ve Sağlık
- Finans
- Perakende ve Pazarlama
- Ulaşım ve lojistik
- Güvenlik ve Siber Güvenlik
- Robotik
- Enerji Planlaması ve Verimlilik

**Makine öğrenmesi araçları:**
- Tensorflow
- PyTorch
- Keras
- NumPy
- Scikit-learn
- Pandas
- Matplotlib
- Theano

# Veri Ön İşleme

**Veri Nedir?**

Veri, bilgi taşıyan ve anlam ifade eden öğelerin toplamıdır. 
Genellikle sayılar, metin, görseller veya diğer formatlardaki bilgileri içerir. <br> 

- **Veri Tipleri**
    - **Kategorik Veriler**
      - Nominal
      - Ordinal
    - **Sayısal Veriler**
      - Interval
      - Ratio   

**Veri Ön İşleme**

Veri setini hazırlama sürecidir. Veri ön işleme aşamaları genellikle şunları içerir.  

    - Veri temizleme
    - Veri standardizasyonu 
    - Öznitelik seçimi
    - Veri dönüşümü
    - Aykırı değerlerin işlenmesi

- **Veri Temizleme**

Veri temizleme, veri setindeki hatalı, eksik veya tutarsız verileri tanımlama, düzeltme veya çıkarma işlemidir. Bu işlem, verinin doğruluğunu artırarak analiz veya modelleme süreçlerinin güvenilirliğini sağlar. Veri temizleme, 
* Doğruluk
* Tutarlılık
* Eksik veri problemi
* Aykırı değerler
* Standartlaştırma

Veri temizleme yöntemleri: <br>
    - **Kayıp Veri Problemi** : Bir veri setindeki eksik veya bozuk verilerin bulunması durumudur. <br> 
    - **Tutarsız veri düzeltme**  veri setindeki tutarsızlıkları tespit etme ve düzeltme işlemidir.  <br> 
    - **Yinelenen Verilerin Silinmesi**   <br>
    - **Gereksiz sütunların silinmesi**    <br>

- **Veri Kodlaması**
  Veri kodlaması, kategorik (nominal veya ordinal) verileri sayısal değerlere dönüştürme işlemidir. Bu dönüşüm, makine öğrenimi algoritmaları gibi birçok analiz yöntemi için gereklidir, çünkü bu algoritmalar genellikle sayısal verilerle çalışır. Veri kodlamasının iki ana türü vardır.
  - Nominal kodlama
  - Ordinal kodlama

## Öznitelik Mühendisliği

**Öznitelik Nedir?** :
- Öznitelik (feature), bir veri örneğini tanımlayan veya açıklayan herhangi bir özelliktir.
- Öznitelikler, veri setindeki her bir gözlemin bir parçasını oluşturan ölçülebilir veya gözlemlenebilir özelliklerdir.
- Öznitelikler, veri setinin her bir **sütununu** temsil eder.
- Öznitelik mühendisliği (feature engineering), veri bilimi ve makine öğrenmi alanında kullanılan bir tekniktir ve veri setindeki öznitelikleri (features) optimize etmek veya yeni öznitelikler oluşturmak için yapılan işlemleri ifade eder.  

**Öznitelik mühendisliğinin önemi**

- Model performansını artırma
- Boyut azaltma
- Hesaplama maliyetini azaltma


**Öznitelik Seçimi**

- Öznitelik seçimi (feature selection), veri setinde bulunan öznitelikler arasından en önemli veya en bilgilendirici olanları seçme veya belirleme sürecidir.
- Bu süreçte, veri setinteki gereksiz, tekrarlayan veya düşük etkili özniteliklerin tanımlanması ve çıkarılması hedefleniyor.
- Informasyon tabanlı yöntemler
- Wrapper yöntemler
- Gömülü yöntemler
- Filter yöntemler

**Öznitelik Çıkarma**

- Öznitelik çıkarma (Feature extraction), veri setindeki özniteliklerin temsilini değiştirme veya dönüştürme sürecidir.
- Bu süreçte, var olan özniteliklerin birleştirilmesi, dönüştürülmesi veya yeni özniteliklerin oluşturulması yoluyla verinin tamsilinin iyileştirilmesi amaçlanır.
- Öznitelik çıkarma, veri boyutunu azaltarak gereksiz bilgiyi çıkararak ve verinin daha anlamlı bir şekilde temsil edilmesini sağlayarak model performansını arttırabilir.

**Öznitelik Çıkarmanın Önemi**

- Model performansını artırma
- Boyut azaltma
- Gereksiz bilgiyi çıkarılması
- Anlamlı temsilinin sağlanması


**Öznitelik Çıkarma Yöntemleri**

- Principle Compenent Analysis (PCA) : Veri setindeki öznitelikler arasındaki korelasyonu azaltmak ve veri boyutunu azaltmak için kullanılan bir yöntemdir. 
- Linear Discriminant Analysis (LDA) : Sınıflar arasındaki farklılıkları en üst düzeye çıkarmaya kullanılan bir yöntemdir.
- Autoencoders : Giriş verisine benzeyen ancak daha düşük boyutlu bir temsillemeye dönüştüren sinir ağı tabanlı bir modellerdir. Bu yöntem veri setindeki gizli yapıyı öğrenir ve daha az boyutlu bir temsile oluşturmuş olur.

**Veri Normalizasyonu ve Standardizasyonu**

- 

In [2]:
![Resim Açıklaması](images/oznitelik_yontemleri.png)

'[Resim' is not recognized as an internal or external command,
operable program or batch file.


## Gözetimli Öğrenme

## Gözetimsiz Öğrenme

## Pekiştirmeli Öğrenme