# Makine Öğrenimi

## 1. Temel Kavramlar ve Tanımlar

Makine öğrenimi (Machine Learning - ML), yapay zekanın (Articial Intelligence - AI) bir alt dalıdır.

![ML - AI](ai_ml.png)

<br>Bilgisayar sistemlerinin, açıkça programlanmadan, <b><span style='color:red'> verilerden öğrenmesini sağlayan bir yaklaşımdır.</span></b> Temel amacı, verilerden otomatik olarak öğrenerek performansların iyileştirmesidir. </br>

**Ana Fikir:** Makine öğrenimi, bilgisayarların belirli bir görevi yerine getirmek için verilerdeki kalıpları ve ilişkileri keşfetmesini sağlar. Bu kalıplar sayesinde, yeni ve daha önce hiç görmediği veriler hakkında tahminler yapabilir veya kararlar alabilir.


**Neden Önemli?** Geleneksel progralamada, bir görevi yapabilmek için her bir adım için ayrı ayrı talimatlar veririz. Ancak bazı görevler vardır ki manuel olarak yazmak aşırı zordur. Makine öğrenimi, bu tür zor görevler için bilgisayarların kendi başlarına öğrenmelerini olanak tanır.

**Temel Bileşenler:**
* <b><span style="color:red"> Veri (Data): </span></b> Makine öğrenimi modellerinin eğitildiği ham bilgidir. Veri ne kadar kaliteli ve çeşitli olursa, modelin öğrenme yeteneği o kadar iyi olur. Veriler genellikle etiketli (çıktı biliniyor) veya etiketsiz (çıktı bilinmiyor) olabilir.
* <b><span style="color:red"> Model (Model): </span></b> Verilerden öğrenen ve belirli bir görevi yerine getirmek için kullanılan matematiksel veya algoritmik yapıdır. Model, verilerdeki kalıpları temsil eder. 
* <b><span style="color:red"> Algoritma (Algorithm): </span></b> Modelin verilerden öğrenme sürecini yöneten bir dizi kurallardır. Algoritma, modelin nasıl eğitileceğini ve nasıl tahminler yapacağını belirler. 
* <b><span style="color:red"> Özellik (Feature): </span></b> Veri kümesindeki ger bir gözlem tanımlayan bireysel, ölçülebilir özelliklerdir. Örneğin, bir eve fiyatı tahmin modelinde evin büyüklüğü, oda sayısı, konumu gibi özellikler bulunabilir. 
* <b><span style="color:red"> Eğitim (Training): </span></b> Modelin, verilen veri kümesini kullanarak kalıpları öğrenme sürecidir. Bu süreçte modelin parametrelerini aayarlanır.
* <b><span style="color:red"> Tahmin/Çıkarım (Prediction/Inference): </span></b> Eğitilmiş bir modelin, yeni ve daha önce görmediği verilere dayanarak bir çıktı üretme sürecidir.
* <b><span style="color:red"> Doğruluk (Accuracy) / Performans Metrikleri: </span></b> Modelin ne kadar iyi performans gösterdiğini ölçmek için kullanılan kriterlerdir. Örneğin, sınıflandırma görevlerinde doğruluk oranı, regresyon görevlerinde hata oranı gibi metrikler kullanılır.

# 2.  Makine Öğrenimi Türleri ve Algoritmaları

## 2.1 Denetimli Öğrenme (Supervised Learning)

Denetimli öğrenme (Supervised Learning), modelin etiketli veri kümeleri üzerinde eğitildiği bir yöntemdir. Yani, hem girdi verileri hem de bu verilere karşılık gelen doğru çıktılar (etiketler) modele sunulur. Model, girdi ile çıktı arasındaki ilişkiyi öğrenir ve bu ilişkiyi kullanarak yeni, etiketlenmemiş veriler için tahminler yapar.

**Temel Özellikler**:
* Etiketli veri gerektirir.
* Girdi ve çıktı arasındaki eşleşmeyi öğrenir.
* **Tahmin** veya **Sınıflandırma (Classification)** görevleri için kullanılır

**Yaygın Algoritmalar:**

* **Regresyon (Regression):** Sürekli bir çıktı değeri tahmin etmek için kullanılır. Örneğin, ev tahmini, hisse senedi fiyatı tahmini.
  * **Doğrusal Regresyon (Linear Regression):** Girdi özellikleri ile çıktı arasında doğrusal bir ilişki olduğunu varsayar.
  * **Polinom Regresyon (Polynomial Regression):** Doğrusal olmayan ilişkileri modellemek için kullanılır.
* **Sınıflandırma (Classification):** Verileri berlili kategorilere veya sınıflara ayırmak için kullanılır. Örneğin, e-postanın spam olup olmadığını belirleme, bir resimdeki nesneyi tanımı.
  * **Lojistik Regresyon (logistic Regression):** İkili sınıflandırma problemleri için kullanılır. Örneğin, Evet/Hayır, Doğru/Yanlış.
  * **Karar Ağaçları (Decision Trees):** Verileri bir dizi kurala göre bölerek sınıflandırma veya regresyon yapar.
  * **Rastgele Ormanlar (Random Forests):** Birden çok karar ağacının bir araya gelmesiyle oluşan topluluk öğrenme yöntemidir.
  * **Destek Vektör Makineleri (Support Vector Machines - SVM):** Verileri en iyi şekilde ayıran bir hiper düzlem bulmaya çalışır.
  * **K-En Yakın Komşular (K-Nearest Neighbors - KNN):** Yeni bir veri noktasını, en yakın komşususunun sınıfına göre sınıflandırır.
  * **Yapay Sinir Ağaçları (Artificial Neural Networks - ANN):** İnsan beyninin yapısından esinlenerek oluşturulmuş, karmaşık kalıpları öğrenme yeteneğine sahip modellerdir. Derin Öğrenme'nin temelini oluşturur.

## 2.2 Denetimsiz Öğrenme (Unsupervised Learning)

Denetimsiz Öğrenme, modelin etiketsiz veri kümeleri üzerinde eğitildiği bir yöntemdir. Model, verilerdeki gizli yapıları, kalıpları veya ilişkileri kendi başına keşfetmetye çalışır. Çıktı değişkeni veya hedef etiket bulunmaz.

**Temel Özellikler:**
* Etiketsiz veri kullanılır.
* Verilerdeki gizli yapıları ve kalıpları keşfeder.
* **Kümeleme (Clustering), boyut indirgeme ve ilişkilendirme** gibi görevleri için kullanılır.

**Yaygın Algoritmalar:**

* **Kümeleme (Clustering):** Benzer veri noktalarını gruplara ayırmak için kullanılır. Örneğin, müşteri segmentasyonu, belge sınıflandırması.
  * **K-Means Kümeleme (K-Means Clustering):** Veri noktaları K sayıda kümeye ayırır.
  * **Hiyerarşik Kümeleme (Hierarchical Clustering):** Veri noktaları arasında hiyerarşik bir küme yapısı oluşturur.
  * **DBSCAN (Density-Based Spatial Clustering Of Applications with Noise):** Yoğunluğa dayalı bir kümeleme algoritmasıdır.
* **Boyut İndirgeme (Dimensionality Reduction):** Veri kümesindeki özellik sayısını azaltarak daha az önemli bilgileri ortadan kaldırır ve veri görselleştirmeyi veya model eğitimini kolaylaştırır. Yani, yüksek boyutlu verileri daha düşük boyutlu bir alana dönüştürme.
  * **Temel Bileşen Analizi (Principal Component Analysis - PCA):** Veri setindeki varyansı en iyi açıklayan yeni, ilişkisiz özellikler (temel bileşenler) oluşturur.
  * **t-SNE (t-Distributed Stochastic Neighbor Embedding):** Yüksek boyutlu verileri görselleştirmek için kullanılan doğrusal olmayan bir boyut indirgeme tekniğidir. Yani, yüksek boyutlu verileri düşük boyutlu (2D veya 3D) uzaylara indirgerken benzer verileri birbirine yakın konumlandırmaya çalışır.
* **Birliktelik Kuralı Madenciliği (Association Rule Mining):** Büyük veri kümelerindeki öğeler arasındaki ilişkileri veya bağımlılıkları bulmak için kullanılır. Örneğin, market sepeti analizi (birlikte satın alınan ürünler).
  * **Apriori Algoritması (Apriori Algorithm):** Sık geçen öğe kümelerini ve birliktelik kurallarını bulmak için kullanılır.


## 2.3 Pekiştirmeli Öğrenme (Reinforcement Learning)

Pekiştirmeli Öğrenme, bir ajanın (agent) belirli bir ortamda (environment) etkileşim kurarak ve deneme-yanılma yoluyla öğrenmesii sağlayan bir yaklaşımdır. Ajan, yaptığı eylemlerin sonucunda ödüller (rewards) veya cezalar (penalties) alır ve bu geri bildirimlere dayanarak en iyi stratejiyi (policy) öğrenir.

**Temel Özellikler:**
* Ajan, ortam ve ödül sistemi içerir.
* Deneme-yanılma yoluyla öğrenir.
* Oyun oynama, robotik ve otonom sistemler gibi dinamik ortamlar için idealdir.

**Yaygın Algoritmalar:**

* **Q-Learning:** Ajanın her bir durum-eylem çifti için bir Q-değeri öğrenmesini sağlayan model tabanlı olmayan bir pekiştirmeli öğrenme algoritmasıdır.
* **SARSA (State-Aciton-Reward-State-Action):** Q-Learning'e benzer ancak bir sonraki eylemi seçerken mevcut politikayı dikkate alır.
* **Derin Pekiştirmeli Öğrenme (Deep Reinforcement Learning - DRL):** Pekiştirmeli öğrenmeyi derin öğrenme ile birleştirerek karmaşık ortamlarda daha iyi performans gösterir. Otonom sürüş gibi.

# 3. Uygulama Alanları ve Örnekler

Makine öğreniminin uygulama alanları ve örnekleri:

## 3.1 Sağlık Sektörü

* **Hastalık Teşhisi:** Görüntü işleme teknikleri (derin öğrenme ile) kullanılarak röntgen, MR ve CT taramalarından kanser, tümör gibi hastalıkların erken teşhisi.
* **İlaç Keşfi:** Yeni ilaç moleküllerinin keşfi ve geliştirilmesi süreçlerinin hızlandırılması.
* **Kişiselleştirilmiş Tıp:** Hastanın genetik yapısı, yaşam tarzı ve tıbbi geçmişine göre en uygun tedavi yöntemlerinin belirlenmesi.
* **Epidemi Tahmini:** Salgın hastalıkların yayılma eğilimlerinin ve risk bölgelerinin tahmin edilmesi.

## 3.2 Finans Sektörü

* **Dolandırıcılık Tespiti:** Kredi kartı dolandırıcılığı, kara para aklama 
* **Kredi Riski Değerlendirmesi:** Bireylerin veya şirketlerin kredi geri ödeme yeteneklerinin değerlendirilmesi.
* **Algoritmik Ticaret:** Hisse senedi piyasalarında otomaik alım-satım kararları alınması.
* **Piyasa Tahmini:** Hisse senedi fiyatları, döviz kurları gibi finansal piyasa hareketlerinin tahmin edilmesi.

## 3.3 E-ticaret ve Pazarlama

* **öneri Sistemleri:** Kullanıcıların geçmiş davranışlarına ve tercihlerine göre ürün veya içerik önerileri sunulması (Amazon, Netflix).
* **Müşteri Segmentasyonu:** Müşterilerin demografik özelliklerine, satın alma alışkanlıklarına ve dayanışlarına göre gruplara ayrılması.
* **Fiyatlandırma Optimizasyonu:** Dinamik fiyatlandırma stratejileri ile ürünlerin en uygun fiyata satılması.
* **Hedefli Reklamcılık:** Belirli müşteri gruplarına yönelik kişiselleştirilmiş reklam kampanyaları oluşturulması.

## 3.4 Otomativ Sektörü

* **Otonom Sürüş:** Araçların çevreyi algılaması, yol planlaması yapması ve güvenli bir şekilde kendine sürüş yapması.
* **Tahmine Dayalı Bakım:** Araç parçalarının arızalanma olasılığının tahmin edilmesi ve bakimin önceden planlanması.
* **Sürücü Destek Sistemleri:** Şerit takip, çarpışma önleme gibi güvenlik sistemleri.

## 3.5 Doğal Dil İşleme (NLP)

* **Metin Çevirisi:** Bir dilden başka bir dile otomatik çeviri (Google Translate).
* **Duygu Analizi:** Metinlerdeki duygu tonunun (pozitif, negatif, nötr) belirlenmesi.
* **Konuşma Tanıma:** Sesli komutların metne dönüştürülmesi (Siri, Google Asistant).
* **Sohbet Robotları (Chatbots):** Müşteri hizmetleri, bilgi sağlama gibi görevler için insanlarla doğal dilde etkileşim kuran sistemler.

## 3.6 Görüntü İşleme ve Bilgisayar Görüsü

* **Yüz Tanıma:** Güvenlik sistemleri, kimlik doğrulama gibi alanlarda yüzlerin tanınması.
* **Nesne Algılama:** Görüntülerdeki veya videolardaki belirli nesnelerin tespiti ve konumlandırılması.
* **Görüntü Sınıflandırma:** Görüntülerin içeriğine göre kategorilere ayrılması.
* **Artırılmış Gerçeklik (Augmented Reality - AR):** Gerçek dünya görüntülerine sanal nesnelerin eklenmesi.

## 3.7 Siber Güvenlik

* **Anomali Tespiti:** Ağ trafiğindeki veya sistem davranışlarındaki anormal durumların tespiti.
* **Kötü Amaçlı Yazılım Tespiti:** Virüs, trojan gibi kötü amaçlı yazılımların belirlenmesi.
* **Saldırı Tespiti:** Siber saldırıların erken aşamada tespit edilmesi.