# Practice Lab: Decision Trees

Bu alıştırmada, sıfırdan bir karar ağacı (decision tree) uygulayacak ve bunu bir mantarın yenilebilir mi yoksa zehirli mi olduğunu sınıflandırma görevinde kullanacaksınız.

# Outline
- [ 1 - Packages ](#1)
- [ 2 -  Problem Statement](#2)
- [ 3 - Dataset](#3)
  - [ 3.1 One hot encoded dataset](#3.1)
- [ 4 - Decision Tree Refresher](#4)
  - [ 4.1  Calculate entropy](#4.1)
    - [ Exercise 1](#ex01)
  - [ 4.2  Split dataset](#4.2)
    - [ Exercise 2](#ex02)
  - [ 4.3  Calculate information gain](#4.3)
    - [ Exercise 3](#ex03)
  - [ 4.4  Get best split](#4.4)
    - [ Exercise 4](#ex04)
- [ 5 - Building the tree](#5)


<a name="1"></a>

## 1 - Paketler

Öncelikle, bu ödev sırasında ihtiyacınız olacak tüm paketleri içe aktarmak için aşağıdaki hücreyi çalıştıralım.

* [numpy](https://www.numpy.org): Python’da matrislerle çalışmak için temel paket.
* [matplotlib](https://matplotlib.org): Python’da grafik çizmek için yaygın bir kütüphane.
* `utils.py`: Bu ödev için yardımcı fonksiyonları içerir. Bu dosyadaki kodu değiştirmeniz gerekmez.


In [6]:
import numpy as np
import matplotlib.pyplot as plt
from public_tests import *

%matplotlib inline

<a name="2"></a>

## 2 - Problem Tanımı

Varsayalım ki, **yabani mantar yetiştirip satan bir şirket kuruyorsunuz**.

* Tüm mantarlar yenilebilir olmadığından, verilen bir mantarın fiziksel özelliklerine bakarak **yenilebilir mi yoksa zehirli mi olduğunu** söyleyebilmek istiyorsunuz.
* Bu görev için kullanabileceğiniz mevcut bazı verileriniz var.

Bu verileri kullanarak hangi mantarların güvenle satılabileceğini belirleyebilir misiniz?

**Not:** Kullanılan veri seti sadece örnekleme amaçlıdır. Yenilebilir mantarları tanımlamak için bir kılavuz değildir.

---

<a name="3"></a>

## 3 - Veri Seti

Bu görev için veri setini yükleyerek başlayacaksınız. Topladığınız veri seti aşağıdaki gibidir:

| Cap Color | Stalk Shape | Solitary | Edible |
| :-------: | :---------: | :------: | :----: |
|   Brown   |   Tapering  |    Yes   |    1   |
|   Brown   |  Enlarging  |    Yes   |    1   |
|   Brown   |  Enlarging  |    No    |    0   |
|   Brown   |  Enlarging  |    No    |    0   |
|   Brown   |   Tapering  |    Yes   |    1   |
|    Red    |   Tapering  |    Yes   |    0   |
|    Red    |  Enlarging  |    No    |    0   |
|   Brown   |  Enlarging  |    Yes   |    1   |
|    Red    |   Tapering  |    No    |    1   |
|   Brown   |  Enlarging  |    No    |    0   |

* 10 mantar örneğiniz var. Her bir örnek için:

  * Üç özellik:

    * Cap Color (`Brown` veya `Red`)
    * Stalk Shape (`Tapering` veya `Enlarging`)
    * Solitary (`Yes` veya `No`)
  * Etiket:

    * Edible (`1` = yenilebilir, `0` = zehirli)

---

<a name="3.1"></a>

### 3.1 One-hot encoded veri seti

Kolaylık olması için, özellikleri **one-hot encoding** ile dönüştürdük (0 veya 1 değerli özellikler):

| Brown Cap | Tapering Stalk Shape | Solitary | Edible |
| :-------: | :------------------: | :------: | :----: |
|     1     |           1          |     1    |    1   |
|     1     |           0          |     1    |    1   |
|     1     |           0          |     0    |    0   |
|     1     |           0          |     0    |    0   |
|     1     |           1          |     1    |    1   |
|     0     |           1          |     1    |    0   |
|     0     |           0          |     0    |    0   |
|     1     |           0          |     1    |    1   |
|     0     |           1          |     0    |    1   |
|     1     |           0          |     0    |    0   |

Buna göre:

* `X_train` her örnek için üç özelliği içerir:

  * **Brown Cap** (`1` = Brown, `0` = Red)
  * **Tapering Stalk Shape** (`1` = Tapering, `0` = Enlarging)
  * **Solitary** (`1` = Yes, `0` = No)

* `y_train` mantarın yenilebilirliğini gösterir:

  * `1` = yenilebilir
  * `0` = zehirli


In [7]:
X_train = np.array([[1,1,1],[1,0,1],[1,0,0],[1,0,0],[1,1,1],[0,1,1],[0,0,0],[1,0,1],[0,1,0],[1,0,0]])
y_train = np.array([1,1,0,0,1,0,0,1,1,0])

#### Değişkenleri İnceleyelim

Veri setinize daha yakından bakalım.

* Başlamak için iyi bir yol, her bir değişkeni yazdırmak ve içeriğini gözlemlemektir.

Aşağıdaki kod, `X_train`’in ilk birkaç öğesini ve değişkenin tipini yazdırır.


In [8]:
print("First few elements of X_train:\n", X_train[:5])
print("Type of X_train:",type(X_train))

First few elements of X_train:
 [[1 1 1]
 [1 0 1]
 [1 0 0]
 [1 0 0]
 [1 1 1]]
Type of X_train: <class 'numpy.ndarray'>


Now, let's do the same for `y_train`

In [9]:
print("First few elements of y_train:", y_train[:5])
print("Type of y_train:",type(y_train))

First few elements of y_train: [1 1 0 0 1]
Type of y_train: <class 'numpy.ndarray'>


#### Değişkenlerin Boyutlarını Kontrol Edelim

Veri setinizi daha iyi anlamanın bir diğer yolu da boyutlarını incelemektir.

`X_train` ve `y_train`’in **shape** değerlerini yazdırarak veri setinizde kaç eğitim örneği olduğunu görebilirsiniz.


In [None]:
print('X_train’in boyutu:', X_train.shape)
print('y_train’in boyutu:', y_train.shape)
print('Eğitim örneklerinin sayısı (m):', len(X_train))

The shape of X_train is: (10, 3)
The shape of y_train is:  (10,)
Number of training examples (m): 10


<a name="4"></a>

## 4 - Karar Ağacı (Decision Tree) Yenileme

Bu uygulama laboratuvarında, sağlanan veri setine dayanarak bir **karar ağacı** oluşturacaksınız.

* Karar ağacı oluşturma adımlarını hatırlayalım:

  * Tüm örneklerle **root node**’dan başlayın
  * Tüm olası özellikler için **information gain** hesaplayın ve en yüksek bilgi kazancını veren özelliği seçin
  * Seçilen özelliğe göre veri setini bölün ve ağacın sol ve sağ dallarını oluşturun
  * Durma kriteri karşılanana kadar bölme işlemini tekrarlayın

* Bu laboratuvarda uygulayacağınız fonksiyonlar şunlardır:

  * Bir node’daki **entropy**’yi hesaplamak
  * Belirli bir özelliğe göre node’u **sol ve sağ dallara** bölmek
  * Belirli bir özellik üzerinde bölme yapmanın **information gain** değerini hesaplamak
  * **Information gain’i maksimize eden özelliği seçmek**

* Daha sonra, uyguladığınız yardımcı fonksiyonları kullanarak, durma kriteri karşılanana kadar bölme işlemini tekrarlayarak bir karar ağacı oluşturacağız.

  * Bu lab için seçilen durma kriteri, maksimum derinliğin **2** olarak ayarlanmasıdır.


<a name="4.1"></a>

### 4.1 Entropy Hesaplama

Öncelikle, bir node’daki **entropy**’yi (saflık ölçüsü) hesaplayan bir yardımcı fonksiyon olan `compute_entropy`’yi yazacaksınız.

* Fonksiyon, node’daki örneklerin **yenilebilir (`1`)** mi yoksa **zehirli (`0`)** mı olduğunu belirten bir numpy dizisi (`y`) alır.

Aşağıdaki adımları tamamlayın:

* $p_1$’i hesaplayın: Bu, node’daki yenilebilir örneklerin oranıdır (`y` dizisinde değeri `1` olanlar).
* Entropy formülü:

$$H(p_1) = -p_1 \log_2(p_1) - (1- p_1) \log_2(1- p_1)$$

**Notlar:**

* Logaritma **taban 2** ile hesaplanır
* Hesaplama sırasında, $0\log_2(0) = 0$ olarak alınır. Yani, `p_1 = 0` veya `p_1 = 1` ise entropy `0` olarak ayarlanır
* Node’daki veri boşsa (`len(y) == 0`), entropy `0` olarak döndürülmelidir

---

<a name="ex01"></a>

### Alıştırma 1

Lütfen `compute_entropy()` fonksiyonunu yukarıdaki talimatlara göre tamamlayın.

Takılırsanız, hücre altındaki ipuçlarını kullanabilirsiniz.


In [None]:
# UNQ_C1
# GRADED FUNCTION: compute_entropy

def compute_entropy(y):
    """
    Bir node'daki entropy'yi hesaplar.
    
    Args:
       y (ndarray): Node'daki her örneğin yenilebilir (`1`) veya zehirli (`0`) olduğunu belirten Numpy array
       
    Returns:
        entropy (float): Node'daki entropy
    """
    entropy = 0.
    
    ### KODU BURADAN BAŞLAT ###
    if len(y) != 0:
        p1 = len(y[y == 1]) / len(y)  # Yenilebilir örneklerin oranı
        # p1 = 0 veya 1 ise entropy 0 olacak şekilde ayarlayın
        if p1 != 0 and p1 != 1:
            entropy = -p1 * np.log2(p1) - (1 - p1) * np.log2(1 - p1)
        else:
            entropy = 0
    ### KODU BURADA BİTİR ###
    
    return entropy


<details>
  <summary><font size="3" color="darkgreen"><b>Click for hints</b></font></summary>
    
    
   * To calculate `p1`
       * You can get the subset of examples in `y` that have the value `1` as `y[y == 1]`
       * You can use `len(y)` to get the number of examples in `y`
   * To calculate `entropy`
       * <a href="https://numpy.org/doc/stable/reference/generated/numpy.log2.html">np.log2</a> let's you calculate the logarithm to base 2 for a numpy array
       * If the value of `p1` is 0 or 1, make sure to set the entropy to `0` 
     
    <details>
          <summary><font size="2" color="darkblue"><b> Click for more hints</b></font></summary>
        
    * Here's how you can structure the overall implementation for this function
    ```python 
    def compute_entropy(y):
        
        # You need to return the following variables correctly
        entropy = 0.

        ### START CODE HERE ###
        if len(y) != 0:
            # Your code here to calculate the fraction of edible examples (i.e with value = 1 in y)
            p1 =

            # For p1 = 0 and 1, set the entropy to 0 (to handle 0log0)
            if p1 != 0 and p1 != 1:
                # Your code here to calculate the entropy using the formula provided above
                entropy = 
            else:
                entropy = 0. 
        ### END CODE HERE ###        

        return entropy
    ```
    
    If you're still stuck, you can check the hints presented below to figure out how to calculate `p1` and `entropy`.
    
    <details>
          <summary><font size="2" color="darkblue"><b>Hint to calculate p1</b></font></summary>
           &emsp; &emsp; You can compute p1 as <code>p1 = len(y[y == 1]) / len(y) </code>
    </details>

     <details>
          <summary><font size="2" color="darkblue"><b>Hint to calculate entropy</b></font></summary>
          &emsp; &emsp; You can compute entropy as <code>entropy = -p1 * np.log2(p1) - (1 - p1) * np.log2(1 - p1)</code>
    </details>
        
    </details>

</details>

    


Doğru implementasyonu kontrol etmek için aşağıdaki test kodunu çalıştırabilirsiniz:

In [None]:
# Root node'daki entropy'yi hesaplayalım (tüm örneklerle)
# 5 yenilebilir ve 5 zehirli mantar olduğu için entropy 1 olmalı

print("Root node'daki entropy: ", compute_entropy(y_train)) 

# BİRİM TESTLERİ
compute_entropy_test(compute_entropy)


Entropy at root node:  1.0
[92m All tests passed.


**Expected Output**:
<table>
  <tr>
    <td> <b>Entropy at root node:<b> 1.0 </td> 
  </tr>
</table>

<a name="4.2"></a>

### 4.2 Veri Setini Bölme

Sonraki adımda, `split_dataset` adında bir yardımcı fonksiyon yazacaksınız. Bu fonksiyon, bir node’daki veriyi ve bölünecek özelliği alır ve veriyi **sol ve sağ dallara** böler. Daha sonra bu bölmenin ne kadar iyi olduğunu hesaplayacağız.

* Fonksiyon, node’daki veri noktalarının indeksleri (`node_indices`) ve bölünecek özelliği alır.
* Veriyi böler ve **sol ve sağ dallardaki indeks alt kümelerini** döndürür.
* Örneğin, root node’dan başlıyorsak (`node_indices = [0,1,2,3,4,5,6,7,8,9]`) ve feature `0`’ı seçtiysek (örneklerin kahverengi kapaklı olup olmadığı),

  * Fonksiyonun çıktısı: `left_indices = [0,1,2,3,4,7,9]` ve `right_indices = [5,6,8]` olacaktır.

---

<a name="ex02"></a>

### Alıştırma 2

Aşağıdaki `split_dataset()` fonksiyonunu tamamlayın:

* Her `node_indices` içindeki indeks için:

  * Eğer `X`’te o index ve feature değerinin `1` ise, indeksi `left_indices`’e ekleyin
  * Eğer değer `0` ise, indeksi `right_indices`’e ekleyin

Takılırsanız, hücre altındaki ipuçlarını kullanabilirsiniz.


In [None]:
# UNQ_C2
# GRADED FUNCTION: split_dataset

def split_dataset(X, node_indices, feature):
    """
    Verilen node'daki veriyi sol ve sağ dallara böler.
    
    Args:
        X (ndarray): Veri matrisi (n_samples, n_features)
        node_indices (list): Bu adımda dikkate alınan örneklerin indeksleri
        feature (int): Bölünecek feature'ün indeksi
    
    Returns:
        left_indices (list): Feature değeri 1 olan indeksler
        right_indices (list): Feature değeri 0 olan indeksler
    """
    
    left_indices = []
    right_indices = []
    
    ### KODU BURADAN BAŞLAT ###
    for i in node_indices:   
        if X[i][feature] == 1:
            left_indices.append(i)
        else:
            right_indices.append(i)
    ### KODU BURADA BİTİR ###
        
    return left_indices, right_indices


<details>
  <summary><font size="3" color="darkgreen"><b>İpuçları için tıklayın</b></font></summary>

* İşte bu fonksiyonun genel implementasyonunu nasıl yapılandırabileceğiniz:
  ```python
  def split_dataset(X, node_indices, feature):

  # Döndürmeniz gereken değişkenler

  left_indices = []
  right_indices = []

  ### KODU BURADAN BAŞLAT

  # O node’daki örneklerin indekslerinden geç

  for i in node_indices:
  if # Bu indeksteki X değerinin feature için 1 olup olmadığını kontrol edin
  left_indices.append(i)
  else:
  right_indices.append(i)

  ### KODU BURADA BİTİR

```
return left_indices, right_indices
```

````
```
<details>
      <summary><font size="2" color="darkblue"><b>Daha fazla ipucu için tıklayın</b></font></summary>
    
Şart şu olacak: <code> if X[i][feature] == 1:</code>.
    
</details>
````

</details>


Şimdi implementasyonunuzu kontrol edelim. Aşağıdaki kod blokları ile root node’daki veriyi feature 0 (Brown Cap) kullanarak bölelim:

In [None]:
# Root node indeksi (tüm örnekler)
root_indices = list(range(len(X_train)))

# Feature 0 (Brown Cap) ile bölme
left_indices, right_indices = split_dataset(X_train, root_indices, 0)

print("Left indices (feature 0 = 1):", left_indices)
print("Right indices (feature 0 = 0):", right_indices)


Left indices:  [0, 1, 2, 3, 4, 7, 9]
Right indices:  [5, 6, 8]
[92m All tests passed.


**Expected Output**:
```
Left indices:  [0, 1, 2, 3, 4, 7, 9]
Right indices:  [5, 6, 8]
```

<a name="4.3"></a>

### 4.3 Bilgi Kazancını Hesaplama

Sonraki adımda, `information_gain` adlı bir fonksiyon yazacaksınız. Bu fonksiyon, eğitim verisini, bir node’daki indeksleri ve hangi feature’a göre bölüneceğini alacak ve bölünmeden elde edilen bilgi kazancını döndürecek.

<a name="ex03"></a>

### Alıştırma 3

Aşağıdaki `compute_information_gain()` fonksiyonunu tamamlayarak şu formülü hesaplayın:

$$\text{Information Gain} = H(p_1^\text{node})- (w^{\text{left}}H(p_1^\text{left}) + w^{\text{right}}H(p_1^\text{right}))$$

Burada:

* $H(p_1^\text{node})$ node’daki entropi
* $H(p_1^\text{left})$ ve $H(p_1^\text{right})$ bölünmeden sonra oluşan sol ve sağ dallardaki entropiler
* $w^{\text{left}}$ ve $w^{\text{right}}$ sol ve sağ dalda bulunan örneklerin oranları

Notlar:

* Entropiyi hesaplamak için yukarıda implement ettiğiniz `compute_entropy()` fonksiyonunu kullanabilirsiniz
* Dataseti bölmek için yukarıda yazdığınız `split_dataset()` fonksiyonu starter kodda sağlanmıştır

Takıldığınızda, hücre altında verilen ipuçlarına göz atabilirsiniz.


In [None]:
# UNQ_C3
# GRADED FUNCTION: compute_information_gain

def compute_information_gain(X, y, node_indices, feature):
    
    """
    Belirli bir feature’a göre node’u bölmenin bilgi kazancını hesaplar.
    
    Args:
        X (ndarray):            (n_samples, n_features) boyutunda veri matrisi
        y (array like):         Hedef değişkeni içeren n_samples uzunluğunda liste veya ndarray
        node_indices (ndarray): O anki node’da aktif olan örneklerin indeksleri
   
    Returns:
        cost (float):        Hesaplanan bilgi kazancı
    """    
    # Dataseti böl
    left_indices, right_indices = split_dataset(X, node_indices, feature)
    
    # Kullanışlı değişkenler
    X_node, y_node = X[node_indices], y[node_indices]
    X_left, y_left = X[left_indices], y[left_indices]
    X_right, y_right = X[right_indices], y[right_indices]
    
    # Hesaplanacak değişken
    information_gain = 0
    
    ### START CODE HERE ###
    node_entropy = compute_entropy(y_node)
    left_entropy = compute_entropy(y_left)
    right_entropy = compute_entropy(y_right)
    
    # Ağırlıklar
    w_left = len(X_left) / len(X_node)
    w_right = len(X_right) / len(X_node)
    
    # Ağırlıklı entropi
    weighted_entropy = w_left * left_entropy + w_right * right_entropy
    
    # Bilgi kazancı
    information_gain = node_entropy - weighted_entropy
    
    ### END CODE HERE ###  
    
    return information_gain


<details>
  <summary><font size="3" color="darkgreen"><b>Click for hints</b></font></summary>
    
    
   * Here's how you can structure the overall implementation for this function
    ```python 
    def compute_information_gain(X, y, node_indices, feature):
        # Split dataset
        left_indices, right_indices = split_dataset(X, node_indices, feature)

        # Some useful variables
        X_node, y_node = X[node_indices], y[node_indices]
        X_left, y_left = X[left_indices], y[left_indices]
        X_right, y_right = X[right_indices], y[right_indices]

        # You need to return the following variables correctly
        information_gain = 0

        ### START CODE HERE ###
        # Your code here to compute the entropy at the node using compute_entropy()
        node_entropy = 
        # Your code here to compute the entropy at the left branch
        left_entropy = 
        # Your code here to compute the entropy at the right branch
        right_entropy = 

        # Your code here to compute the proportion of examples at the left branch
        w_left = 
        
        # Your code here to compute the proportion of examples at the right branch
        w_right = 

        # Your code here to compute weighted entropy from the split using 
        # w_left, w_right, left_entropy and right_entropy
        weighted_entropy = 

        # Your code here to compute the information gain as the entropy at the node
        # minus the weighted entropy
        information_gain = 
        ### END CODE HERE ###  

        return information_gain
    ```
    If you're still stuck, check out the hints below.
    
    <details>
          <summary><font size="2" color="darkblue"><b> Hint to calculate the entropies</b></font></summary>
        
    <code>node_entropy = compute_entropy(y_node)</code><br>
    <code>left_entropy = compute_entropy(y_left)</code><br>
    <code>right_entropy = compute_entropy(y_right)</code>
        
    </details>
    
    <details>
          <summary><font size="2" color="darkblue"><b>Hint to calculate w_left and w_right</b></font></summary>
           <code>w_left = len(X_left) / len(X_node)</code><br>
           <code>w_right = len(X_right) / len(X_node)</code>
    </details>
    
    <details>
          <summary><font size="2" color="darkblue"><b>Hint to calculate weighted_entropy</b></font></summary>
           <code>weighted_entropy = w_left * left_entropy + w_right * right_entropy</code>
    </details>
    
    <details>
          <summary><font size="2" color="darkblue"><b>Hint to calculate information_gain</b></font></summary>
           <code> information_gain = node_entropy - weighted_entropy</code>
    </details>


</details>


Artık uygulamanızı aşağıdaki hücre ile test edebilir ve her bir feature’a göre bölmenin bilgi kazancını hesaplayabilirsiniz.


In [None]:



info_gain0 = compute_information_gain(X_train, y_train, root_indices, feature=0)
print("Kök düğümün kahverengi şapka özelliğine göre bölünmesinden elde edilen Bilgi Kazancı: ", info_gain0)
    
info_gain1 = compute_information_gain(X_train, y_train, root_indices, feature=1)
print("Kök düğümün konik sap şekli özelliğine göre bölünmesinden elde edilen Bilgi Kazancı: ", info_gain1)

info_gain2 = compute_information_gain(X_train, y_train, root_indices, feature=2)
print("Kök düğümün tek başına özelliğine göre bölünmesinden elde edilen Bilgi Kazancı: ", info_gain2)

# BİRİM TESTLERİ
compute_information_gain_test(compute_information_gain)



Information Gain from splitting the root on brown cap:  0.034851554559677034
Information Gain from splitting the root on tapering stalk shape:  0.12451124978365313
Information Gain from splitting the root on solitary:  0.2780719051126377
[92m All tests passed.


**Expected Output**:
```
Information Gain from splitting the root on brown cap:  0.034851554559677034
Information Gain from splitting the root on tapering stalk shape:  0.12451124978365313
Information Gain from splitting the root on solitary:  0.2780719051126377
```

Splitting on "Solitary" (feature = 2) at the root node gives the maximum information gain. Therefore, it's the best feature to split on at the root node.

<a name="4.4"></a>

### 4.4  En iyi bölünmeyi bul

Şimdi, her özellik için bilgi kazancını hesaplayarak en iyi bölünmeyi sağlayan özelliği döndüren bir fonksiyon yazalım.

<a name="ex04"></a>

### Alıştırma 4

Aşağıdaki `get_best_split()` fonksiyonunu tamamlayın.

* Fonksiyon, eğitim verilerini ve o düğümdeki veri noktalarının indekslerini alır
* Fonksiyonun çıktısı, maksimum bilgi kazancını sağlayan özelliktir

  * Her özellik için bilgi kazancını hesaplamak için `compute_information_gain()` fonksiyonunu kullanabilirsiniz.
  * Takılırsanız, aşağıdaki ipuçlarına göz atabilirsiniz.


In [None]:
# UNQ_C4
# DEĞERLENDİRİLEN FONKSİYON: get_best_split

def get_best_split(X, y, node_indices):   
    """
    Düğüm verilerini bölmek için optimal özellik ve eşik değerini döndürür
    
    Argümanlar:
        X (ndarray):            Şekli (n_samples, n_features) olan veri matrisi
        y (array like):         Hedef değişkeni içeren n_samples uzunluğunda liste veya ndarray
        node_indices (ndarray): Aktif indeksleri içeren liste. Yani, bu adımda değerlendirilen örnekler.

    Döndürür:
        best_feature (int):     Bölme için en iyi özelliğin indeksi
    """    
    
    # Bazı faydalı değişkenler
    num_features = X.shape[1]
    
    # Aşağıdaki değişkenleri doğru şekilde döndürmeniz gerekiyor
    best_feature = -1
    
    ### KODU BURADAN BAŞLAT ###
    max_info_gain=0
    for feature in range(num_features):
        info_gain = compute_information_gain(X, y, node_indices, feature)
        if info_gain > max_info_gain:
            max_info_gain = info_gain
            best_feature = feature
                
        
    ### KODU BURADA BİTİR ##    
       
    return best_feature


<details>
  <summary><font size="3" color="darkgreen"><b>Click for hints</b></font></summary>
    
    
   * Here's how you can structure the overall implementation for this function
    
    ```python 
    def get_best_split(X, y, node_indices):   

        # Some useful variables
        num_features = X.shape[1]

        # You need to return the following variables correctly
        best_feature = -1

        ### START CODE HERE ###
        max_info_gain = 0

        # Iterate through all features
        for feature in range(num_features): 
            
            # Your code here to compute the information gain from splitting on this feature
            info_gain = 
            
            # If the information gain is larger than the max seen so far
            if info_gain > max_info_gain:  
                # Your code here to set the max_info_gain and best_feature
                max_info_gain = 
                best_feature = 
        ### END CODE HERE ##    
   
    return best_feature
    ```
    If you're still stuck, check out the hints below.
    
    <details>
          <summary><font size="2" color="darkblue"><b> Hint to calculate info_gain</b></font></summary>
        
    <code>info_gain = compute_information_gain(X, y, node_indices, feature)</code>
    </details>
    
    <details>
          <summary><font size="2" color="darkblue"><b>Hint to update the max_info_gain and best_feature</b></font></summary>
           <code>max_info_gain = info_gain</code><br>
           <code>best_feature = feature</code>
    </details>
</details>


Now, let's check the implementation of your function using the cell below.

In [37]:
best_feature = get_best_split(X_train, y_train, root_indices)
print("Best feature to split on: %d" % best_feature)

# UNIT TESTS
get_best_split_test(get_best_split)

Best feature to split on: 2
[92m All tests passed.


Yukarıda gördüğümüz gibi, fonksiyon kök düğümde bölme için en iyi özellik olarak özellik 2’yi (“Solitary”) döndürüyor.


<a name="5"></a>

## 5 - Ağacı Oluşturma

Bu bölümde, yukarıda uyguladığınız fonksiyonları kullanarak bir karar ağacı oluşturacağız. Bunu, durma kriterine ulaşana kadar (maksimum derinlik 2) her seferinde bölmek için en iyi özelliği seçerek yapacağız.

Bu bölüm için herhangi bir şey implement etmenize gerek yok.


In [None]:
# Not graded
tree = []

def build_tree_recursive(X, y, node_indices, branch_name, max_depth, current_depth):
    """
    Her düğümde veri setini 2 alt gruba bölen özyinelemeli algoritmayı kullanarak bir ağaç oluşturur.
    Bu fonksiyon sadece ağacı yazdırır.
    
    Argümanlar:
        X (ndarray):            Şekli (n_samples, n_features) olan veri matrisi
        y (array like):         Hedef değişkeni içeren n_samples uzunluğunda liste veya ndarray
        node_indices (ndarray): Aktif indeksleri içeren liste. Yani, bu adımda değerlendirilen örnekler.
        branch_name (string):   Dalın adı. ['Root', 'Left', 'Right']
        max_depth (int):        Oluşacak ağacın maksimum derinliği
        current_depth (int):    Mevcut derinlik. Özyinelemeli çağrı sırasında kullanılan parametre.
   
    """ 

    # Maksimum derinliğe ulaşıldı - bölmeyi durdur
    if current_depth == max_depth:
        formatting = " "*current_depth + "-"*current_depth
        print(formatting, "%s yaprak düğüm, indeksler:" % branch_name, node_indices)
        return
   
    # Aksi takdirde, en iyi bölmeyi al ve veriyi böl
    # Bu düğümdeki en iyi özellik ve eşik değerini al
    best_feature = get_best_split(X, y, node_indices) 
    tree.append((current_depth, branch_name, best_feature, node_indices))
    
    formatting = "-"*current_depth
    print("%s Derinlik %d, %s: Özellik %d üzerinde böl" % (formatting, current_depth, branch_name, best_feature))
    
    # Veri setini en iyi özellik üzerinde böl
    left_indices, right_indices = split_dataset(X, node_indices, best_feature)
    
    # Sol ve sağ alt düğümleri bölmeye devam et. Mevcut derinliği artır
    build_tree_recursive(X, y, left_indices, "Left", max_depth, current_depth+1)
    build_tree_recursive(X, y, right_indices, "Right", max_depth, current_depth+1)





In [39]:
build_tree_recursive(X_train, y_train, root_indices, "Root", max_depth=2, current_depth=0)

 Depth 0, Root: Split on feature: 2
- Depth 1, Left: Split on feature: 0
  -- Left leaf node with indices [0, 1, 4, 7]
  -- Right leaf node with indices [5]
- Depth 1, Right: Split on feature: 1
  -- Left leaf node with indices [8]
  -- Right leaf node with indices [2, 3, 6, 9]
