# Google Machine learning crash course notes Week - 1  (Enes Çavuş) 

### Bu Notebook Crash Course  tensorflow api egzersizleri içermektedir.

[Colab original link](https://colab.research.google.com/github/google/eng-edu/blob/master/ml/cc/exercises/linear_regression_with_synthetic_data.ipynb?utm_source=mlcc&utm_campaign=colab-external&utm_medium=referral&utm_content=linear_regression_synthetic_tf2-colab&hl=en#scrollTo=QF0BFRXTOeR3)

> The goal of teaching should not be to help the students learn how to memorize and spit out information under academic pressure. The purpose of teaching is to inspire the desire for learning in them and make them able to THINK, UNDERSTAND and  QUESTION. 

 **- Richard Feynman**

---

## Model eğitminde kullanılan hiperparametrelerin optimum değerlerinin bulunması.

Bence bilgisayar bilimlerinin temelinde **( divide and conquer ) _böl ve yönet_** ilkesi yatar. Eğer çok büyük bir projeyi ekip çalışması yapmadan, planlayıp parçalamadan (Bakınız - kitap - [**Scrum - Agile**](https://www.amazon.com.tr/Scrum-Kat%C4%B1-Zamanda-Yapma-Sanat%C4%B1/dp/6058487471/ref=asc_df_6058487471/?tag=googleshoptr-21&linkCode=df0&hvadid=344882438061&hvpos=&hvnetw=g&hvrand=4972712707744752112&hvpone=&hvptwo=&hvqmt=&hvdev=c&hvdvcmdl=&hvlocint=&hvlocphy=9056855&hvtargid=pla-713402970464&psc=1) ), iş bölümü yapmadan sizce başarıyla tamamlama olasılığınız nedir? Yoktur. Bunu her alanda uygulayabiliriz ama şimdilik bu ilk haftanın konuları üzerine yoğunlaşalım.

Tabii ki tüm konular çok önemli ama,
Ben bu haftayı dörde böldüm:
+ Feature ve label kavramlarını anlama
+ Loss yönetimine hakimiyeti artırma
+ Laerning rate, batch, epoch hiperparametrelerini anlama
+ Veriyi yönetme ve overfitting gibi  olası problemlerden kaçınma ( Train - Validation - Test ) Bu kısma bu notebook üzerinde değinilmemiştir.


**Note:** Bu yazdıklarım genel hatırlatma amaçlıdır. Arada girip göz atabileceğiniz CheatSheet. Detaya inmeden sadece genel bir bakış.


In [None]:
#@title Run this Colab on TensorFlow 2.x    # bu kısımda colab üzerinde kullanacağımız tensorflow sürümü seçini yapılmaktadır. Pek bi önemi yok şu anda
%tensorflow_version 2.x

In [None]:
import pandas as pd                           # pandas veriyi analiz edebilmek için vazgeçilmez bir kütüphane. Bence ilk 10 da belki de 5
import tensorflow as tf
from matplotlib import pyplot as plt          # matplotlib veriyi görselleştirmede öncü, bilmeyenler için seaborn'u da araştırabilirsiniz.

Sıradaki kodumuz model tanımlama işlemlerini içermektedir ve şu anda odağımızda değildir. Geçiniz! 

In [None]:
#@title Define the functions that build and train a model
def build_model(my_learning_rate):
  """Create and compile a simple linear regression model."""
  # Most simple tf.keras models are sequential. 
  # A sequential model contains one or more layers.
  model = tf.keras.models.Sequential()

  # Describe the topography of the model.
  # The topography of a simple linear regression model
  # is a single node in a single layer. 
  model.add(tf.keras.layers.Dense(units=1, 
                                  input_shape=(1,)))

  # Compile the model topography into code that 
  # TensorFlow can efficiently execute. Configure 
  # training to minimize the model's mean squared error. 
  model.compile(optimizer=tf.keras.optimizers.RMSprop(lr=my_learning_rate),
                loss="mean_squared_error",
                metrics=[tf.keras.metrics.RootMeanSquaredError()])

  return model           


def train_model(model, feature, label, epochs, batch_size):
  """Train the model by feeding it data."""

  # Feed the feature values and the label values to the 
  # model. The model will train for the specified number 
  # of epochs, gradually learning how the feature values
  # relate to the label values. 
  history = model.fit(x=feature,
                      y=label,
                      batch_size=None,
                      epochs=epochs)

  # Gather the trained model's weight and bias.
  trained_weight = model.get_weights()[0]
  trained_bias = model.get_weights()[1]

  # The list of epochs is stored separately from the 
  # rest of history.
  epochs = history.epoch
  
  # Gather the history (a snapshot) of each epoch.
  hist = pd.DataFrame(history.history)

  # Specifically gather the model's root mean 
  #squared error at each epoch. 
  rmse = hist["root_mean_squared_error"]

  return trained_weight, trained_bias, epochs, rmse

print("Defined create_model and train_model")


Aşağıdaki kod, görselleştirme araçlarınn kulanılmasını sağlamakta ve yine bununla şimdilik işimiz yok. Evet veri görselleştirme ve veriyi analiz etme makine öğrenmesinin temelleri, ilk yapılması gerekenler ama şimdilik odak noktamız daha çok model eğitiminin teorik temelleri ve belli başlı parametrelere aşinalık kazanmamız. Bu yüzden bu kodu da geçelim.


In [None]:
#@title Define the plotting functions
def plot_the_model(trained_weight, trained_bias, feature, label):
  """Plot the trained model against the training feature and label."""

  # Label the axes.
  plt.xlabel("feature")
  plt.ylabel("label")

  # Plot the feature values vs. label values.
  plt.scatter(feature, label)

  # Create a red line representing the model. The red line starts
  # at coordinates (x0, y0) and ends at coordinates (x1, y1).
  x0 = 0
  y0 = trained_bias
  x1 = my_feature[-1]
  y1 = trained_bias + (trained_weight * x1)
  plt.plot([x0, x1], [y0, y1], c='r')

  # Render the scatter plot and the red line.
  plt.show()

def plot_the_loss_curve(epochs, rmse):
  """Plot the loss curve, which shows loss vs. epoch."""

  plt.figure()
  plt.xlabel("Epoch")
  plt.ylabel("Root Mean Squared Error")

  plt.plot(epochs, rmse, label="Loss")
  plt.legend()
  plt.ylim([rmse.min()*0.97, rmse.max()])
  plt.show()

print("Defined the plot_the_model and plot_the_loss_curve functions.")

Elimizde bir veri olmadan model eğitemeyeceğimize göre. Bizler için güzelce hazırlanmış, tam bir regresyon problemine uygun verimizi ve label değerlerini aşağıda görmekteyiz. Yeri gelmişken label ve feature kavramlarını biraz daha yakından inceleyelim.

## Feature
 - Bizler modelimizi eğitirken ona bilgi vermekteyiz. Şu özellikleri al ve bunlardan bi çıkarım yap. Örneğin kurstaki ev örneğini alalım. Bi evin özellikleri neler olabilir : Kaç odalı? Kaç metrekare? Kaç banyosu var? Göl manzaralı mı? (böyle bir özellik olmayabilir de :) ). İşte bunlar bizim modelimize vereceğimiz özellikler olacak. Peki bunları nasıl yorumlayacak bu model? İşte burada label devreye giriyor.
    
## Label
 - Şu cümleye geri dönelim ->  _Şu özellikleri al ve bunlardan bir çıkarım yap_. Nasıl bir çıkarım yapacağını söyledik mi? Hayır. Bunu söylemek için label kullanıyoruz. Ekteki resime bakıldığında buradaki feature ve label değerleri görülmekte. Biz modelimize oda sayılarını vb veriyoruz ayrıca ek olarak ona bu özelliklere sahip bi evin değeri şu olur diyerek label'lama işlemini de yapmış oluyoruz. Oldukça anlaşılır dimi? Yine de bir örnek verelim.

## Örnek
 Bir evimiz var ve bunun 4 odası, 2 banyosu, bahçesi var ve 150 metrekare ( bunlar özelliklerimizdi ) , değeri ise $260.000 (bu label).
 Bir evimiz var ve bunun 3 odası, 1 banyosu, bahçe yok, ve 120 metrekare (bunlar özelliklerimizdi ), değeri ise #130.000 (bu label)
 
 Bu bilgilerden milyonlarca olduğunu düşünün. Sizce bir evin bahçesi varsa değerinin artacağını modelimiz öğrenemez mi? Ya da banyo sayısının artması ile fiyatın arasında bir oran orantı yakalayamaz mı?


![test image](images/feature-label.png)

In [None]:
my_feature = ([1.0, 2.0,  3.0,  4.0,  5.0,  6.0,  7.0,  8.0,  9.0, 10.0, 11.0, 12.0])
my_label   = ([5.0, 8.8,  9.6, 14.2, 18.8, 19.5, 21.4, 26.8, 28.9, 32.0, 33.8, 38.2])

### Verimizi aldığımıza göre modelimizin hiperparametrelerine bi göz atalım.

+ Learning_rate : learning rate kısaca verimiz üzerinde nasıl gezineceğimizi belirler. Verimizi yorumlarken düşük bir loss değerine erişmek iyidir fakat learning rate i çok küçük alırsanız ömür boyu erişemeyebilirsiniz. Ya da çok büyük alırsanız hedefimizin üzerinden atlar ve çok farklı konumlara şıçrayabilirsiniz.
 
+ Batch_size: gerçek hayatta veri setlerimiz çok büyük ve bunu bir kerede modele verip yorumlamasını istememiz hatta bunu sürekli yaptırmamız belki de imkansız ya da zaman alır. Bunu önlemek için modelimize parça parça veri veriyoruz. Örneği: 1000 veriniz var batch size ise 100 seçtiniz, işte bu şekilde 10 tura tamamen verimiz modelden geçmiş olacaktır.Tur demişken ...

+ Epoch : Tur dediğimiz şey aslında iterasyon sayısı. Örneğimizde bu 10 du. Peki bu 10 turun ( iterasyonun ) tamamlanması için geçen zamana ne deniyor? Epoch.

In [None]:
learning_rate=0.01
epochs=10
my_batch_size=12

my_model = build_model(learning_rate)
trained_weight, trained_bias, epochs, rmse = train_model(my_model, my_feature, 
                                                         my_label, epochs,
                                                         my_batch_size)
plot_the_model(trained_weight, trained_bias, my_feature, my_label)
plot_the_loss_curve(epochs, rmse)

Bu kısımda epoch hparametresini yorumlamamız istenmiş. Artırabiliriz, Aşırıya kaçmayalım çünkü overfitting hiç istemediğimiz bişey!

In [None]:
learning_rate=0.01
epochs= ?   # Replace ? with an integer.
my_batch_size=12

my_model = build_model(learning_rate)
trained_weight, trained_bias, epochs, rmse = train_model(my_model, my_feature, 
                                                        my_label, epochs,
                                                        my_batch_size)
plot_the_model(trained_weight, trained_bias, my_feature, my_label)
plot_the_loss_curve(epochs, rmse)

Bu kısımda learning rate'i yorumlamamız istenmiş. Yukarıda da açıklamıştım: Ne çok yüksek ne de çok düşük değerler vermeyelim, aşırıya kaçmadan orta yolu bulmamız kâfi.

In [None]:
# Increase the learning rate and decrease the number of epochs.
learning_rate=100 
epochs=500 

my_model = build_model(learning_rate)
trained_weight, trained_bias, epochs, rmse = train_model(my_model, my_feature, 
                                                         my_label, epochs,
                                                         my_batch_size)
plot_the_model(trained_weight, trained_bias, my_feature, my_label)
plot_the_loss_curve(epochs, rmse)

Bu kısımda ikisinide yorumlamamız istenmiş. Eğer learning rate küçülürse epoch'un artması işimize yarayabilir. Ya da tam tersi: learning rate büyürse epoch azalsa iyi olur.

Optimumu bulmak için sürekli denemeler yapmamız gerekebilir. Ve kötü yanı, hiçbir zaman net bi değer yoktur. Bu parametreler veri setlerine özgü belirlenmeli. En garanti yol bu!

In [None]:
# Set the learning rate and number of epochs
learning_rate= ?  # Replace ? with a floating-point number
epochs= ?   # Replace ? with an integer

my_model = build_model(learning_rate)
trained_weight, trained_bias, epochs, rmse = train_model(my_model, my_feature, 
                                                         my_label, epochs,
                                                         my_batch_size)
plot_the_model(trained_weight, trained_bias, my_feature, my_label)
plot_the_loss_curve(epochs, rmse)

Bu örnekte batch_size'ın öneminin anlaşılamayacağını düşünüyorum. Daha büyük veri setlerinde farklı kombinasyonlarda görüşmek üzere.

In [None]:
learning_rate=0.05
epochs=100
my_batch_size=12  # Replace ? with an integer.

my_model = build_model(learning_rate)
trained_weight, trained_bias, epochs, rmse = train_model(my_model, my_feature, 
                                                        my_label, epochs,
                                                        my_batch_size)
plot_the_model(trained_weight, trained_bias, my_feature, my_label)
plot_the_loss_curve(epochs, rmse)