## What is regression?

Regression works by establishing a relationship between variables in the data that represent characteristics—known as the features—of the thing being observed, and the variable we're trying to predict—known as the label. [Regresyon, gözlemlenen şeyin özelliklerini (özellikler olarak bilinen) temsil eden verilerdeki değişkenler ile tahmin etmeye çalıştığımız ve etiket olarak bilinen değişken arasında bir ilişki kurarak çalışır.] Recall our company that rents bicycles and wants to predict the expected number of rentals in a given day. [Bisiklet kiralayan ve belirli bir günde beklenen kiralama sayısını tahmin etmek isteyen şirketimizi hatırlayın.] In this case, features include things like the day of the week, month, and so on, while the label is the number of bicycle rentals. [Bu durumda, özellikler haftanın günü, ay vb. gibi şeyleri içerirken, etiket kiralık bisiklet sayısıdır.]

To train the model, we start with a data sample containing the features, as well as known values for the label - so in this case we need historical data that includes dates, weather conditions, and the number of bicycle rentals. [Modeli eğitmek için, etiket için bilinen değerlerin yanı sıra özellikleri de içeren bir veri örneğiyle başlıyoruz - bu durumda tarihleri, hava koşullarını ve kiralık bisiklet sayısını içeren geçmiş verilere ihtiyacımız var.]

We'll then split this data sample into two subsets: [Daha sonra bu veri örneğini iki alt kümeye böleceğiz:]

- A training dataset to which we'll apply an algorithm that determines a function encapsulating the relationship between the feature values and the known label values. [Özellik değerleri ile bilinen etiket değerleri arasındaki ilişkiyi kapsayan bir işlevi belirleyen bir algoritmayı uygulayacağımız bir eğitim veri kümesi.]

- A validation or test dataset that we can use to evaluate the model by using it to generate predictions for the label and comparing them to the actual known label values. [Etiket için tahminler oluşturmak ve bunları bilinen gerçek etiket değerleriyle karşılaştırmak için kullanarak modeli değerlendirmek için kullanabileceğimiz bir doğrulama veya test veri seti.]

The use of historic data with known label values to train a model makes regression an example of supervised machine learning. [Bir modeli eğitmek için bilinen etiket değerlerine sahip geçmiş verilerin kullanılması, regresyonu denetimli makine öğreniminin bir örneği haline getirir.]

### A simple example [Basit bir örnek]

Let's take a simple example to see how the training and evaluation process works in principle. [Eğitim ve değerlendirme sürecinin prensipte nasıl çalıştığını görmek için basit bir örnek alalım.] Suppose we simplify the scenario so that we use a single feature—average daily temperature—to predict the bicycle rentals label. [Bisiklet kiralama etiketini tahmin etmek için tek bir özellik (ortalama günlük sıcaklık) kullanacak şekilde senaryoyu basitleştirdiğimizi varsayalım.]

We start with some data that includes known values for the average daily temperature feature and the bicycle rentals label. [Ortalama günlük sıcaklık özelliği ve bisiklet kiralama etiketi için bilinen değerleri içeren bazı verilerle başlıyoruz.]

![image.png](attachment:image.png)

Now we'll randomly select five of these observations and use them to train a regression model. [Şimdi bu gözlemlerden beşini rastgele seçeceğiz ve bunları bir regresyon modeli eğitmek için kullanacağız.] When we're talking about ‘training a model’, what we mean is finding a function (a mathematical equation; let’s call it f) that can use the temperature feature (which we’ll call x) to calculate the number of rentals (which we’ll call y). ['Bir model eğitmek' hakkında konuştuğumuzda, kiralama sayısını hesaplamak için sıcaklık özelliğini (x diyeceğiz) kullanabilen bir fonksiyon (matematiksel bir denklem; buna f diyelim) bulmaktan bahsediyoruz. buna y diyeceğiz).] In other words, we need to define the following function: f(x) = y. [Başka bir deyişle, şu fonksiyonu tanımlamamız gerekiyor: f(x) \u003d y.]

Our training dataset looks like this: [Eğitim veri setimiz şöyle görünür:]

![image.png](attachment:image.png)

Let's start by plotting the training values for x and y on a chart:

![image.png](attachment:image.png)

Now we need to fit these values to a function, allowing for some random variation. [Şimdi bu değerleri bir fonksiyona uydurmamız gerekiyor, bu da bazı rasgele varyasyonlara izin veriyor.] You can probably see that the plotted points form an almost straight diagonal line - in other words, there's an apparent linear relationship between x and y, so we need to find a linear function that's the best fit for the data sample. [Muhtemelen çizilen noktaların neredeyse düz bir çapraz çizgi oluşturduğunu görebilirsiniz - başka bir deyişle, x ve y arasında belirgin bir doğrusal ilişki vardır, bu nedenle veri örneği için en uygun doğrusal işlevi bulmamız gerekir.] There are various algorithms we can use to determine this function, which will ultimately find a straight line with minimal overall variance from the plotted points; like this: [Bu işlevi belirlemek için kullanabileceğimiz çeşitli algoritmalar vardır ve bu algoritmalar sonunda çizilen noktalardan minimum toplam varyansla düz bir çizgi bulur; bunun gibi:]

![image.png](attachment:image.png)

The line represents a linear function that can be used with any value of x to apply the slope of the line and its intercept (where the line crosses the y axis when x is 0) to calculate y. [Çizgi, y'yi hesaplamak için çizginin eğimini ve kesişimini (x 0 olduğunda çizginin y eksenini kestiği yer) uygulamak için herhangi bir x değeriyle kullanılabilen doğrusal bir işlevi temsil eder.] In this case, if we extended the line to the left we'd find that when x is 0, y is around 20, and the slope of the line is such that for each unit of x you move along to the right, y increases by around 1.7. [Bu durumda, çizgiyi sola doğru uzatırsak, x 0 olduğunda, y'nin yaklaşık 20 olduğunu ve çizginin eğiminin, sağa doğru hareket ettiğiniz her x birimi için y'nin arttığını buluruz. 1.7 civarında.] Our f function therefore can be calculated as 20 + 1.7x. [Dolayısıyla f fonksiyonumuz 20 + 1.7x olarak hesaplanabilir.]

Now that we've defined our predictive function, we can use it to predict labels for the validation data we held back and compare the predicted values (which we typically indicate with the symbol ŷ, or "y-hat") with the actual known y values. [Artık tahmin fonksiyonumuzu tanımladığımıza göre, onu geride tuttuğumuz doğrulama verileri için etiketleri tahmin etmek için kullanabilir ve tahmin edilen değerleri (tipik olarak ŷ veya 'y-hat' ile gösteririz) bilinen gerçek değerlerle karşılaştırabiliriz. y değerleri.]

![image.png](attachment:image.png)

Let's see how the y and ŷ values compare in a plot:

![image.png](attachment:image.png)

The plotted points that are on the function line are the predicted ŷ values calculated by the function, and the other plotted points are the actual y values. [Fonksiyon satırında çizilen noktalar, fonksiyon tarafından hesaplanan tahmini ŷ değerleridir ve çizilen diğer noktalar, gerçek y değerleridir.]

There are various ways we can measure the variance between the predicted and actual values, and we can use these metrics to evaluate how well the model predicts. [Tahmin edilen ve gerçek değerler arasındaki varyansı ölçmenin çeşitli yolları vardır ve bu ölçümleri modelin ne kadar iyi tahmin ettiğini değerlendirmek için kullanabiliriz.]

**Note** [Not]

Machine learning is based in statistics and math, and it's important to be aware of specific terms that statisticians and mathematicians (and therefore data scientists) use. [Makine öğrenimi istatistik ve matematiğe dayalıdır ve istatistikçilerin ve matematikçilerin (ve dolayısıyla veri bilimcilerinin) kullandığı belirli terimlerin farkında olmak önemlidir.] You can think of the difference between a predicted label value and the actual label value as a measure of error. [Tahmin edilen etiket değeri ile gerçek etiket değeri arasındaki farkı bir hata ölçüsü olarak düşünebilirsiniz.] However, in practice, the "actual" values are based on sample observations (which themselves may be subject to some random variance). [Bununla birlikte, pratikte, 'gerçek' değerler, örnek gözlemlere dayanmaktadır (bunların kendileri bir miktar rastgele varyansa tabi olabilir).] To make it clear that we're comparing a predicted value (ŷ) with an observed value (y) we refer to the difference between them as the residuals. [Tahmin edilen bir değeri (ŷ) gözlemlenen bir değerle (y) karşılaştırdığımızı açıklığa kavuşturmak için aralarındaki farka artıklar olarak atıfta bulunuruz.] We can summarize the residuals for all of the validation data predictions to calculate the overall loss in the model as a measure of its predictive performance. [Tahmin performansının bir ölçüsü olarak modeldeki genel kaybı hesaplamak için tüm doğrulama verisi tahminlerinin artıklarını özetleyebiliriz.]

One of the most common ways to measure the loss is to square the individual residuals, sum the squares, and calculate the mean. [Kaybı ölçmenin en yaygın yollarından biri, tek tek artıkların karesini almak, kareleri toplamak ve ortalamayı hesaplamaktır.] Squaring the residuals has the effect of basing the calculation on absolute values (ignoring whether the difference is negative or positive) and giving more weight to larger differences. [Artıkların karesini almak, hesaplamayı mutlak değerlere dayandırmak (farkın negatif mi yoksa pozitif mi olduğunu göz ardı ederek) ve daha büyük farklara daha fazla ağırlık vermek etkisine sahiptir.] This metric is called the Mean Squared Error. [Bu metriğe Ortalama Kare Hatası denir.]

For our validation data, the calculation looks like this: [Doğrulama verilerimiz için hesaplama şöyle görünür:]

![image.png](attachment:image.png)

So the loss for our model based on the MSE metric is 9.79. [Dolayısıyla, MSE metriğini temel alan modelimizin kaybı 9.79'dur.]

So is that any good? [Bu iyi mi?] It's difficult to tell because MSE value isn't expressed in a meaningful unit of measurement. [MSE değeri anlamlı bir ölçü biriminde ifade edilmediğinden söylemek zor.] We do know that the lower the value is, the less loss there is in the model; and therefore, the better it is predicting. [Değer ne kadar düşükse, modelde o kadar az kayıp olduğunu biliyoruz; ve bu nedenle, daha iyi tahmin ediyor.] This makes it a useful metric to compare two models and find the one that performs best. [Bu, iki modeli karşılaştırmak ve en iyi performansı göstereni bulmak için kullanışlı bir ölçüm yapar.]

Sometimes, it's more useful to express the loss in the same unit of measurement as the predicted label value itself - in this case, the number of rentals. [Bazen, kaybı, tahmin edilen etiket değerinin kendisiyle aynı ölçü biriminde ifade etmek daha yararlıdır - bu durumda, kiralama sayısı.] It's possible to do this by calculating the square root of the MSE, which produces a metric known, unsurprisingly, as the Root Mean Squared Error (RMSE). [Bunu, şaşırtıcı olmayan bir şekilde Ortalama Karekök Hatası (RMSE) olarak bilinen bir metriği üreten MSE'nin karekökünü hesaplayarak yapmak mümkündür.]

√9.79 = 3.13 [√9.79 \u003d 3.13]

So our model's RMSE indicates that the loss is just over 3, which you can interpret loosely as meaning that on average, incorrect predictions are wrong by around 3 rentals. [Dolayısıyla, modelimizin RMSE'si, kaybın 3'ün biraz üzerinde olduğunu gösteriyor ve bunu, ortalama olarak, yanlış tahminlerin yaklaşık 3 kiralama ile yanlış olduğu şeklinde gevşek bir şekilde yorumlayabilirsiniz.]

There are many other metrics that can be used to measure loss in a regression. [Bir regresyondaki kaybı ölçmek için kullanılabilecek birçok başka ölçüt vardır.] For example, R2 (R-Squared) (sometimes known as coefficient of determination) is the correlation between x and y squared. [Örneğin, R2 (R-Kare) (bazen belirleme katsayısı olarak da bilinir), x ve y kare arasındaki bağıntıdır.] This produces a value between 0 and 1 that measures the amount of variance that can be explained by the model. [Bu, model tarafından açıklanabilen varyans miktarını ölçen 0 ile 1 arasında bir değer üretir.] Generally, the closer this value is to 1, the better the model predicts. [Genel olarak, bu değer 1'e ne kadar yakınsa, model o kadar iyi tahmin yapar.]