## merge() Fonksiyonu

<code>merge()</code> fonksiyonu <code>join</code> fonksiyonuna benzer ancak bazı farklı özellikleri vardır. Veri Çerçevesi (DataFrame) veya adlandırılmış Seri nesnelerini (Series) veritabanı stili birleştirme yöntemi ile (SQL’de bulunan inner join, outer join … ‘e benzer) birleştirmek için <code>merge()</code> fonksiyonunu kullanılabilir.

Adlandırılmış Seri nesnesi (Series), adlandırılmış tek bir sütuna sahip Veri çerçevesi (DataFrame) olarak ele alınır.

<code>merge()</code> fonksiyonunun bir çok parametresi vardır. Biz burada temel bir kaç parametreye değineceğiz. Aşağıdaki kodda tüm parametreleri görebilirsiniz. 


    DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, 
                      left_index=False, right_index=False, sort=False, 
                      suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)

### on Parametresi

<code>on</code> parametresi, Veri Çerçevelerinin hangi sütun baz alınarak birleştirileceğini belirteceğimiz parametredir. Öğrenci isimleri ile Vize ve Final sonuçlarının bulunduğu iki veri çerçevesi oluşturup, parametrelerin kullanımını görelim. 

In [5]:
import pandas as pd
vize = pd.DataFrame({"Ogrenci": ["ali", "busra", "ceyhun", "eda", "gamze", "kamil"], 
                     "Sinav Sonucu": [41, 58, 73, 81, 95, 85]})

final = pd.DataFrame({"Ogrenci": ["ali", "busra", "derya", "fatih", "halil"], 
                      "Sinav Sonucu": [60, 68, 74, 90, 95]})
vize

Unnamed: 0,Ogrenci,Sinav Sonucu
0,ali,41
1,busra,58
2,ceyhun,73
3,eda,81
4,gamze,95
5,kamil,85


In [6]:
final

Unnamed: 0,Ogrenci,Sinav Sonucu
0,ali,60
1,busra,68
2,derya,74
3,fatih,90
4,halil,95


Yukarıdaki iki veri çerçevesini, **Ogrenci** isimli sütunu temel alarak birleştirlim. <code>how</code> parametresine takılmayın, aşağıda detaylıca anlatılıyor.

In [7]:
tumu = pd.merge(vize, final, on = "Ogrenci", how = "outer")
tumu

Unnamed: 0,Ogrenci,Sinav Sonucu_x,Sinav Sonucu_y
0,ali,41.0,60.0
1,busra,58.0,68.0
2,ceyhun,73.0,
3,eda,81.0,
4,gamze,95.0,
5,kamil,85.0,
6,derya,,74.0
7,fatih,,90.0
8,halil,,95.0


Birleştirme işlemi sonucunda, İki veri çerçevesindeki tüm veriler, yeni veri çerçevesinde birleştirildi. Hem Vize hemde Final veri çerçevelerinde isimleri bulunan öğrencilerin sınav sonuçları yeni veri çerçevesinde eklenmişken, vize ya da final sonucu olmayan öğrenciler için, ilgili sütun değerleri **NaN** (Not a Number) olarak ayarlandı.

### how Parametresi

<code>how</code> parametresi, veri çerçevelerini birleştirirken matematikteki Kümeler konusuna benzer seçenekler sunar. <code>merge()</code> fonksiyonunda <code>how</code> parametresi kullanılmadığı taktirde varsayılan olarak <code>inner</code> seçeneği belirtilmiş olur ve  birleştirilecek veri çerçevelerinin sadece ortak değerleri alınarak (ortak küme gibi davranarak) birleştirme işlemi gerçekleştirilir.

Birleştirme işlemi sonucunda Sütun başlıklarının sonuna varsayılan **_x** ve **_y** sonekleri eklenir.

how Parametresi için kullanılabilecek seçenekler:

* inner (varsayılan)
* outer
* left
* right
* cross

### inner Seçeneği

<code>inner</code> seçeneği, sadece iki veri çerçevesinde de bulunan **ortak değerleri** birleştirir. Tek veri çerçevesinde olan değerler silinir. <code>how = "inner"</code> ibaresini yazsak ta yazmasak ta aynı sonucu elde ederiz. Aşağıdaki İki kod, aynı sonucu verir, deneyip görelim.

    pd.merge(vize, final, on = "Ogrenci", how = "inner")
    pd.merge(vize, final, on = "Ogrenci")

In [8]:
pd.merge(vize, final, on = "Ogrenci", how = "inner")

Unnamed: 0,Ogrenci,Sinav Sonucu_x,Sinav Sonucu_y
0,ali,41,60
1,busra,58,68


In [9]:
pd.merge(vize, final, on = "Ogrenci")

Unnamed: 0,Ogrenci,Sinav Sonucu_x,Sinav Sonucu_y
0,ali,41,60
1,busra,58,68


### outer Seçeneği

<code>outer</code> seçeneği kullanıldığında, iki veri çerçevesinde bulunan **tüm değerler** birleştirilir. Sol tarafta yazılan veri çerçevesindeki değerler temel alınır. İki veri çerçevesinde bulunan ortak  değerler korunur, aksi halde eksik değerler için **NaN** değeri atanır.

In [10]:
pd.merge(vize, final, on = "Ogrenci", how = "outer")

Unnamed: 0,Ogrenci,Sinav Sonucu_x,Sinav Sonucu_y
0,ali,41.0,60.0
1,busra,58.0,68.0
2,ceyhun,73.0,
3,eda,81.0,
4,gamze,95.0,
5,kamil,85.0,
6,derya,,74.0
7,fatih,,90.0
8,halil,,95.0


### left Seçeneği

<code>left</code> seçeneği ile yapılan birleştirme işleminde, **sol tarafta yazılan veri çerçevesinin tüm değerlerini alır ve sağ tarafta yazılan veri çerçevesindeki ortak değerleri** tabloya ekler. Solda yazılan veri çerçevesindeki değerlerin, sağda yazılan veri çerçevesinde karşılığı yoksa, ilgili sütuna **NaN** değeri atanır. Sağ tarafta yazılan veri çerçevesinin, sol tarafta yazılan veri çerçevesinde karşılığı yoksa, bu değerler yok sayılır, birleştirme işlemine dahil edilmez.

In [11]:
pd.merge(vize, final, on = "Ogrenci", how = "left")

Unnamed: 0,Ogrenci,Sinav Sonucu_x,Sinav Sonucu_y
0,ali,41,60.0
1,busra,58,68.0
2,ceyhun,73,
3,eda,81,
4,gamze,95,
5,kamil,85,


### right Seçeneği

<code>right</code> seçeneği ile yapılan birleştirme işleminde, **sağ tarafta yazılan veri çerçevesinin tüm değerlerini alır ve sol tarafta yazılan veri çerçevesindeki ortak değerleri** tabloya ekler. Sağda yazılan veri çerçevesindeki değerlerin, solda yazılan veri çerçevesinde karşılığı yoksa, ilgili sütuna **NaN** değeri atanır. Sol tarafta yazılan veri çerçevesinin, sağ tarafta yazılan veri çerçevesinde karşılığı yoksa, bu değerler yok sayılır, birleştirme işlemine dahil edilmez.

In [12]:
pd.merge(vize, final, on = "Ogrenci", how = "right")

Unnamed: 0,Ogrenci,Sinav Sonucu_x,Sinav Sonucu_y
0,ali,41.0,60
1,busra,58.0,68
2,derya,,74
3,fatih,,90
4,halil,,95


### cross Seçeneği

<code>cross</code> seçeneği sonucunda, **kartezyen çarpımı yöntemi** ile birleştirme yapılır. Konuyu örnekle daha iyi anlayacağımızı düşünüyorum.

In [13]:
veri1 = pd.DataFrame({'HARF': ['A', 'B', "C"]})
veri2 = pd.DataFrame({'SAYI': [10,20,30]})
veri1

Unnamed: 0,HARF
0,A
1,B
2,C


In [14]:
veri2

Unnamed: 0,SAYI
0,10
1,20
2,30


In [15]:
pd.merge(veri1, veri2, how="cross")

Unnamed: 0,HARF,SAYI
0,A,10
1,A,20
2,A,30
3,B,10
4,B,20
5,B,30
6,C,10
7,C,20
8,C,30


### left_on Parametresi

Bu parametre opsiyonel yani İsteğe bağlıdır, kullanmak zorunda değilsiniz. Soldaki Veri Çerçevesi üzerinde birleştirmenin hangi düzeyde yapılacağını belirtmek için kullanılır. Sütun başlıklarının sonuna varsayılan **_x** ve **_y** sonekleri eklenir.

<code>left_on</code> parametresi, etiket veya liste ya da dizi benzeri veri alır.

### right_on Parametresi

Bu parametre opsiyonel yani İsteğe bağlıdır, kullanmak zorunda değilsiniz. Sağdaki Veri Çerçevesi üzerinde birleştirmenin hangi düzeyde yapılacağını belirtmek için kullanılır. Sütun başlıklarının sonuna varsayılan **_x** ve **_y** sonekleri eklenir.

<code>right_on</code> parametresi, etiket veya liste ya da dizi benzeri veri alır.

In [16]:
arastirma1 = pd.DataFrame({'Manav_1': ['elma', 'nar', 'portakal', 'elma'],
                    'fiyat': [1, 2, 3, 4]})

arastirma2 = pd.DataFrame({'Manav_2': ['elma', 'nar', 'portakal', 'elma'],
                    'fiyat': [5, 6, 7, 8]})
arastirma1

Unnamed: 0,Manav_1,fiyat
0,elma,1
1,nar,2
2,portakal,3
3,elma,4


In [17]:
arastirma2

Unnamed: 0,Manav_2,fiyat
0,elma,5
1,nar,6
2,portakal,7
3,elma,8


In [18]:
arastirma1.merge(arastirma2, left_on='Manav_1', right_on='Manav_2')

Unnamed: 0,Manav_1,fiyat_x,Manav_2,fiyat_y
0,elma,1,elma,5
1,elma,1,elma,8
2,elma,4,elma,5
3,elma,4,elma,8
4,nar,2,nar,6
5,portakal,3,portakal,7


In [19]:
arastirma2.merge(arastirma1, right_on='Manav_1', left_on='Manav_2')

Unnamed: 0,Manav_2,fiyat_x,Manav_1,fiyat_y
0,elma,5,elma,1
1,elma,5,elma,4
2,elma,8,elma,1
3,elma,8,elma,4
4,nar,6,nar,2
5,portakal,7,portakal,3


In [20]:
arastirma1.merge(arastirma2, left_on='Manav_1', right_on='Manav_2',suffixes=("_bir", "_iki"))

Unnamed: 0,Manav_1,fiyat_bir,Manav_2,fiyat_iki
0,elma,1,elma,5
1,elma,1,elma,8
2,elma,4,elma,5
3,elma,4,elma,8
4,nar,2,nar,6
5,portakal,3,portakal,7


### suffixes Parametresi

<code>merge()</code> fonksiyonu ile birleştirme işlemi sonucunda, sütun başlıklarının sonuna **_x** ve **_y** soneklerinin dahil edildiğini söyledik. Bu değer vaysayılan değerdir. Bu değeri değiştirmek ve sütun başlıklarının sonuna, istediğimiz değeri eklemek istersek bu işlemi <code>suffixes</code> parametresi ile yapabiliriz.

In [21]:
arastirma1.merge(arastirma2, left_on='Manav_1', right_on='Manav_2', suffixes=("_bir", "_iki"))

Unnamed: 0,Manav_1,fiyat_bir,Manav_2,fiyat_iki
0,elma,1,elma,5
1,elma,1,elma,8
2,elma,4,elma,5
3,elma,4,elma,8
4,nar,2,nar,6
5,portakal,3,portakal,7
