# 📈 Merge, Join ve Concatenate

In [133]:
import numpy as np
import pandas as pd

### ✅**`Concatenation - Birleştirme`**

Pandas'ta ``"pd.concat"``, birden fazla DataFrame veya Series'i belirli bir eksen boyunca birleştirmek için kullanılır. Bu fonksiyon, birleştirme sırasında esneklik ve kontrol sağlar.

➡️``pd.concat`` genellikle şu durumlarda kullanılır:

Verileri dikey (satır bazında) veya yatay (sütun bazında) birleştirmek.
Aynı veya farklı sütun adlarına sahip DataFrame'leri birleştirmek.
Eksik veri yönetimi ve indeksleme işlemleri yapmak.

⏩"**Temel Söz Dizimi:**"

```python
pd.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, ...)
```

"**Parametreler:**"

``objs:`` Birleştirilecek DataFrame veya Series'lerin listesi.(df1,df2...)

``axis:`` Birleştirme ekseni.(satır veya sütun( 0 - 1))

``axis=0:`` Satır bazında birleştirme (dikey).

``axis=1:`` Sütun bazında birleştirme (yatay).

``join:`` Birleştirme yöntemi.

``outer:`` Varsayılan, tüm indeksleri içerir.

``inner:`` Ortak indeksleri içerir.

``ignore_index:`` İndeksi yok sayıp yeniden sıfırdan indeks oluşturur (varsayılan False).

``keys:`` Her DataFrame veya Series için bir seviye ekler.

In [136]:
dataset1 = {
    "A": ["A1","A2","A3","A4"],
    "B":["B1","B2","B3","B4"],
    "C":["C1","C2","C3","C4"],
}

In [137]:
dataset2 = {
    "A": ["A5","A6","A7","A8"],
    "B":["B5","B6","B7","B8"],
    "C":["C5","C6","C7","C8"],
}

In [138]:
df1 = pd.DataFrame(dataset1, index = [1,2,3,4])
df2 = pd.DataFrame(dataset2, index = [5,6,7,8])

In [139]:
df1

Unnamed: 0,A,B,C
1,A1,B1,C1
2,A2,B2,C2
3,A3,B3,C3
4,A4,B4,C4


In [140]:
df2

Unnamed: 0,A,B,C
5,A5,B5,C5
6,A6,B6,C6
7,A7,B7,C7
8,A8,B8,C8


In [141]:
pd.concat([df1,df2]) #objs = df1,df2

Unnamed: 0,A,B,C
1,A1,B1,C1
2,A2,B2,C2
3,A3,B3,C3
4,A4,B4,C4
5,A5,B5,C5
6,A6,B6,C6
7,A7,B7,C7
8,A8,B8,C8


In [142]:
result = pd.concat([df1,df2],axis = 1) #Sütunları birleştirince NaN değerler çıkacaktır.
result

Unnamed: 0,A,B,C,A.1,B.1,C.1
1,A1,B1,C1,,,
2,A2,B2,C2,,,
3,A3,B3,C3,,,
4,A4,B4,C4,,,
5,,,,A5,B5,C5
6,,,,A6,B6,C6
7,,,,A7,B7,C7
8,,,,A8,B8,C8


result_filled = result.fillna(0) #NaN değerlerini dolduralım.
result_filled

### ✅MERGE

Pandas'ta merge, "***iki ya da daha fazla veri çerçevesini (DataFrame) birleştirmek için kullanılan güçlü bir fonksiyondur.***"

``SQL'deki JOIN işlemlerine çok benzer şekilde çalışır.`` 

➡️İki tabloyu ortak bir sütun ya da indeks üzerinden birleştirir.⬅️

👀👀``Temel Kullanımı``

**İki DataFrame'i birleştirir.**

***Ortak sütunlara veya anahtar değerlerine dayanır.***

📌Farklı türlerde birleştirme yöntemleri sunar:

inner (kesişim)

outer (birleşim)

left (soldan birleştirme)

right (sağdan birleştirme)

In [147]:
dataset1 = {
    "A" : ["A1","A2","A3"],
    "B" : ["B1","B2","B3"],
    "anahtar" : ["K1","K2","K3"]
}

In [148]:
df1 = pd.DataFrame(dataset1,index = [1,2,3]) 

In [149]:
df1

Unnamed: 0,A,B,anahtar
1,A1,B1,K1
2,A2,B2,K2
3,A3,B3,K3


In [150]:
dataset2 = {
    "X" : ["X1","X2","X3","X4"],
    "Y" : ["Y1","Y2","Y3","Y4"],
    "anahtar" : ["K1","K2","K5","K4"]
}

In [151]:
df2 = pd.DataFrame(dataset2 , index =[1,2,3,4])

In [152]:
df2

Unnamed: 0,X,Y,anahtar
1,X1,Y1,K1
2,X2,Y2,K2
3,X3,Y3,K5
4,X4,Y4,K4


In [153]:
result3 = pd.merge(df1,df2, how = "inner" , on = "anahtar")

In [154]:
result3

Unnamed: 0,A,B,anahtar,X,Y
0,A1,B1,K1,X1,Y1
1,A2,B2,K2,X2,Y2


### ✅JOIN

JOIN işlemi, ````bir veritabanında veya veri analizinde iki veya daha fazla tabloyu birleştirmek için kullanılan bir yöntemdir``. 

Python'da özellikle pandas kütüphanesi ile merge fonksiyonu kullanılarak gerçekleştirilir.

***JOIN Türleri***

``INNER JOIN``
İki tablodaki ortak alanlara göre birleştirir. Sadece her iki tablonun kesişiminde olan verileri alır.

``LEFT JOIN``
Sol tablodaki tüm verileri alır ve sağ tabloyla eşleşen değerleri getirir. Eşleşmeyen sağ tablodaki sütunlar NaN olur.

``RIGHT JOIN``
Sağ tablodaki tüm verileri alır ve sol tabloyla eşleşen değerleri getirir. Eşleşmeyen sol tablodaki sütunlar NaN olur.

``OUTER JOIN``
Her iki tablodaki tüm verileri alır. Ortak olmayan alanlarda eksik veriler NaN olarak görünür.

In [157]:
dataset3 = {
    "A" : ["A1","A2","A3","A4"],
    "B" : ["B1","B2","B3","B4"],
}
dataset4 = {
    "X" : ["X1","X2","X3"],
    "Y" : ["Y1","Y2","Y3"],
    
}

In [158]:
df3 = pd.DataFrame(dataset3, index = [1,2,3,4])
df4 = pd.DataFrame(dataset4, index = [1,2,3])

In [159]:
df3

Unnamed: 0,A,B
1,A1,B1
2,A2,B2
3,A3,B3
4,A4,B4


In [160]:
df4

Unnamed: 0,X,Y
1,X1,Y1
2,X2,Y2
3,X3,Y3


In [161]:
df3.join(df4) #df4 değerleri df3 değerlerinden fazla old. için eksikler NaN olacak.

Unnamed: 0,A,B,X,Y
1,A1,B1,X1,Y1
2,A2,B2,X2,Y2
3,A3,B3,X3,Y3
4,A4,B4,,


In [162]:
df4.join(df3) #Df4 değerleri df3 değerlerinden az old. için eksik olmayacaktır(df3'e göre katılım yapılacak)

Unnamed: 0,X,Y,A,B
1,X1,Y1,A1,B1
2,X2,Y2,A2,B2
3,X3,Y3,A3,B3


__________________

In [187]:
# Örnek Veri
df5 = pd.DataFrame({
    'ID': [1, 2, 3],
    'Ad': ['Ali', 'Ayşe', 'Mehmet']
})

df6 = pd.DataFrame({
    'ID': [2, 3, 4],
    'Bölüm': ['Matematik', 'Fizik', 'Kimya']
})

# 1. INNER JOIN
inner_join = pd.merge(df5, df6, on='ID', how='inner')
print("INNER JOIN:\n", inner_join)

# 2. LEFT JOIN
left_join = pd.merge(df5, df6, on='ID', how='left')
print("\nLEFT JOIN:\n", left_join)

# 3. RIGHT JOIN
right_join = pd.merge(df5, df6, on='ID', how='right')
print("\nRIGHT JOIN:\n", right_join)

# 4. OUTER JOIN
outer_join = pd.merge(df5, df6, on='ID', how='outer')
print("\nOUTER JOIN:\n", outer_join)


INNER JOIN:
    ID      Ad      Bölüm
0   2    Ayşe  Matematik
1   3  Mehmet      Fizik

LEFT JOIN:
    ID      Ad      Bölüm
0   1     Ali        NaN
1   2    Ayşe  Matematik
2   3  Mehmet      Fizik

RIGHT JOIN:
    ID      Ad      Bölüm
0   2    Ayşe  Matematik
1   3  Mehmet      Fizik
2   4     NaN      Kimya

OUTER JOIN:
    ID      Ad      Bölüm
0   1     Ali        NaN
1   2    Ayşe  Matematik
2   3  Mehmet      Fizik
3   4     NaN      Kimya
