In [1]:
import numpy as np
import pandas as pd

In [2]:
df_left = pd.DataFrame(
    {'X':['x0','x1','x2','x3'],
    'W':['w0','w1','w2','w3'],
    'Y':['y0','y1','y2','y3'],
    'Mix':['y2','y3','a2','a3']},
    index=['y2','y3','a2','a3']
)
df_left

Unnamed: 0,X,W,Y,Mix
y2,x0,w0,y0,y2
y3,x1,w1,y1,y3
a2,x2,w2,y2,a2
a3,x3,w3,y3,a3


In [3]:
df_right = pd.DataFrame(
    {'Z':['z2','z3','z4','z5'],
        'A':['a2','a3','a4','a5'],
        'Y':['y2','y3','y4','y5']},
    index=[2, 3, 4, 5]
)
df_right

Unnamed: 0,Z,A,Y
2,z2,a2,y2
3,z3,a3,y3
4,z4,a4,y4
5,z5,a5,y5


In [4]:
# fusionarlos mediante la columna y valores de esa columna que tienen en común (Y)
# pd.merge(df_left, df_right, how="inner", on="Y")
pd.merge(df_left, df_right)

Unnamed: 0,X,W,Y,Mix,Z,A
0,x2,w2,y2,a2,z2,a2
1,x3,w3,y3,a3,z3,a3


In [5]:
# fusionar expecíficando la columna por la cual sucederá en cada lado, con los valores que tengan en común
pd.merge(df_left, df_right, how="inner", left_on="Mix", right_on="Y")

Unnamed: 0,X,W,Y_x,Mix,Z,A,Y_y
0,x0,w0,y0,y2,z2,a2,y2
1,x1,w1,y1,y3,z3,a3,y3


**TIPOS DE MERGE**

![](http://www.datasciencemadesimple.com/wp-content/uploads/2017/09/join-or-merge-in-python-pandas-1.png)

In [8]:
df_left = pd.DataFrame(
    {'X':['x0','x1','x2','x3'],
    'W':['w0','w1','w2','w3'],
    'Y':['y0','y1','y2','y3']},
    index=['y2','y3','a2','a3']
)
df_left

Unnamed: 0,X,W,Y
y2,x0,w0,y0
y3,x1,w1,y1
a2,x2,w2,y2
a3,x3,w3,y3


In [9]:
df_right = pd.DataFrame(
    {'Z':['z2','z3','z4','z5'],
    'A':['a2','a3','a4','a5'],
    'Y':['y2','y3','y4','y5']},
    index=[2, 3, 4, 5]
)
df_right

Unnamed: 0,Z,A,Y
2,z2,a2,y2
3,z3,a3,y3
4,z4,a4,y4
5,z5,a5,y5


In [10]:
# merge inner, solo a través de columnas que tienen en común
pd.merge(df_left, df_right, how="inner", on="Y")

Unnamed: 0,X,W,Y,Z,A
0,x2,w2,y2,z2,a2
1,x3,w3,y3,z3,a3


In [11]:
# mantener el df_left y agregar los adicionales en común del df_right
pd.merge(df_left, df_right, how="left", on="Y")

Unnamed: 0,X,W,Y,Z,A
0,x0,w0,y0,,
1,x1,w1,y1,,
2,x2,w2,y2,z2,a2
3,x3,w3,y3,z3,a3


In [12]:
# hacer unión
pd.merge(df_left, df_right, how="outer", on="Y")

Unnamed: 0,X,W,Y,Z,A
0,x0,w0,y0,,
1,x1,w1,y1,,
2,x2,w2,y2,z2,a2
3,x3,w3,y3,z3,a3
4,,,y4,z4,a4
5,,,y5,z5,a5


**Unión con más de una columna en común**

In [13]:
# agregar A a left
df_left = pd.DataFrame(
    {'X':['x0','x1','x2','x3'],
    'W':['w0','w1','w2','w3'],
    'Y':['y0','y1','y2','y3'],
    'A':['a0','a1','a2','a3']},
    index=['y2','y3','a2','a3']
)
df_left

Unnamed: 0,X,W,Y,A
y2,x0,w0,y0,a0
y3,x1,w1,y1,a1
a2,x2,w2,y2,a2
a3,x3,w3,y3,a3


In [14]:
# merge a partir de las columnas en común, si no es indican en on se infieren por default
pd.merge(df_left, df_right, how="outer", on=["Y", "A"])

Unnamed: 0,X,W,Y,A,Z
0,x0,w0,y0,a0,
1,x1,w1,y1,a1,
2,x2,w2,y2,a2,z2
3,x3,w3,y3,a3,z3
4,,,y4,a4,z4
5,,,y5,a5,z5


In [15]:
# merge a partir de solo las columnas en común indicadas, 
# se específica además el sufijo de las compartidas que no serán fusionadas
pd.merge(df_left, df_right, how="outer", on="A", suffixes=["_left", "_right"])

Unnamed: 0,X,W,Y_left,A,Z,Y_right
0,x0,w0,y0,a0,,
1,x1,w1,y1,a1,,
2,x2,w2,y2,a2,z2,y2
3,x3,w3,y3,a3,z3,y3
4,,,,a4,z4,y4
5,,,,a5,z5,y5
