# Fusionar DataFrames en Pandas con merge()

In [1]:
import pandas as pd


df1: pd.DataFrame = pd.DataFrame({
    'ID': [1, 2, 3],
    'Name': ['John', 'Mary', 'Bob']
})
print(df1)

   ID  Name
0   1  John
1   2  Mary
2   3   Bob


In [3]:
df2: pd.DataFrame = pd.DataFrame({
    'ID': [1, 2, 4],
    'Edad': [25, 30, 22]
})
print(df2)

   ID  Edad
0   1    25
1   2    30
2   4    22


In [4]:
# Combinar dos DataFrames
combined_df: pd.DataFrame = pd.merge(df1, df2, on='ID')
print(combined_df)

   ID  Name  Edad
0   1  John    25
1   2  Mary    30


**NOTA**: Un parámetro por defecto en `merge()` es `how='inner'`, el cual sólo une los registros que coincidan con el parámetro designado en `on`. En el ejemplo, los casos con `ID=3` y `ID=4` son descartados, por no existir un registro con `ID=4` en el primer dataframe ni un otro registro con `ID=3` en el segundo.

In [5]:
# Combinar dos DataFrames, incluyendo los registros faltantes
combined_df: pd.DataFrame = pd.merge(df1, df2, on='ID', how='outer')
print(combined_df)

   ID  Name  Edad
0   1  John  25.0
1   2  Mary  30.0
2   3   Bob   NaN
3   4   NaN  22.0


In [6]:
# Combinar dos DataFrames, incluyendo todos los registros de la izquierda (el primero)
# Similar al LEFT OUTER JOIN de SQL
combined_df: pd.DataFrame = pd.merge(df1, df2, on='ID', how='left')
print(combined_df)

   ID  Name  Edad
0   1  John  25.0
1   2  Mary  30.0
2   3   Bob   NaN


In [7]:
# Combinar dos DataFrames, incluyendo todos los registros de la derecha (el segundo)
# Similar al RIGHT OUTER JOIN de SQL
combined_df: pd.DataFrame = pd.merge(df1, df2, on='ID', how='right')
print(combined_df)

   ID  Name  Edad
0   1  John    25
1   2  Mary    30
2   4   NaN    22


In [8]:
# Combinar todos los datos, manteniendo los índices originales
indexed_df: pd.DataFrame = pd.merge(
    df1,
    df2,
    left_index=True,
    right_index=True
)
print(indexed_df)

   ID_x  Name  ID_y  Edad
0     1  John     1    25
1     2  Mary     2    30
2     3   Bob     4    22
