<a href="https://colab.research.google.com/github/albertopardini/AIA/blob/main/LoBasicoDeMerge.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

##**Comparación entre** ***concat*** y ***merge***.


| Característica     | `concat`                                 | `merge`                                       |
|--------------------|------------------------------------------|-----------------------------------------------|
| **Propósito**       | Combina DataFrames apilándolos o agregándolos horizontalmente o verticalmente. | Realiza una unión similar a una operación SQL (INNER, LEFT, RIGHT, FULL) utilizando columnas clave. |
| **Tipo de combinación** | Concatenación directa de DataFrames (apila uno sobre otro o los une lado a lado). | Unión basada en una o más columnas o índices clave (similar a un `JOIN` en SQL). |
| **Relación entre DataFrames** | No requiere que los DataFrames compartan columnas o índices. | Requiere que los DataFrames compartan al menos una columna o índice para hacer la combinación. |
| **Especificación de claves** | No usa claves, solo combina los DataFrames. | Usa columnas o índices clave para hacer la combinación. |
| **Tipos de uniones** | No maneja diferentes tipos de uniones (INNER, LEFT, etc.). | Permite realizar diferentes tipos de uniones: `inner`, `outer`, `left`, `right`. |
| **Uso típico** | Cuando se desea unir DataFrames que tienen las mismas columnas o combinar ejes sin alinearlos. | Cuando se desea combinar DataFrames en función de una clave común (similar a la operación `JOIN` de SQL). |


##**Lo básico de** ***merge***
`pd.merge(left=df1, right=df2, left_on='columna_df1', right_on='columna_df2', how='tipo_de_union')`


```'inner'``` : sólo las filas con claves comunes en ambos DataFrames (unión interna).  
```'left'``` : todas las filas del **df1** y las coincidencias del **df2** (unión externa izquierda).(unión interna).  
```'right'``` : todas las filas del **df2** y las coincidencias del **df1** (unión externa derecha).  
```'outer'``` : todas las filas de ambos DataFrames, llenando con **NaN** donde no haya coincidencias (unión externa completa).


In [None]:
import pandas as pd

In [None]:
df1 = pd.DataFrame({'A': [5, 2,4],
                    'B': [3, 4,5]
})
df1

Unnamed: 0,A,B
0,5,3
1,2,4
2,4,5


In [None]:
df2 = pd.DataFrame({'A': [5, 6],
                    'D': [7, 8],
                    'E': [9, 10]
})
df2

Unnamed: 0,A,D,E
0,5,7,9
1,6,8,10


In [None]:
# Realiza la unión entre los dataframes usando la columna 'A' para vincularlos.
filas = pd.merge(df1, df2,on='A',how='outer')
filas

Unnamed: 0,A,B,D,E
0,2,4.0,,
1,4,5.0,,
2,5,3.0,7.0,9.0
3,6,,8.0,10.0


In [None]:
# Es la intersacción entre dataframes evaluando la coincidencia de la
# columna 'A'
filas = pd.merge(df1, df2,on='A',how='inner')
filas

Unnamed: 0,A,B,D,E
0,5,3,7,9


In [None]:
filas = pd.merge(df1, df2,on='A',how='left')
filas

Unnamed: 0,A,B,D,E
0,5,3,7.0,9.0
1,2,4,,
2,4,5,,


In [None]:
filas = pd.merge(df1, df2,on='A',how='right')
filas

Unnamed: 0,A,B,D,E
0,5,3.0,7,9
1,6,,8,10


In [None]:
df1 = pd.DataFrame({'A': [5, 2,4],
                    'B': [3, 4,5]
})
df1

Unnamed: 0,A,B
0,5,3
1,2,4
2,4,5


In [None]:
df2 = pd.DataFrame({'Z': [5, 6],
                    'D': [7, 8],
                    'E': [9, 10]
})
df2

Unnamed: 0,Z,D,E
0,5,7,9
1,6,8,10


In [None]:
# si la columna que se utilizará para vincular ambos dataframes tienen distinto
# nombre se utiliza
filas = pd.merge(df1, df2,left_on='A',right_on='Z',how='inner')
filas

Unnamed: 0,A,B,Z,D,E
0,5,3,5,7,9


In [None]:
# Con how='cross' realiza el producto cartesiano.
# No es necesaria ninguna columna en cómun entre dataframes.

filas = pd.merge(df1, df2,how='cross')
filas

Unnamed: 0,A,B,Z,D,E
0,5,3,5,7,9
1,5,3,6,8,10
2,2,4,5,7,9
3,2,4,6,8,10
4,4,5,5,7,9
5,4,5,6,8,10
