<a href="https://colab.research.google.com/github/fermuba/Procesamiento-de-Datos/blob/main/S6/Ejemplos_clase/Ejemplo_5_concat_dataframes.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Ejemplo 5: Concat con DataFrames

### 1. Objetivos:
    - Usar pd.concat para concatenar `DataFrames`

---
    
### 2. Desarrollo:

Exactamente los mismos principios aplican a la concatenación de `DataFrames`:

In [1]:
# Cargamos las librerias
import pandas as pd

In [2]:
# Creacion de diccionario para ejemplos
data_1 = {
    'column_1': [1, 2, 3],
    'column_2': [4, 5, 6]
}

# Creamos nuestro df para los ejemplos
df_1 = pd.DataFrame(data_1, index=['a', 'b', 'c'])

df_1

Unnamed: 0,column_1,column_2
a,1,4
b,2,5
c,3,6


In [3]:
# Creacion de diccionario para ejemplos
data_2 = {
    'column_1': [7, 8, 9],
    'column_2': [10, 11, 12]
}

# Creamos nuestro df para los ejemplos
df_2 = pd.DataFrame(data_1, index=['d', 'e', 'f'])

df_2

Unnamed: 0,column_1,column_2
d,1,4
e,2,5
f,3,6


Podemos unirlos verticalmente:

In [4]:
pd.concat([df_1, df_2], axis=0)

Unnamed: 0,column_1,column_2
a,1,4
b,2,5
c,3,6
d,1,4
e,2,5
f,3,6


Horizontalmente:

In [5]:
pd.concat([df_1, df_2], axis=1)

Unnamed: 0,column_1,column_2,column_1.1,column_2.1
a,1.0,4.0,,
b,2.0,5.0,,
c,3.0,6.0,,
d,,,1.0,4.0
e,,,2.0,5.0
f,,,3.0,6.0


Si tienen el mismo índice, evitamos los `NaNs`:

In [6]:
# Creamos un tercer DataFrame con el mismo indice que el primero
data_3 = {
    'column_3': [7, 8, 9],
    'column_4': [10, 11, 12]
}

df_3 = pd.DataFrame(data_3, index=['a', 'b', 'c'])

df_3

Unnamed: 0,column_3,column_4
a,7,10
b,8,11
c,9,12


In [14]:
# Concatenacion de df que tienen iguales indices
pd.concat([df_1, df_3], axis=1)

Unnamed: 0,column_1,column_2,column_3,column_4
a,1,4,7,10
b,2,5,8,11
c,3,6,9,12


Si concatenamos verticalmente con el mismo índice, no podemos diferenciarlos:

In [15]:
# Creamos un cuarto df con el mismo indice que el primero y tercero
data_4 = {
    'column_1': [7, 8, 9],
    'column_2': [10, 11, 12]
}

df_4 = pd.DataFrame(data_4, index=['a', 'b', 'c'])

df_4

Unnamed: 0,column_1,column_2
a,7,10
b,8,11
c,9,12


In [16]:
# Concatenacion por filas con el mismo indice(los indices se repiten)
pd.concat([df_1, df_4], axis=0)

Unnamed: 0,column_1,column_2
a,1,4
b,2,5
c,3,6
a,7,10
b,8,11
c,9,12


Podemos agregar `multiíndices`:

In [17]:
# Podemos diferenciar a que df pertenecen los indices ya que son los mismos
# Generamos un nivel adicional de indices para las filas
df_concat = pd.concat([df_1, df_4], axis=0, keys=['df_1', 'df_4'])

df_concat

Unnamed: 0,Unnamed: 1,column_1,column_2
df_1,a,1,4
df_1,b,2,5
df_1,c,3,6
df_4,a,7,10
df_4,b,8,11
df_4,c,9,12


Y podemos accesarlos de igual manera:

In [18]:
# Acceso a información del df de multiíndice
df_concat.loc['df_1']

Unnamed: 0,column_1,column_2
a,1,4
b,2,5
c,3,6


In [19]:
# Acceso a fila dentro del df multiíndice
df_concat.loc[('df_1', 'b')]

column_1    2
column_2    5
Name: (df_1, b), dtype: int64

También podemos unir más de dos `DataFrames` agregándolos todos a la lista:

In [20]:
# Concatenación de varios df, se puede pasar una lista con el contenido
# de todos los df a unir
pd.concat([df_1, df_2, df_3, df_4], axis=1)

Unnamed: 0,column_1,column_2,column_1.1,column_2.1,column_3,column_4,column_1.2,column_2.2
a,1.0,4.0,,,7.0,10.0,7.0,10.0
b,2.0,5.0,,,8.0,11.0,8.0,11.0
c,3.0,6.0,,,9.0,12.0,9.0,12.0
d,,,1.0,4.0,,,,
e,,,2.0,5.0,,,,
f,,,3.0,6.0,,,,
