<a href="https://colab.research.google.com/github/EAFIT-BI/Programming-for-Business-2025-I/blob/main/Renombrar_y_unir_DataFrames.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Renombrar

Podemos renombrar tanto filas como columnas. Usualmente se hace para conservar la uniformidad con la información que se lleva al interior de la organización.

In [2]:
# Importamos las librerías necesarias
import pandas as pd

# Generamos los datos para ejemplificar
datos_ventas = pd.DataFrame({'Cliente': ['A', 'B'],
                            'Ventas totales': [350000, 220000],
                            'IVA': [2300, 1900]})
# Visualizamos la información
datos_ventas

Unnamed: 0,Cliente,Ventas totales,IVA
0,A,350000,2300
1,B,220000,1900


In [3]:
# En nuestra organización no es común utilizar el nombre
# ventas totales. En lugar de ello se usa Ingresos
# Vamos a realizar el cambio de nombre

datos_ventas.rename(columns = {'Ventas totales': 'Ingresos'}, inplace = True)

# Verificamos la información para corroborar  que se haya realizado el cambio
datos_ventas

Unnamed: 0,Cliente,Ingresos,IVA
0,A,350000,2300
1,B,220000,1900


In [4]:
# Si lo que requerimos es cambiar el nombre de las filas (índices),
# podemos proceder así

datos_ventas.rename(index = {0: 'Cliente 1', 1: 'Cliente 2'}, inplace = True)

# Verificamos la información para corroborar  que se haya realizado el cambio
datos_ventas

Unnamed: 0,Cliente,Ingresos,IVA
Cliente 1,A,350000,2300
Cliente 2,B,220000,1900


# Unir DataFrames

## Concatenar

Cuando hablamos de concatenar, hablamos de "juntar" trozo de información de forma vertical u horizontal. Si se hace una **concatenación vertical**, se debe tener el **mismo número de columnas**. Si se hace una **concatenación horizontal**, se debe tener el **mismo número de filas**.

## Unión (*join*)

Primero identificamos el elemento común dentro de los DataFrames que deseo unir, para posteriormente mezclarlos a través de ese elemento

In [5]:
# Concatenación vertical: supongamos que tenemos la información de ventas y gastos
# separada por cada mes y queremos consolidarla en una sola tabla

# Datos de enero
enero = pd.DataFrame({'Mes': ['Enero'], 'Ingresos': [1000], 'Gastos': [6000]})

# Datos de febrero
febrero = pd.DataFrame({'Mes': ['Febrero'], 'Ingresos': [2000], 'Gastos': [5000]})

# Datos de marzo
marzo = pd.DataFrame({'Mes': ['Marzo'], 'Ingresos': [3000], 'Gastos': [7000]})

In [6]:
# Ahora vamos a consolidar una sola tabla con la información del primer
# trimestre del año

trimestre = pd.concat([enero, febrero, marzo], axis = 0)

# Visualizamos la información consolidada
trimestre

Unnamed: 0,Mes,Ingresos,Gastos
0,Enero,1000,6000
0,Febrero,2000,5000
0,Marzo,3000,7000


In [10]:
# Con el fin de dar claridad, vamos a fijar como índice la columna mes
# Esto es casi como la operación de renombrar filas, pero con la información
# que ya está en la tabla
trimestre.set_index('Mes', inplace = True)

# Visualizamo los cambios
trimestre

Unnamed: 0_level_0,Ingresos,Gastos
Mes,Unnamed: 1_level_1,Unnamed: 2_level_1
Enero,1000,6000
Febrero,2000,5000
Marzo,3000,7000


In [11]:
# La concatenación horizontal se da cuando hay información adicional para las
# filas ya existentes, es decir, cuando queremos agregar nuevas columnas

# Por ejemplo, tenemos la siguiente información sobre el balance general
balance_general = pd.DataFrame({'Mes':['Abril', 'Mayo', 'Junio'],
                                'Activos': [5000, 3000, 400],
                                'Pasivos': [20, 30, 60]})

# Visualizamos la información
balance_general

Unnamed: 0,Mes,Activos,Pasivos
0,Abril,5000,20
1,Mayo,3000,30
2,Junio,400,60


In [12]:
# Ahora, queremos agregar la columna del patrimonio para los mismos meses
patrimonio = pd.DataFrame({'Patrimonio': [4980, 2960, 340]})

In [13]:
# Realizamos la concatenación
consolidado = pd.concat([balance_general, patrimonio], axis = 1)

# Visualizamos la información
consolidado

Unnamed: 0,Mes,Activos,Pasivos,Patrimonio
0,Abril,5000,20,4980
1,Mayo,3000,30,2960
2,Junio,400,60,340


In [14]:
# Para el caso de la unión, como se describió anteriormente, debemos
# contar con un elemento común. A modo de ejemplo supondremos que tenemos
# la información sobre los movimientos y el plan de cuentas de una empresa
movimientos =  pd.DataFrame({'CódigoCuenta': [1001, 2001, 3001],
                             'Débito': [5000, 0, 2000],
                             'Crédito': [0, 3000, 0]})

# Visualizamos los movimientos
movimientos

Unnamed: 0,CódigoCuenta,Débito,Crédito
0,1001,5000,0
1,2001,0,3000
2,3001,2000,0


In [15]:
# Tomares el CódigoCuenta como el nombre de las filas, es decir, el índice
movimientos.set_index('CódigoCuenta', inplace = True)
movimientos

# Visualizamos los cambios

Unnamed: 0_level_0,Débito,Crédito
CódigoCuenta,Unnamed: 1_level_1,Unnamed: 2_level_1
1001,5000,0
2001,0,3000
3001,2000,0


In [20]:
# Por otra parte tenemos el plan de cuentas así:
plan_cuentas = pd.DataFrame({'Descripción': ['Caja', 'Clientes', 'Ventas']},
                            index = [1001, 2001, 3001])

# Visualizamos el plan de cuentas
plan_cuentas

Unnamed: 0,Descripción
1001,Caja
2001,Clientes
3001,Ventas


In [21]:
# Ahora realizaremos la unión a través de los índices
movimientos.join(plan_cuentas)


Unnamed: 0_level_0,Débito,Crédito,Descripción
CódigoCuenta,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1001,5000,0,Caja
2001,0,3000,Clientes
3001,2000,0,Ventas


# Actividad

1. Simula dos DataFrame con la información que desees, por ejemplo, la información contable de distintas sucursales de una comercializadora pero con diferencias en los nombres de las columnas (Ventas, Ingresos, Costos, Gastos)

2. Renombra las columnas para unificarlas.

3. Usa `concat()` para combinarlas verticalmente.

4. Crea un nuevo DataFrame  y usa `join()` para añadir la descripción para cada fila.

5. No olvides comentar cada uno de los pasos.
