 # **<font color="DarkBlue">Unir, combinar y remodelar 🐼 </font>**

<p align="center">
<img src="https://pandas.pydata.org/static/img/pandas_mark.svg" width="50">
</p>


https://pandas.pydata.org/

 # **<font color="DarkBlue">Remodelando datos, melt y pivot</font>**

<p align="justify">
La función <code>melt()</code> de Pandas, es útil para transformar un DataFrame de un formato ancho a uno largo. Este proceso puede ser especialmente útil en análisis de datos para facilitar ciertas visualizaciones o análisis.
</p>


 ## **<font color="DarkBlue">De DataFrame ancho a largo, melt</font>**

👀 Ejemplo:

<p align="justify">
🚀 Supongamos que tienes un DataFrame que contiene datos de ventas trimestrales de diferentes productos, y quieres transformarlo a un formato más largo para facilitar el análisis.
<br><br>
Es decir, de ancho a largo...


In [None]:
import pandas as pd
import numpy as np

In [None]:
# Crear un DataFrame simulado con datos de ventas trimestrales

data = {
    'Producto': ['A', 'B', 'C'],
    'Q1': [1500, 2000, 1800],
    'Q2': [1600, 2100, 1900],
    'Q3': [1700, 2200, 2000],
    'Q4': [1800, 2300, 2100]
}


In [None]:
df = pd.DataFrame(data)
df

Unnamed: 0,Producto,Q1,Q2,Q3,Q4
0,A,1500,1600,1700,1800
1,B,2000,2100,2200,2300
2,C,1800,1900,2000,2100


In [None]:
# Usar melt() para remodelar el DataFrame

df_melted = df.melt(id_vars='Producto',
                    value_vars=['Q1', 'Q2', 'Q3', 'Q4'],
                    var_name='Trimestre',
                    value_name='Ventas')


<p align="justify">
La función <code>melt()</code> se utiliza para transformar el DataFrame.
<br><br>
<code>id_vars='Producto'</code>: Especifica que la columna Producto se mantendrá como una variable identificadora.
<br><br>
<code>value_vars=['Q1', 'Q2', 'Q3', 'Q4']</code>: Especifica las columnas que se transformarán en un formato largo.
<br><br>
<code>var_name='Trimestre'</code>: Define el nombre de la nueva columna que contendrá los nombres de los trimestres.
<br><br>
<code>value_name='Ventas'</code>: Define el nombre de la nueva columna que contendrá los valores de ventas.

In [None]:
df_melted

Unnamed: 0,Producto,Trimestre,Ventas
0,A,Q1,1500
1,B,Q1,2000
2,C,Q1,1800
3,A,Q2,1600
4,B,Q2,2100
5,C,Q2,1900
6,A,Q3,1700
7,B,Q3,2200
8,C,Q3,2000
9,A,Q4,1800


<p align="justify">
Este tipo de transformación es común en análisis de datos cuando se necesita realizar operaciones en un formato que facilite el manejo y análisis

👀 Otro ejemplo:

<p align="justify">
🚀 Supongamos que estamos analizando las ventas de tres productos en diferentes regiones durante cuatro trimestres.
<br><br>
Es decir, un dataframe a lo largo...


In [None]:
# Datos

data = {
    'Región': ['Norte', 'Sur', 'Este', 'Oeste'],
    'Producto_A_Q1': [1000, 1100, 900, 1200],
    'Producto_A_Q2': [1050, 1150, 950, 1250],
    'Producto_A_Q3': [1100, 1200, 1000, 1300],
    'Producto_A_Q4': [1150, 1250, 1050, 1350],
    'Producto_B_Q1': [800, 850, 780, 900],
    'Producto_B_Q2': [820, 870, 800, 910],
    'Producto_B_Q3': [840, 890, 820, 920],
    'Producto_B_Q4': [860, 910, 840, 940],
    'Producto_C_Q1': [500, 600, 550, 700],
    'Producto_C_Q2': [520, 620, 570, 720],
    'Producto_C_Q3': [540, 640, 590, 740],
    'Producto_C_Q4': [560, 660, 610, 760]
}


In [None]:
df = pd.DataFrame(data)
df

Unnamed: 0,Región,Producto_A_Q1,Producto_A_Q2,Producto_A_Q3,Producto_A_Q4,Producto_B_Q1,Producto_B_Q2,Producto_B_Q3,Producto_B_Q4,Producto_C_Q1,Producto_C_Q2,Producto_C_Q3,Producto_C_Q4
0,Norte,1000,1050,1100,1150,800,820,840,860,500,520,540,560
1,Sur,1100,1150,1200,1250,850,870,890,910,600,620,640,660
2,Este,900,950,1000,1050,780,800,820,840,550,570,590,610
3,Oeste,1200,1250,1300,1350,900,910,920,940,700,720,740,760


In [None]:
# Usar melt() para transformar el DataFrame a formato largo

df_melted = df.melt(id_vars='Región',
                    value_vars=['Producto_A_Q1', 'Producto_A_Q2', 'Producto_A_Q3', 'Producto_A_Q4',
                                'Producto_B_Q1', 'Producto_B_Q2', 'Producto_B_Q3', 'Producto_B_Q4',
                                'Producto_C_Q1', 'Producto_C_Q2', 'Producto_C_Q3', 'Producto_C_Q4'],
                    var_name='Producto_Trimestre',
                    value_name='Ventas')

In [None]:
df_melted

Unnamed: 0,Región,Producto_Trimestre,Ventas
0,Norte,Producto_A_Q1,1000
1,Sur,Producto_A_Q1,1100
2,Este,Producto_A_Q1,900
3,Oeste,Producto_A_Q1,1200
4,Norte,Producto_A_Q2,1050
5,Sur,Producto_A_Q2,1150
6,Este,Producto_A_Q2,950
7,Oeste,Producto_A_Q2,1250
8,Norte,Producto_A_Q3,1100
9,Sur,Producto_A_Q3,1200


 ## **<font color="DarkBlue">De DataFrame largo a ancho, pivot</font>**

👀 Ejemplo:

<p align="justify">
🚀 Supongamos que tienes un DataFrame que contiene datos de ventas trimestrales de diferentes productos, y quieres transformarlo a un formato más largo para facilitar el análisis.
<br><br>
Es decir, un dataframe a lo largo...


In [None]:
# Crear un DataFrame en formato largo

data_largo = {
    'Región': ['Norte', 'Norte', 'Norte', 'Norte', 'Sur', 'Sur', 'Sur', 'Sur', 'Este', 'Este', 'Este', 'Este', 'Oeste', 'Oeste', 'Oeste', 'Oeste'],
    'Producto_Trimestre': ['Producto_A_Q1', 'Producto_A_Q2', 'Producto_A_Q3', 'Producto_A_Q4',
                           'Producto_A_Q1', 'Producto_A_Q2', 'Producto_A_Q3', 'Producto_A_Q4',
                           'Producto_A_Q1', 'Producto_A_Q2', 'Producto_A_Q3', 'Producto_A_Q4',
                           'Producto_A_Q1', 'Producto_A_Q2', 'Producto_A_Q3', 'Producto_A_Q4'],
    'Ventas': [1000, 1050, 1100, 1150,
               1100, 1150, 1200, 1250,
               900, 950, 1000, 1050,
               1200, 1250, 1300, 1350]
}


In [None]:
df = pd.DataFrame(data_largo)
df

Unnamed: 0,Región,Producto_Trimestre,Ventas
0,Norte,Producto_A_Q1,1000
1,Norte,Producto_A_Q2,1050
2,Norte,Producto_A_Q3,1100
3,Norte,Producto_A_Q4,1150
4,Sur,Producto_A_Q1,1100
5,Sur,Producto_A_Q2,1150
6,Sur,Producto_A_Q3,1200
7,Sur,Producto_A_Q4,1250
8,Este,Producto_A_Q1,900
9,Este,Producto_A_Q2,950


In [None]:
# Usar pivot() para transformar el DataFrame a formato ancho

df_ancho = df.pivot(index='Región',
                           columns='Producto_Trimestre',
                           values='Ventas')


In [None]:
df_ancho

Producto_Trimestre,Producto_A_Q1,Producto_A_Q2,Producto_A_Q3,Producto_A_Q4
Región,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Este,900,950,1000,1050
Norte,1000,1050,1100,1150
Oeste,1200,1250,1300,1350
Sur,1100,1150,1200,1250


<br>
<br>
<p align="center"><b>
💗
<font color="DarkBlue">
Hemos llegado al final de nuestro colab de Pandas, a seguir codeando...
</font>
</p>