# TABLAS PIVOTE EN PYTHON

Las tablas pivote (o pivot tables en inglés) son una herramienta útil en el análisis de datos en Python (y en otras herramientas de análisis de datos) para resumir y reorganizar datos de manera eficiente. Sirven para transformar datos en una tabla más compacta y fácil de entender, lo que facilita el análisis y la extracción de información. Aquí tienes algunas de las aplicaciones y utilidades más comunes de las tablas pivote en el análisis de datos en Python:

Resumen de Datos: Las tablas pivote permiten resumir grandes conjuntos de datos al calcular estadísticas descriptivas, como sumas, promedios, medianas, máximos y mínimos para diferentes combinaciones de variables. Esto facilita la comprensión de los datos y la identificación de patrones.

Agregación de Datos: Puedes utilizar tablas pivote para agregar datos, por ejemplo, sumar ventas por categoría de producto, calcular ingresos por región o contar el número de clientes por mes.

Análisis de Tendencias: Las tablas pivote son útiles para analizar tendencias a lo largo del tiempo o en diferentes grupos. Por ejemplo, puedes crear una tabla pivote que muestre las ventas mensuales durante varios años para identificar patrones estacionales.

Segmentación de Datos: Puedes utilizar tablas pivote para segmentar datos en diferentes dimensiones, lo que te permite analizar cómo se comportan los datos en diferentes grupos o categorías.

Generación de Informes: Las tablas pivote son especialmente útiles para generar informes y presentar datos de manera más efectiva a través de resúmenes visuales y tabulares.

Extracción de Información Específica: Puedes utilizar tablas pivote para extraer información específica de grandes conjuntos de datos. Por ejemplo, puedes crear una tabla pivote para mostrar el número de productos vendidos en cada categoría en un período determinado.

Análisis Comparativo: Las tablas pivote facilitan la comparación de datos en diferentes dimensiones, lo que permite identificar diferencias y similitudes en los datos.

En Python, puedes crear tablas pivote utilizando la biblioteca Pandas mediante la función pivot_table(). Esta función te permite especificar las variables a utilizar como índices (filas), columnas y valores, así como las funciones de agregación que deseas aplicar. Las tablas pivote son una herramienta versátil y poderosa en el análisis de datos que te permite resumir, analizar y comunicar información de manera efectiva.







In [1]:
#Con estas tablas obtendremos una vista resumida de nuestros datos, encontraremos patrones, etc.

In [2]:
# importamos librerias
import pandas as pd

In [3]:
hidroponia = pd.read_csv('Hidroponia_costos.csv')

In [4]:
hidroponia

Unnamed: 0,Cultivo,pH,EC,Hortaliza,Sistema,Duracion_Ciclo,Costo,Ganancia
0,Brocoli,6 to 6.8,2.8 to 3.5,Flor,NFT,70-90,10,29
1,Calabacita,6,1.8 to 2.4,Fruto,Goteo,45,12,33
2,Pepino,5 to 5.5,1.7 to 2,Fruto,Goteo,70-80,8,27
3,Pimientos,5.5 to 6,0.8 to 1.8,Fruto,Goteo,65,30,75
4,fresa,6,1.8 to 2.2,Fruto,NFT,120-150,55,100
5,Tomate,6 to 6.5,2 to 4,Fruto,Goteo,110-120,20,32
6,Albahaca,5.5 to 6,1 to 1.6,Hoja,NFT,90,80,150
7,Repollo,6.5 to 7,2.5 to 3,Hoja,NFT,80-100,7,19
8,Apio,6.5,1.8 to 2.4,Hoja,NFT,90-120,15,26
9,Lechuga,6 to 7,1.2 to 1.8,Hoja,NFT,80-90,10,21


In [6]:
hidroponia.shape

(15, 8)

## Tablas PIVOTE con Pandas

In [None]:
# A diferencia de las tablas CRUZADAS, 
# para crear una tabla PIVOTE, necesitamos que las variables a sumarizar sean NUMÉRICAS,
# ya que haremos calculos sobre sus valores.

In [10]:
import numpy as np

In [11]:
# para crear la tabla PIVOTE, utilizamos la función "pivot_table" aplicada al objeto hidroponia
# Dentro de los parentesis, "index = 'Sistema' (la/las variables en las filas)
# Con el parámetro "values", la/las variables con las que haremos los calculos.
# Con "aggfunc", le indicamos la operacion que queremos que realize. (con numpy)

In [12]:
hidroponia.pivot_table(index = 'Sistema', values = ['Costo', 'Ganancia'], aggfunc = np.sum)

Unnamed: 0_level_0,Costo,Ganancia
Sistema,Unnamed: 1_level_1,Unnamed: 2_level_1
Aeroponia,24,46
Goteo,70,167
NFT,325,650


In [14]:
# con "margins = True", obtenemos al final de la tabla el costo y ganancia TOTAL
hidroponia.pivot_table(index = 'Sistema', values = ['Costo', 'Ganancia'], aggfunc = np.sum, margins = True)

Unnamed: 0_level_0,Costo,Ganancia
Sistema,Unnamed: 1_level_1,Unnamed: 2_level_1
Aeroponia,24,46
Goteo,70,167
NFT,325,650
All,419,863


In [15]:
# Obtenemos el promedio (con la funcion "np.mean"):
hidroponia.pivot_table(index = 'Sistema', values = ['Costo', 'Ganancia'], aggfunc = np.mean)

Unnamed: 0_level_0,Costo,Ganancia
Sistema,Unnamed: 1_level_1,Unnamed: 2_level_1
Aeroponia,12.0,23.0
Goteo,17.5,41.75
NFT,36.111111,72.222222


In [17]:
# REDONDEAMOS los valores de los promedios
np.round(hidroponia.pivot_table(index = 'Sistema', values = ['Costo', 'Ganancia'], aggfunc = np.mean),2)

Unnamed: 0_level_0,Costo,Ganancia
Sistema,Unnamed: 1_level_1,Unnamed: 2_level_1
Aeroponia,12.0,23.0
Goteo,17.5,41.75
NFT,36.11,72.22


In [18]:
# Ahora queremos que nos despliegue la SUMA de los COSTOS por cada tipo de hortaliza 
# cultivada con cada uno de los sistemas:

In [19]:
hidroponia.pivot_table(index =['Sistema', 'Hortaliza'], values = ['Costo'], aggfunc = np.sum)

Unnamed: 0_level_0,Unnamed: 1_level_0,Costo
Sistema,Hortaliza,Unnamed: 2_level_1
Aeroponia,Raiz,24
Goteo,Fruto,70
NFT,Flor,10
NFT,Fruto,55
NFT,Hoja,230
NFT,Tallo,30


In [20]:
# Le pedimos que nos despliegue los costos por cada valor de pH

In [21]:
hidroponia.pivot_table(index=['Sistema', 'Hortaliza'], values=['Costo'], columns=['pH'], aggfunc=np.sum)

Unnamed: 0_level_0,Unnamed: 1_level_0,Costo,Costo,Costo,Costo,Costo,Costo,Costo,Costo,Costo,Costo
Unnamed: 0_level_1,pH,5 to 5.5,5.5 to 6,5.8 to 6.3,6,6 to 6.5,6 to 6.8,6 to 7,6.0 to 7.0,6.5,6.5 to 7
Sistema,Hortaliza,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2
Aeroponia,Raiz,,,6.0,,,,18.0,,,
Goteo,Fruto,8.0,30.0,,12.0,20.0,,,,,
NFT,Flor,,,,,,10.0,,,,
NFT,Fruto,,,,55.0,,,,,,
NFT,Hoja,,80.0,,,45.0,,83.0,,15.0,7.0
NFT,Tallo,,,,,,,,30.0,,


In [22]:
# Reemplazamos los NaN con ceros

In [24]:
hidroponia.pivot_table(index = ['Sistema', 'Hortaliza'], values = ['Costo'], columns = ['pH'],
                      aggfunc = np.sum, fill_value = 0)

Unnamed: 0_level_0,Unnamed: 1_level_0,Costo,Costo,Costo,Costo,Costo,Costo,Costo,Costo,Costo,Costo
Unnamed: 0_level_1,pH,5 to 5.5,5.5 to 6,5.8 to 6.3,6,6 to 6.5,6 to 6.8,6 to 7,6.0 to 7.0,6.5,6.5 to 7
Sistema,Hortaliza,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2
Aeroponia,Raiz,0,0,6,0,0,0,18,0,0,0
Goteo,Fruto,8,30,0,12,20,0,0,0,0,0
NFT,Flor,0,0,0,0,0,10,0,0,0,0
NFT,Fruto,0,0,0,55,0,0,0,0,0,0
NFT,Hoja,0,80,0,0,45,0,83,0,15,7
NFT,Tallo,0,0,0,0,0,0,0,30,0,0
