# Medidas de resumen

Las medidas de resumen son aquellas que se usan con el fin de condensar la información de un *DataFrame* a través de estadísticos. Dentro de los estadísticos más conocidos se encuentran: media $\bar{x}$, desviación estándar $s$, varianza $s^2$, mediana (segundo cuartil $Q_2$) y la moda. También existen otro tipo de medidas como el mínimo ($\min$), el máximo ($\max$), la suma y el conteo, entre otros.

In [1]:
#importamos las librerías necesarias
import pandas as pd

#Generamos el DataFrame de ejemplo
datos = pd.DataFrame({'Fecha': ['21/08/2023', '21/08/2023', '22/08/2023',
                                '10/09/2024', '10/09/2024'], 
                      'No. de Referencia': [1, 2, 3, 4, 5],
                     'Detalle o Cuenta': ['Inmueble', 'Cuentas por pagar', 'Caja', 
                                          'Cuentas por pagar', 'Inmueble'],
                     'Debe': [100000, 0, 0, 0, 20000],
                     'Haber': [0, 50000, 50000, 20000, 0]})

In [5]:
#Dentro de las medidas de resumen tenemos:
#suma: Cuanto se trata de datos cuantitativos es a nivel aritmético
#cuando se trata de datos cualitativos es concatenación
print(datos['Detalle o Cuenta'].sum()) #Datos cualitativos
print(datos['Haber'].sum()) #Datos cuantitativos

InmuebleCuentas por pagarCajaCuentas por pagarInmueble
120000


In [6]:
# si lo quiero hacer en más de una columna
datos[['Haber', 'Debe']].sum()

Haber    120000
Debe     120000
dtype: int64

In [8]:
#Por ejemplo podríamos utilizar la suma para comparar el Haber y el Debe
if datos['Haber'].sum() == datos['Debe'].sum():
    print('El Haber y el Debe son iguales')
else:
    print('El Haber y el Debe son diferentes')

El Haber y el Debe son iguales


In [9]:
#la moda es otro estadístico conocido como  medida de resumen
#por ejemplo, si queremos saber sobre qué cuenta se realizan más transacciones
#podemos calcular la moda

datos['Detalle o Cuenta'].mode()

0    Cuentas por pagar
1             Inmueble
Name: Detalle o Cuenta, dtype: object

In [11]:
#el promedio o media es un dato estadístico bastante utilizado.
#este sólo sirve para datos cuantitativos
datos[['Debe', 'Haber']].mean()

Debe     24000.0
Haber    24000.0
dtype: float64

In [12]:
#para la mediana, sería algo muy similar
datos[['Debe', 'Haber']].median()

Debe         0.0
Haber    20000.0
dtype: float64