# Estadísica Descriptiva
### Actividad de transferencia

In [1]:
# librerías de analisis
import pandas as pd
import numpy as np

#### Conjunto de datos
Dado que no cuento con conjuntos de datos preconstruidos y buscar uno en plataformas como ***Kaggle*** o ***HuggingFace*** sería más perder el tiempo que apoyo. Así, que generé un conjunto de datos aleatorios en base a una semilla definida. Se generaron más de 80 observaciones.

In [22]:
# configuramos la semilla
np.random.seed(27)

# Generamos los datos
n = 120
probA = round(np.random.uniform(0,1), 2)
importe_compra = np.random.randint(100,10000, size=n)
lugar_compra = np.random.choice(['A', 'B'], size=n, p=[probA, 1 - probA])
print(f'Probabilidades para los diferntes lugares A: {probA} y B: {round(1 - probA, 2)}')


# creamos el dataset
compras = pd.DataFrame({
    'importe_compra': importe_compra,
    'lugar_compra': lugar_compra
})

# vemos la cabecera de los datos
print(compras.head(5))

# Exportamos en csv
compras.to_csv('datosActividadTransferencia.csv', sep=',', index=False)

Probabilidades para los diferntes lugares A: 0.43 y B: 0.57
   importe_compra lugar_compra
0            4012            B
1            4948            B
2            7292            A
3            4337            A
4            1126            A


In [8]:
# calculamos los indicadores del inciso 1.
importe = compras['importe_compra']
media = importe.mean()
mediana = importe.median()
desvEst = importe.std()
amplitud = importe.quantile(0.75) - importe.quantile(0.25)
asimetria = importe.skew()

In [13]:
print("=== Descripción de los Datos ===")
print(f"Media       : {media:.2f}")
print(f"Mediana     : {mediana:.2f}")
print(f"Desv. Est.  : {desvEst:.2f}")
print(f"Amplitud (IQR): {amplitud:.2f}")
print(f"Asimetría   : {asimetria:.2f}")

=== Descripción de los Datos ===
Media       : 5451.68
Mediana     : 5615.00
Desv. Est.  : 2862.06
Amplitud (IQR): 4954.00
Asimetría   : -0.11


##### Forma alternativa de ver una descripcion de la data.

In [10]:
compras.describe()

Unnamed: 0,importe_compra
count,120.0
mean,5451.683333
std,2862.064675
min,289.0
25%,3014.0
50%,5615.0
75%,7968.0
max,9969.0


### Segmentación de la variable categórica

In [11]:
# para hacerlo mas facil, segmentamos desde antes
comprasA = compras[compras['lugar_compra'] == 'A']
comprasB = compras[compras['lugar_compra'] == 'B']

In [14]:
# medias
mediaA = comprasA['importe_compra'].mean()
mediaB = comprasB['importe_compra'].mean()

# desviación
desviacionA = comprasA['importe_compra'].std()
desviacionB = comprasB['importe_compra'].std()

# Asimetría
asimetriaA = comprasA['importe_compra'].skew()
asimetriaB = comprasB['importe_compra'].skew()

In [20]:
print("=========== Descripción por Lugar ===========")
print(f"{'':<15}{'Compras A':<15}{'Compras B':<15}")
print("-" * 45)
print(f"{'Media':<15}{mediaA:.2f}{'':<5}{mediaB:.2f}")
print(f"{'Desv. Est.':<15}{desviacionA:.2f}{'':<5}{desviacionB:.2f}")
print(f"{'Asimetría':<15}{asimetriaA:.2f}{'':<5}{asimetriaB:.2f}")

               Compras A      Compras B      
---------------------------------------------
Media          5368.33     5509.21
Desv. Est.     2709.58     2980.40
Asimetría      -0.14     -0.11
