In [23]:
import numpy as np
import pandas as pd
from scipy import stats

# Configuración para reproducibilidad
np.random.seed(42)

# Número total de clientes (puedes ajustarlo)
total_clientes = 1000

# Generar IDs de clientes
clientes_ids = ['Cliente_' + str(i) for i in range(1, total_clientes + 1)]

# Generar datos aleatorios de clientes
num_repeticiones = 10  # Cuántas veces se repite cada cliente en promedio
clientes_repetidos = np.random.choice(clientes_ids, total_clientes * num_repeticiones)

# Generar montos aleatorios
montos = np.random.uniform(100, 10000, total_clientes * num_repeticiones).round(2)

# Crear un DataFrame con los datos
datos_historicos = pd.DataFrame({'Cliente': clientes_repetidos, 'Monto': montos})

1. Fórmulas de cálculo:
* Media Geométrica: La media geométrica se calcula tomando la raíz n-ésima del producto de n valores. La fórmula general para n valores es:
$$​MG = \sqrt[n]{x_{1} \cdot x_{2}\cdot \ldots \cdot x_{n}}$$
* Media Armónica: La media armónica se calcula tomando el inverso de la media aritmética de los inversos de n valores. La fórmula general para n valores es:
$$MA = \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + \ldots + \frac{1}{x_n}}$$

2. Sensibilidad a los valores extremos:
* Media Geométrica: La media geométrica tiende a verse menos afectada por valores extremos o atípicos en los datos, ya que se basa en multiplicaciones.
* Media Armónica: La media armónica es más sensible a los valores extremos.

3. Interpretación y uso:
* Media Geométrica: Se utiliza comúnmente en contextos donde los datos están relacionados con tasas de crecimiento, rendimientos financieros, o en situaciones donde la magnitud relativa de los valores es importante.
* Media Armónica: Se utiliza en situaciones relacionadas con la velocidad, como la velocidad promedio, donde es importante considerar la inversa de los valores.

In [25]:
datos_historicos.groupby('Cliente').agg({'Monto': ['sum', 'mean', stats.gmean, stats.hmean]})

Unnamed: 0_level_0,Monto,Monto,Monto,Monto
Unnamed: 0_level_1,sum,mean,gmean,hmean
Cliente,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2
Cliente_1,72612.82,4538.301250,3514.128488,2409.549273
Cliente_10,60887.84,4683.680000,3193.870541,1777.417950
Cliente_100,36597.63,5228.232857,4167.795383,2858.924698
Cliente_1000,20662.56,5165.640000,3104.167392,1859.504275
Cliente_101,47064.18,4278.561818,2895.587221,1812.063582
...,...,...,...,...
Cliente_995,47006.57,6715.224286,5286.805043,2663.638637
Cliente_996,29645.77,4235.110000,3664.768943,2846.754033
Cliente_997,49708.54,4970.854000,3823.077902,2745.366510
Cliente_998,31317.05,4473.864286,2379.528541,959.268471
