In [1]:

# importamos las librerías que necesitamos

# Tratamiento de datos
# -----------------------------------------------------------------------
import pandas as pd
import numpy as np

# Visualización
# ------------------------------------------------------------------------------
import matplotlib.pyplot as plt
import seaborn as sns

# Evaluar linealidad de las relaciones entre las variables
# y la distribución de las variables
# ------------------------------------------------------------------------------
#import scipy.stats as stats
import scipy.stats as stats
from scipy.stats import shapiro, poisson, chisquare, expon, kstest


# Configuración
# -----------------------------------------------------------------------
pd.set_option('display.max_columns', None) # para poder visualizar todas las columnas de los DataFrames

# Gestión de los warnings
# -----------------------------------------------------------------------
import warnings
warnings.filterwarnings("ignore")

### Distribución exponencial


Un ejemplo de distribución exponencia es el tiempo entre la llegada de clientes a un mostrador de servicio en un banco. Supongamos que los clientes llegan de manera aleatoria e independiente, y que el tiempo que transcurre entre la llegada de un cliente y el siguiente sigue una distribución exponencial.

En este caso, la distribución exponencial se utiliza para modelar el tiempo que el personal del banco debe esperar antes de que llegue el próximo cliente. La distribución exponencial se caracteriza por tener una tasa de llegada (λ) que indica cuántos clientes llegan en promedio por unidad de tiempo. La probabilidad de que llegue un cliente en un período específico sigue una distribución exponencial.

La biblioteca NumPy en Python no incluye una función llamada `np.random.exponencial`. En su lugar, para generar números aleatorios que sigan una distribución exponencial, puedes usar la función `np.random.exponential`. Aquí está la sintaxis de `np.random.exponential`:

```python
np.random.exponential(scale=1.0, size=None)
```

In [2]:
# Parámetro de tasa lambda (también conocido como tasa de eventos)
lambda_param = 0.5  # Puedes ajustar este valor según tus necesidades

# generamos números aleatorios distribuidos exponencialmente
datos_exponenciales = np.random.exponential(scale=1/lambda_param, size=1000)
datos_exponenciales[:10]

array([6.59795583, 0.89094315, 0.27604322, 1.100583  , 3.68831202,
       1.35599952, 0.04957023, 4.44474185, 0.18689462, 1.67451414])

**Cómo podemos saber si un conjunto de datos sigue una distribución exponencial?**


1. Ajustar los datos a una distribución exponencial: Para eso vamos a usar el método `expon.scale()` el cual va a intentrar encontrar la mejor curva de distribución exponencial que se ajuste a los datos. Este método nos va a devolver dos valores: 

2. Prueba estadística para verificar el ajuste de la distribución exponencial: usaremos la prueba de  Kolmogorov-Smirnov (KS) (la misma que usabamos para la distribución normal). Lo que hace esta prueba es comparar nuestros datos con la distribución exponencial esperada ysando los parámetros ajustados para ver cuando se parecen. Este test nos devolverá un p-valor que interpretaremos de la siguiente forma:
    - Si p_value > 0.05 podremos concluir que los datos se parecen a una distribución exponencial. En otras palabras, **los datos siguen una distribución exponencial.**

    - Si p_value < 0.05, concluimos que nuestros datos no se parecen a una distribución exponencial. En este caso, **los datos no siguen una distribución exponencial.**



In [3]:
# Ajuste de los datos a una distribución exponencial
loc, scale = expon.fit(datos_exponenciales)

# Prueba estadística para verificar el ajuste a la distribución exponencial
statistic, p_value = kstest(datos_exponenciales, 'expon', args=(loc, scale))

# Interpretación de los resultados
alpha = 0.05  # Nivel de significancia
print(f'Estadística de prueba KS: {statistic}, Valor p: {p_value}')

if p_value > alpha:
    print("Los datos siguen una distribución exponencial (no se rechaza la hipótesis nula)")
else:
    print("Los datos no siguen una distribución exponencial (se rechaza la hipótesis nula)")


Estadística de prueba KS: 0.01335077510798402, Valor p: 0.993177575744856
Los datos siguen una distribución exponencial (no se rechaza la hipótesis nula)
