# Funciones de distribución de probabilidades
## Distribución Uniforme

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

In [None]:
a = 1
b = 100
n = 1000000
data = np.random.uniform(a, b, n)

In [None]:
%matplotlib inline
plt.hist(data)

## Distribución Normal

In [None]:
data = np.random.randn(1000000)

In [None]:
x = range(1,1000001)
plt.plot(x, data)

In [None]:
%matplotlib inline
plt.hist(data)

In [None]:
plt.plot(x,sorted(data))

In [None]:
mu = 5.5
sd = 2.5
Z_10000 = np.random.randn(10000)
data = mu + sd * Z_10000 # Z = (X - mu) / sd -> N(0,1), X = mu + sd * Z
plt.hist(data)

In [None]:
data = np.random.randn(2,4)
data

## La simulación de Monte Carlo

* Generamos dos números aleatorios uniforme x e y entre 0 y 1 en total 1000 veces.
* Calcularemos $z = x^2 + y^2$:
    * Si $z <= 1 \rightarrow$ estamos dentro del círculo.
    * Si $z > 1 \rightarrow$ estamos fuera del círculo.
* Calculamos el número total de veces que están dentro del círculo y lo dividimos entre el número total de intentos para obtener una aproximación de la probabilidad de caer dentro del círculo.
* Usamos dicha probabilidad para aproximar el valor de π.
* Repetimos el experimento un número suficiente de veces (por ejemplo 100), para obtener (100) diferentes aproximaciones de π. 
* Calculamos el promedio de los 100 experimentos anteriores para dar un valor final de π.
    

In [None]:
def pi_montecarlo(n, n_exp):
    pi_avg = 0
    pi_value_list = []
    for i in range(n_exp):
        value = 0
        x = np.random.uniform(0,1,n).tolist()
        y = np.random.uniform(0,1,n).tolist()
        for j in range(n):
            z = np.sqrt(x[j] * x[j] + y[j] * y[j])
            if z<=1:
                value += 1
        float_value = float(value)
        pi_value = float_value * 4 / n
        pi_value_list.append(pi_value)
        pi_avg += pi_value

    pi = pi_avg/n_exp

    print(pi)
    fig = plt.plot(pi_value_list)
    return (pi, fig)

In [None]:
pi_montecarlo(1000, 100)

### Dummy Data Sets

In [None]:
n = 1000000
data = pd.DataFrame(
    {
        'A' : np.random.randn(n),
        'B' : 1.5 + 2.5 * np.random.randn(n),
        'C' : np.random.uniform(5, 32, n)
    }
)

In [None]:
data.describe()

In [None]:
plt.hist(data["A"])

In [None]:
plt.hist(data["B"])

In [None]:
plt.hist(data["C"])

In [None]:
data = pd.read_csv("../datasets/customer-churn-model/Customer Churn Model.txt")

In [None]:
data.head()

In [None]:
colum_names = data.columns.values.tolist()

In [None]:
a = len(colum_names)
a

In [None]:
new_data = pd.DataFrame(
    {
        'Column Name': colum_names,
        'A' : np.random.randn(a),
        'B' : np.random.uniform(0,1,a)
    }
)

In [None]:
new_data

In [None]:
new_data = pd.DataFrame(
    {
        'Column Name': colum_names,
        'A' : np.random.randn(a),
        'B' : np.random.uniform(0,1,a)
    }, index = range(42, 42 + a)
)