In [1]:
#Ejecutar esta celda antes de iniciar acá se importan todas las dependencias del código.
import numpy as np
import pandas as pd
import math

## 4. GENERACION DE VARIABLES ALEATORIAS CLASICAS Y EMPIRICAS NO UNIFORMES
### 4.1. PROCEDIMIENTO DIRECTO
Solo puede ser utilizado en funciones que permitan expresar
explícitamente el valor aleatorio X, a partir de la función acumulada
de probabilidad. Teniendo la función de densidad de probabilidad,
hallamos su función acumulada. Ya que todas las funciones de
probabilidad F(X) presentan valores entre 0 y 1, podemos asociarlo a
un número aleatorio uniforme Rnd y determinar el valor de la variable
aleatoria X.:  
+ $F(x) = Rnd$  
+ $x = F^{-1} (Rnd)$  
página 85 - 86

In [20]:
#Funcion que genera las frecuencias observadas de manera exponencial.
def generarNFObservadasExponencial(N,L,Intervalos):
    FO = np.zeros( Intervalos)
    # En python se cuenta el 0 en los arreglos
    # por lo tanto para 7 intervalos serían:
    # I0,I1,I2,I3,I4,I5,I6
    # si J es > I5 entonces se agrupa en I6
    for i in range(1,N+1):
        #generamos numerous aleatorios exponenciales
        X = (-1/L)*np.log(np.random.random())
        J = int(X)
        #agrupamos en el intervalo 7 todos los voalores mayore que 6 
        if (J > Intervalos - 2):
            J = Intervalos - 1
        #se le suma uno al intervalo conrrespondiente
        FO[J] = FO[J] + 1
    
    #devolvemos los valores de las frecuencias observadas para cada intervalo.
    #La variable devuelta es un vector de dimensiones(1,Intervalos)
    return FO

#Funcion que genera las frecuencias esperadas exponencialmente.
def generarNFEsperadasExponencial(Intervalos,L):
    F = np.zeros(Intervalos+1)
    P = np.zeros(Intervalos+1)
    for j in range (1,Intervalos+1):
        #Evaluamos la función en j
        F[j] = 1 - np.exp(-L*j)
        #calculamos las probabilidades [j]
        P[j] = F[j] - F[j-1]
    FE = P * N
    #devolvemos el valor de las frecuencias esperada quitando FE[0] ya que está será 0 siempre.
    return FE[1:] , P[1:]

#Funcion que obtiene Chi cuadrado para cada iteración
def obtenerCHI2(FO,FE):
    CHI2 = 0
    CHI2VEC = np.zeros(len(FO))
    for i in range(len(FE)):
        CHI2 = CHI2 + ((FE[i]-FO[i])**(2))/FE[i]
        CHI2VEC[i] = CHI2
    return CHI2VEC

In [21]:
#Ejecutamos este notebook para ejecutar el código y las funciones definidas anteriormente.
N = 1000
L = 1/2
Intervalos = 7
FO = generarNFObservadasExponencial(N,L,Intervalos)
FE, P = generarNFEsperadasExponencial(Intervalos,L)
CHI2 = obtenerCHI2(FO,FE)
data = {'Probabilidades': P, 
       'Frecuencias esperadas':FE,
        'Frecuencias observadas':FO ,
       '$CHI^{2}$':CHI2}
tabla = pd.DataFrame(data , index=range(1,Intervalos+1))
display(tabla)

Unnamed: 0,Probabilidades,Frecuencias esperadas,Frecuencias observadas,$CHI^{2}$
1,0.393469,393.46934,383.0,0.278566
2,0.238651,238.651219,236.0,0.308019
3,0.144749,144.749281,156.0,1.182487
4,0.087795,87.794877,84.0,1.346518
5,0.05325,53.250285,55.0,1.404011
6,0.032298,32.29793,31.0,1.45617
7,0.01959,19.589685,55.0,65.463856


## Ejemplo de la distribución empírica
se decide resolver una destribución empírica por el método directo teniendo en cuenta las siguientes condiciones:  
+ $f_1(x)= x$ si $0<x<1$
+ $f_2(x) = 1/2$ si $1<x<2$  
efectuando las integrales $\int f(x)dx$ se tiene que:  
+ $F_1(x) = x^{2}/2$
+ $F_2(x) = x/2 $  
  
  
página 87 del libro.

In [22]:
#Método directo
Intervalos = 2
N = 1000
FO  = np.zeros(Intervalos)
FE = np.zeros(Intervalos)
F = np.zeros(Intervalos + 1)
P = np.zeros(Intervalos)
CHI2 = 0
CHI2VEC = np.zeros(Intervalos)
for i in range(1,N+1):
    R = np.random.random()
        #Aplicamos las funciones acumuladas de probabilidad
        #correspondiente.
    if (R < 0.5):
        X = math.sqrt(2*R)
    else:
        X = 2*R
    #Efectuamos prueba de freecuencias para dos 
    #intervalos
    J = int(X) 
    FO[J] = FO[J] + 1
F[1] = 1/2
F[2] = (1/2) + (1/2)
P[0] = F[1] - F[0]
P[1] = F[2] - F[1]

#Efectuamos el cálculo de las frecuencias esperadas 
#como funciones de probabilidad
FE[0] = P[0] * N
FE[1] = P[1] * N
for j in range(2):
    CHI2 = CHI2 + ((FO[j]-FE[j])**(2))/FE[j]
    CHI2VEC[j] = CHI2
data = {
    'Probabilidades': P,
    'Frecuencias esperadas':FE,
    'Frecuencias observadas':FO,
    '$CHI^2$':CHI2VEC
}
display(pd.DataFrame(data,index=range(1,2+1)))

Unnamed: 0,Probabilidades,Frecuencias esperadas,Frecuencias observadas,$CHI^2$
1,0.5,500.0,539.0,3.042
2,0.5,500.0,461.0,6.084


# Ejercicio
Por el método de METODO DIRECTO, hallar los valores que corresponden a los números aleatorios Rnd especificados.
<img src="imgs/EjercicioPag88.PNG">
página 88 - 89

In [50]:
#Función f1 de X
def f1(X):
    return (2/3)*X

#Función F1 de x (integral de f1)
def F1(X):
    return (1/3)*(X**(2))

#Funcion inversa de F1 
def INVF1(R):
    return math.sqrt(3*R)

#función f2 de X
def f2(X):
    return (1/3)

#función F2 de X
def F2(X):
    return (1/3)*X

#funcion inversa de F2
def INVF2(R):
    return 3*R

#función f3 de X
def f3(X):
    return (2/3)*X + (4/3)

#función F3 de X
def F3(X):
    return (1/3)*(X**(2)) + (4/3)*X

#función inversa de F3
def INVF3(R):
    return 2 + math.sqrt(3 * R - 2)

In [56]:
#Ejecución primera parte
X = np.array([1.2, 1.5, 1.8, 3.0 , 1.0 , 2.0])
RNDS = np.zeros(len(X))
for i in range (len(X)):
    if X[i] > 0 and X[i] <= 1:
        RNDS[i] = F1(X[i]) 
    else:
        if X[i]>1 and X[i]<= 2:
            RNDS[i] = F2(X[i])
        else:
            if X[i] >2 and X[i]<=3:
                RNDS[i] = F3(X[i])
            else:
                RNDS[i] = 0 
tabla = pd.DataFrame(data = {"X": X , "RNDS":RNDS})
print("Valores de RND dado X en el ejemplo")
display(tabla)

Valores de RND dado X en el ejemplo


Unnamed: 0,X,RNDS
0,1.2,0.4
1,1.5,0.5
2,1.8,0.6
3,3.0,7.0
4,1.0,0.333333
5,2.0,0.666667


In [58]:
#Ejecución parte 2
N = 3000
FO  = np.zeros(3)
X = np.zeros(N)
R = np.zeros(N)
for i in range (0,N):
    R[i] = np.random.random()
    if (R[i] < (1/3)):
        X[i] = INVF1(R[i])
    if ( R[i] >= (1/3) and R[i] <= (2/3) ):
        X[i] = INVF2(R[i])
    if ( R[i]> (2/3)   and R[i] <= 1 ):
        X[i] = INVF3(R[i])
    J = int (X[i])
    FO[J]  = FO[J] + 1
tabla = pd.DataFrame(data = {"X":X , "R":R})
print ("Valores de X y de R generando 3000 R's aleatorios")
display(tabla)

Valores de X y de R generando 3000 R's aleatorios


Unnamed: 0,X,R
0,0.202595,0.013682
1,0.106127,0.003754
2,2.749145,0.853740
3,2.669254,0.815967
4,2.935842,0.958600
5,0.609016,0.123634
6,0.278430,0.025841
7,2.344477,0.706222
8,0.344732,0.039613
9,2.175662,0.676952


In [59]:
#Ejecución parte 3
chi2 = 0
CHI2 = np.zeros(3)
for i in range (3):
    chi2 = chi2 + (1/1000)*(FO[i] - 1000)**(2)
    CHI2[i] = chi2
tabla = pd.DataFrame( data= {"Frecuencia observada":FO, "Frecuencia esperada": 1000 , "$chi^2$":CHI2 })
print("Frecuencia observada vs Frecuencia esperada vs $chi^2$ para cada intervalo")
display(tabla)
    

Frecuencia observada vs Frecuencia esperada vs chi2 para cada intervalo


Unnamed: 0,Frecuencia observada,Frecuencia esperada,$chi2$
0,1046.0,1000,2.116
1,976.0,1000,2.692
2,978.0,1000,3.176


# Distribución geométrica
$P(X=x) = (1-P)^{x-1}*P$  
$P(Y=x) = {(1-P)^{x}}*P$  
$E(X) = 1/P$    
$E(Y) = {1-P}/P$  
$VAR(X) = VAR(Y) = (1-P)/(P^{2}) $  
## Ejemplo
Programa para generar la tabla de búsqueda, de probabilidad
acumulada, en la generación de variables aleatorias discretas, para la
función de densidad Geometrica.  
página 90 - 91 

In [69]:
#Función para generar Densidadades y distribuciones acumuladas geométricas dado un N y un P
def funcionDensidadGeometrica(N,P):
    funcionDensidad = np.zeros(N)
    distribucionAcumulada = np.zeros(N)
    funcionDensidad[0] = P
    distribucionAcumulada[0] = funcionDensidad[0]
    for VGEO in range (1, N):
        funcionDensidad[VGEO] = funcionDensidad[VGEO - 1]*(1-P)
        distribucionAcumulada[VGEO] = distribucionAcumulada[VGEO - 1] + funcionDensidad[VGEO]
    tabla = pd.DataFrame(data={"Función de densidad geométrica":funcionDensidad, 
                                "Distribución Acumulada":distribucionAcumulada},
                        index = range (1,N+1))
    display(tabla)

In [73]:
#Ejecución del algoritmo
N = 15
P = 0.3
funcionDensidadGeometrica(N,P)

Unnamed: 0,Función de densidad geométrica,Distribución Acumulada
1,0.3,0.3
2,0.21,0.51
3,0.147,0.657
4,0.1029,0.7599
5,0.07203,0.83193
6,0.050421,0.882351
7,0.035295,0.917646
8,0.024706,0.942352
9,0.017294,0.959646
10,0.012106,0.971752


# Ejercicio
Programa para generar valores aleatorios de la distribución
GEOMETRICA  
página 91 - 92

In [10]:
#Función para generar números aleatorios basados en la distribución geométrica
def generarAleatoriosDistribucionGeométrica(N,p):
    for i in range (1,N+1):
        R = np.random.random()
        #REM Funcion de densidad inicial
        Fundensidad = p
        DistriAcum = Fundensidad
        Fdensidades = []
        DistribucionesAcumuladas = []
        for VGEO in range(1,999 + 1):
            if DistriAcum > R:
                DistribucionesAcumuladas.append(DistriAcum)
                Fdensidades.append(Fundensidad)
                break; 
            DistribucionesAcumuladas.append(DistriAcum)
            Fdensidades.append(Fundensidad)
            #WRITE #1, VGEO, Fundensidad, DistriAcum
            Fundensidad = Fundensidad * (1 - p)
            DistriAcum = DistriAcum + Fundensidad
        tabla = pd.DataFrame(index = range(1,len(Fdensidades)+1),data={"fDensidad": Fdensidades , "Distribuciones Acumuladas":DistribucionesAcumuladas})
        print ("El valor aleatorio de R es ",R)
        display(tabla)
        print ("==================================================================================================")

In [11]:
#Ejecución
N = 5 #cantidad de aleatorios
p = .3 # probabilidad de acierto P
generarAleatoriosDistribucionGeométrica(N,p)

El valor aleatorio de R es  0.3672202204076219


Unnamed: 0,fDensidad,Distribuciones Acumuladas
1,0.3,0.3
2,0.21,0.51


El valor aleatorio de R es  0.6465735192554227


Unnamed: 0,fDensidad,Distribuciones Acumuladas
1,0.3,0.3
2,0.21,0.51
3,0.147,0.657


El valor aleatorio de R es  0.5182828277023779


Unnamed: 0,fDensidad,Distribuciones Acumuladas
1,0.3,0.3
2,0.21,0.51
3,0.147,0.657


El valor aleatorio de R es  0.7602055858492124


Unnamed: 0,fDensidad,Distribuciones Acumuladas
1,0.3,0.3
2,0.21,0.51
3,0.147,0.657
4,0.1029,0.7599
5,0.07203,0.83193


El valor aleatorio de R es  0.6780711191173071


Unnamed: 0,fDensidad,Distribuciones Acumuladas
1,0.3,0.3
2,0.21,0.51
3,0.147,0.657
4,0.1029,0.7599




# 4.2 PROCEDIMIENTO DE EXCLUSION O DE METODO DEL RECHAZO
Consiste en generar un valor de una variable aleatoria y después
se prueba que dicho valor simulado proviene de la distribución de
probabilidad que se este analizando. Es necesario que la función
de distribución de probabilidad sea acotada y con rango finito, la
aplicación del método será:
1. Generar dos números uniformes R1 y R2
2. Determinamos un valor en el dominio de la función con base en R1,es decir, x = a + (b-a)*R1 siendo a y b los límites de la función
3. Obtener el valor de la función en x
4. Determinar si la siguiente desigualdad se cumple: $R2 ≤ f(x) / M$  

siendo M el punto máximo de la función; si la respuesta es afirmativa
significa que el valor de x se distribuye de acuerdo a la función original,
de lo contrario vuelve al primer paso.

## EJEMPLO 1
<img src="imgs/EjercicioPag93.png">
aplicar el método del rechazo para la función presentada en la imagen  
página 93 - 94

In [58]:
#Función f de x
def f(x):
    return (2/9)*x

#Función FX
def F(J):
    if (J == -1):
        F = 0
    else:
        F = (1/9)*(J**(2))
    return F

#Lógica del ejercicio propuesto
def ejercicio93_94(N,A,B,M,intervalos):
    FO = np.zeros(intervalos)
    FE = np.zeros(intervalos)
    P = np.zeros(intervalos)
    CHI2 = np.zeros(intervalos)
    for i in range (1,N):
        condicion = True
        while (condicion == True):
            #generamos 2 números aleatorios R1 y R2
            R1 = np.random.random()
            R2 = np.random.random()
            #Determinamos un valor en el dominio de la funcion con base en R1,
            #es decir, x = a + (b-a)*R1
            #siendo a y b los limites de la funcion
            X = A + (B-A)*R1
            #Obtener el valor de la funcion en x
            #Determinar si la siguiente desigualdad se cumple:
            #R2 < f(x) / M
            #siendo M el punto maximo de la funcion
            fun = f(X)
            if (R2 < fun/M):
                #Aceptado
                #si la respuesta es afirmativa significa que el valor de x 
                #se distribuye de acuerdo a la función original
                J = int(X)
                FO[J] = FO[J] + 1
                condicion = False
            else:
                condicion = True
    chi2 = 0
    for J in range (0,intervalos):
        #“calculamos F(x); para x=0,1,2,3,. . .”
        #calculamos las probabilidades
        P[J] = F(J+1) - F(J)
        #la frecuencia esperada es proporcional a la probabilidad
        FE[J] = P[J] * N
        chi2 = chi2 + ((FO[J] - FE[J])**(2))/FE[J]
        CHI2[J] = chi2
    tabla = pd.DataFrame(data={"P": P, "FO": FO , "FE":FE , "$Chi^2$":CHI2})
    display(tabla)

In [62]:
#Ejecución del algoritmo
N = 1000
A = 0
B = 3
M = 2 / 3
intervalos = 3
ejercicio93_94(N,A,B,M,intervalos)

Unnamed: 0,P,FO,FE,$Chi^2$
0,0.111111,101.0,111.111111,0.920111
1,0.333333,331.0,333.333333,0.936444
2,0.555556,567.0,555.555556,1.1722
