<a href="https://colab.research.google.com/github/vmatiasw/modelos_y_simulacion/blob/main/P4E11.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
from collections import Counter
import random
import time
import math

def medir_tiempo(func):
    inicio = time.perf_counter()
    resultado = func()
    duracion = time.perf_counter() - inicio
    return resultado, duracion

def obtener_fpm_dict(df_fpm):
    df_fpm_fpm = df_fpm[df_fpm['Tema'] == 'FPM']
    return dict(zip(df_fpm_fpm['Datos'], df_fpm_fpm['Valor']))

def calcular_TVD(dict_d1, dict_d2): # Distancia Total de Variación.
    soporte_total = set(dict_d1) | set(dict_d2)
    return 0.5 * sum(abs(dict_d1.get(k, 0) - dict_d2.get(k, 0)) for k in soporte_total)

# --------------------------- Pandas ---------------------------
def comparar_dfs(df_A, df_B):
    df_comparado = pd.merge(df_A[['Tema', 'Datos', 'Valor']],
                            df_B[['Datos', 'Valor']],
                            on='Datos',
                            how='outer',
                            suffixes=('_A', '_B'))

    df_comparado['Diferencia'] = (df_comparado['Valor_A'] - df_comparado['Valor_B']).abs()
    return df_comparado[['Tema', 'Datos', 'Valor_A', 'Valor_B', 'Diferencia']]

def crear_df_fpm(dict_fpm):
    soporte = list(dict_fpm.keys())
    data = [{
        'Tema': 'FPM',
        "Datos": x,
        "Valor": dict_fpm.get(x, 0)
    } for x in soporte]

    esp = sum(x * p for x, p in dict_fpm.items())
    var = sum((x - esp)**2 * p for x, p in dict_fpm.items())
    desv = var**0.5
    resumen = [
        {'Tema': 'Estadisticas', "Datos": "Esperanza", "Valor": esp},
        {'Tema': 'Estadisticas', "Datos": "Varianza", "Valor": var},
        {'Tema': 'Estadisticas', "Datos": "Desv. Est.", "Valor": desv},
    ]

    return pd.concat([pd.DataFrame(data), pd.DataFrame(resumen)], ignore_index=True)

def estimar_df_fpm(generador_de_muestras, n=100_000):
    muestras, tiempos = zip(*(medir_tiempo(generador_de_muestras) for _ in range(n)))

    frec = Counter(muestras)
    soporte = sorted(list(frec.keys()))

    dict_fpm_estimada = {x: frec.get(x, 0) / n for x in soporte}
    df_fpm_estimada = crear_df_fpm(dict_fpm_estimada)

    tiempo_promedio = sum(tiempos) / len(tiempos)
    df_tiempo_promedio = pd.DataFrame([{
        'Tema': 'Performance',
        "Datos": "Tiempo Promedio",
        "Valor": tiempo_promedio
    }])

    return pd.concat([df_fpm_estimada, df_tiempo_promedio], ignore_index=True)

# --------------------------- Utilidades ---------------------------

def ordenar_dict_fpm_por_probabilidad(dict_fpm):
  return dict(sorted(dict_fpm.items(), key=lambda x: x[1], reverse=True))

def calcular_dict_fda(dict_fpm):
  dict_fda = {}
  acc = 0
  for v, p in dict_fpm.items():
    acc += p
    dict_fda[v] = acc
  return dict_fda

# def crear_dict_fpm(soporte, fpm):
#   return {v: fpm(v) for v in soporte}

# dict_A = dict(gen_A)
# gen_A = iter(dict_A.items())

def probabilidad(condicion, n):
    exitos = sum(condicion() for _ in range(n))
    return exitos / n

def gen_fpm_truncada(gen_fpm, condicion):
  list_fpm = list(gen_fpm())
  suma_probabilidades = sum(p for i, p in list_fpm if condicion(i))

  for i, p in list_fpm:
    if condicion(i):
      yield i, p / suma_probabilidades

def gen_fpm(gen_soporte, fpm):
  soporte = gen_soporte()
  fda_v = 0
  while fda_v < 1 - 1e-15:
    v = next(soporte)
    fpm_v = fpm(v)
    yield v, fpm_v
    fda_v += fpm_v

def gen_fda(gen_soporte, fpm):
  soporte = gen_soporte()
  fda_v = 0
  while fda_v < 1 - 1e-15:
    v = next(soporte)
    fda_v += fpm(v)
    yield v, fda_v

def TI(gen_soporte, fpm):
  u = random.random()
  soporte = gen_soporte()
  fda_v = 0
  for v in soporte:
    fda_v += fpm(v)
    if u <= fda_v:
      return v

# dict_A = dict(gen_A)
# def TI(dict_fda):
#   u = random.random()
#   for v, p in dict_fda.items():
#     if u < p:
#       return v

def AyR(dict_fpm_objetivo, fpm_propuesta, dict_fpm_propuesta, C):
    while True:
        muestra = fpm_propuesta()
        prob_objetivo = dict_fpm_objetivo.get(muestra, 0)
        prob_propuesta = dict_fpm_propuesta.get(muestra, 0)

        if prob_propuesta == 0:
            continue

        if random.random() < prob_objetivo / (C * prob_propuesta):
            return muestra

## @title { vertical-output: true}

In [None]:
def x_tasa_discreta(p,**kwargs):
    k = 1
    sum = 1
    l = 1
    while True:
        if k == 1:
            pass
        else:
          sum -= p(x=k-1,**kwargs)
          # sum -= l*sum
        l = p(x=k,**kwargs)/sum
        if random.random() < l:
            return k
        k += 1


def geom_tasa_discreta(pr):
    """
    Metodo de la tasa discreta para una variable geometrica
    """

    k = 1
    while True:
        u = random.random()
        if u < pr:
            return k
        k += 1


#@title { vertical-output: true}
n_sim = int(1e4)
s = simulate(geom_tasa_discreta,
             n_sim,
             pr=0.5);
sns.histplot(s[0]);