In [1]:
import numpy as np
import pandas as pd

from scipy.special import comb, loggamma, lambertw
from scipy.stats import multinomial, expon

from silence_tensorflow import silence_tensorflow
silence_tensorflow()
import tensorflow as tf

from matplotlib import pyplot as plt

from net_model import *
from custom_model import *
from mps_models import *
import mps
import pwexp

E0000 00:00:1740120194.736999  188158 cuda_dnn.cc:8310] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
E0000 00:00:1740120194.740706  188158 cuda_blas.cc:1418] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
  from .autonotebook import tqdm as notebook_tqdm


# Load dataset

In [2]:
fashion_mnist = tf.keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

i_valid_train = pd.Series(train_labels).isin([0,1,2,3,4]).to_numpy()
i_valid_test = pd.Series(test_labels).isin([0,1,2,3,4]).to_numpy()

# Filters to take only the images with labels in [0, 1, 2, 3, 4]
train_images = train_images[i_valid_train]
train_images = train_images / np.max(train_images)
train_shape = train_images.shape
# Adds one more dimension for keras to identify the "colors" dimension
train_images = np.reshape(train_images, (train_shape[0], train_shape[1], train_shape[2], 1))

test_images = test_images[i_valid_test]
test_images = test_images / np.max(test_images)
test_shape = test_images.shape
# Adds one more dimension for keras to identify the "colors" dimension
test_images = np.reshape(test_images, (test_shape[0], test_shape[1], test_shape[2], 1))

train_labels = train_labels[i_valid_train]
test_labels = test_labels[i_valid_test]

#### Function to read a specific simulated dataset

In [3]:
def load_file(data_dir, file_index, distribution, train_images, test_images):
    '''
        Example:
            data_dir = "SimulationDataset/Scenario1/n500"
            file_index = 20
            distribution = "poisson"
    '''
    index_path = "{}/indices_{}.csv".format(data_dir, file_index, distribution)
    data_path = "{}/{}/data_{}.csv".format(data_dir, distribution, file_index)
    df_index = pd.read_csv(index_path)
    df_data = pd.read_csv(data_path)

    index_train = df_index.loc[df_index.set == "train","index"].to_numpy()
    index_val = df_index.loc[df_index.set == "val","index"].to_numpy()
    index_test = df_index.loc[df_index.set == "test","index"].to_numpy()

    # Values for the thetas
    theta_train = df_data.loc[df_data.set == "train", "theta"]
    theta_val = df_data.loc[df_data.set == "val", "theta"]
    theta_test = df_data.loc[df_data.set == "test", "theta"]
    # Values for the latent variable
    m_train = df_data.loc[df_data.set == "train", "m"]
    m_val = df_data.loc[df_data.set == "val", "m"]
    m_test = df_data.loc[df_data.set == "test", "m"]
    # Values for the time variable
    t_train = df_data.loc[df_data.set == "train", "t"]
    t_val = df_data.loc[df_data.set == "val", "t"]
    t_test = df_data.loc[df_data.set == "test", "t"]
    # Values for the censorship indicators
    delta_train = df_data.loc[df_data.set == "train", "delta"]
    delta_val = df_data.loc[df_data.set == "val", "delta"]
    delta_test = df_data.loc[df_data.set == "test", "delta"]

    img_train = train_images[index_train,:,:]
    img_val = train_images[index_val,:,:]
    img_test = test_images[index_test,:,:]

    result = {
        "theta_train": theta_train, "theta_val": theta_val, "theta_test": theta_test,
        "m_train": m_train, "m_val": m_val, "m_test": m_test,
        "t_train": t_train, "t_val": t_val, "t_test": t_test,
        "delta_train": delta_train, "delta_val": delta_val, "delta_test": delta_test,
        "img_train": img_train, "img_val": img_val, "img_test": img_test,
        "index_train": index_train, "index_val": index_val, "index_test": index_test
    }
    
    return result

In [4]:
file_info = load_file("SimulationDataset/Scenario1/n3000/", 1, "bernoulli", train_images, test_images)
print( "Keys: {}".format(list(file_info.keys())) )

Keys: ['theta_train', 'theta_val', 'theta_test', 'm_train', 'm_val', 'm_test', 't_train', 't_val', 't_test', 'delta_train', 'delta_val', 'delta_test', 'img_train', 'img_val', 'img_test', 'index_train', 'index_val', 'index_test']


In [5]:
alpha0, s_t = initialize_alpha_s(file_info["t_train"], n_cuts = 5)

print("alpha0: {}".format(alpha0))
print("cuts: {}".format(s_t))

alpha0: [1. 1. 1. 1. 1. 1.]
cuts: [0.         0.27922816 0.68923389 1.39593144 2.97584372 5.9965322 ]


In [6]:
import os, shutil
from pathlib import Path

print("Creating directories structure")
dists_scenario1 = ["poisson", "logarithmic", "geometric", "mvnb2", "bernoulli", "bin5"]
dists_scenario2 = ["borel", "rgp2", "rgp10", "haight", "geeta3"]
for dist in dists_scenario1:
    Path("SimulationResults/Scenario1/n500/{}".format(dist)).mkdir(parents=True, exist_ok=True)
    Path("SimulationResults/Scenario1/n1000/{}".format(dist)).mkdir(parents=True, exist_ok=True)
    Path("SimulationResults/Scenario1/n3000/{}".format(dist)).mkdir(parents=True, exist_ok=True)
for dist in dists_scenario2:
    Path("SimulationResults/Scenario2/n500/{}".format(dist)).mkdir(parents=True, exist_ok=True)
    Path("SimulationResults/Scenario2/n1000/{}".format(dist)).mkdir(parents=True, exist_ok=True)
    Path("SimulationResults/Scenario2/n3000/{}".format(dist)).mkdir(parents=True, exist_ok=True)

Creating directories structure


In [7]:
def fit_simulation(distribution,
                   t_train, t_val,
                   delta_train, delta_val,
                   img_train, img_val,
                   seed = 1):
    set_all_seeds(seed)
    
    alpha0, s_t = initialize_alpha_s(t_train, n_cuts = 5)
    print(s_t)
    s_t = np.array([0.0, 2.062, 3.36, 4.495, 6.32, 12.2])
    
    if(distribution == "poisson"):
        log_a_tf = log_a_poisson_tf
        log_phi_tf = log_phi_poisson_tf
        C_tf = C_poisson_tf
        C_inv_tf = C_inv_poisson_tf
        sup = sup_poisson
        
        log_a_str = log_a_poisson_str
        log_phi_str = log_phi_poisson_str
        C_str = C_poisson_str
        C_inv_str = C_inv_poisson_str
        sup_str = sup_poisson_str
        B_str = "10001"
        
    mps_model = MPScrModel(log_a_tf, log_phi_tf, C_tf, C_inv_tf, sup)
    mps_model.define_structure(shape_input = img_train[0].shape)

    results = call_EM("EM.py",
                      log_a_str, log_phi_str, C_str, C_inv_str, B_str, sup_str,
                      mps_model, alpha0, s_t,
                      img_train, t_train, delta_train, delta_train,
                      max_iterations = 60,
                      early_stopping_em = True, early_stopping_em_warmup = 5, early_stopping_em_eps = 1.0e-6,
                      epochs = 100, batch_size = 64, shuffle = True,
                      learning_rate = 0.001, run_eagerly = True,
                      early_stopping_nn = True, early_stopping_min_delta_nn = 0.0, early_stopping_patience_nn = 5,
                      reduce_lr = True, reduce_lr_steps = 10, reduce_lr_factor = 0.1,
                      validation = True,
                      x_val = img_val, t_val = t_val, delta_val = delta_val, m_val = delta_val,
                      verbose = 3, alpha_known = False)
    return results

In [8]:
df_train = pd.read_csv("../Datasets/trainSet.csv")
df_train = df_train.iloc[:,1:]

df_test = pd.read_csv("../Datasets/testSet.csv")
df_test = df_test.iloc[:,1:]

df = pd.concat([df_train, df_test])

print("Dimensão dos dados de treino: {}".format(df_train.shape))
print("Dimensão dos dados de teste: {}".format(df_test.shape))
print("Dimensão dos dados completos: {}".format(df.shape))

mri = np.load("../Datasets/mri.npz")

mriTrain = (mri["train_images"] / np.max(mri["train_images"]))
# mriTrain = mri["train_images"]
# Remove uma observação do conjunto, que contava com dados de especificação faltantes
mriTrain = np.delete(mriTrain, 230, axis=0)

mriTest = (mri["test_images"] / np.max(mri["test_images"]))
# mriTest = mri["test_images"]

image_dim = mriTrain[0].shape
print("Dimensão das imagens: {}".format(image_dim))

x_train = mriTrain
t_train = df_train.time.to_numpy()
delta_train = df_train.delta.to_numpy()
m_train = df_train.delta.to_numpy()
x_test = mriTest
t_test = df_test.time.to_numpy()
delta_test = df_test.delta.to_numpy()
m_test = df_test.delta.to_numpy()

Dimensão dos dados de treino: (280, 23)
Dimensão dos dados de teste: (72, 23)
Dimensão dos dados completos: (352, 23)
Dimensão das imagens: (160, 200, 1)


In [9]:
fake_file_info = {
    'theta_train': None,
    'theta_val': None,
    'theta_test': None,
    'm_train': None,
    'm_val': None,
    'm_test': None,
    't_train': t_train,
    't_val': t_test,
    't_test': t_test,
    'delta_train': delta_train,
    'delta_val': delta_test,
    'delta_test': delta_test,
    'img_train': x_train,
    'img_val': x_test,
    'img_test': x_test,
    'index_train': None,
    'index_val': None,
    'index_test': None
    
}

In [10]:
fit_simulation("poisson",
               fake_file_info["t_train"], fake_file_info["t_val"],
               fake_file_info["delta_train"], fake_file_info["delta_val"],
               fake_file_info["img_train"], fake_file_info["img_val"],
               seed = 1)

[ 0.          3.18191781  4.9769863   7.06246575  9.13643836 12.11780822]


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)
I0000 00:00:1740120197.642540  188158 gpu_device.cc:2022] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 4203 MB memory:  -> device: 0, name: NVIDIA GeForce RTX 3050 6GB Laptop GPU, pci bus id: 0000:01:00.0, compute capability: 8.6
I0000 00:00:1740120198.230489  188158 cuda_dnn.cc:529] Loaded cuDNN version 90300
E0000 00:00:1740120199.304921  188266 cuda_dnn.cc:8310] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
E0000 00:00:1740120199.308824  188266 cuda_blas.cc:1418] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
I0000 00:00:1740120201.976064  188266 gpu_device.cc:2022] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 1209 MB memory:  -> device: 0, name: NVIDIA GeForce RTX 3050 6GB Laptop GPU, pci bus id: 0000:01:00.0, compute capabilit

Iniciando passo 1


 11%|█         | 11/100 [00:08<01:08,  1.30epoch/s, loss=0.462, loss_val=0.517]
  0%|          | 0/100 [00:00<?, ?epoch/s]

Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 5.00535007747008e-06
Distância Parâmetros Alpha: 0.39179786441162995
Média das distâncias: 0.1959014348808537
Iniciando passo 2


  7%|▋         | 7/100 [00:02<00:28,  3.25epoch/s, loss=0.685, loss_val=0.626]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 2.2713715970879455e-06
Distância Parâmetros Alpha: 0.0026790223694089436
Média das distâncias: 0.0013406468705030158
Iniciando passo 3


 10%|█         | 10/100 [00:03<00:27,  3.22epoch/s, loss=0.608, loss_val=0.671]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 1.8986257501932253e-06
Distância Parâmetros Alpha: 0.0013198884741975096
Média das distâncias: 0.0006608935499738514
Iniciando passo 4


  8%|▊         | 8/100 [00:02<00:28,  3.27epoch/s, loss=0.719, loss_val=0.703]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 1.5197585462066672e-06
Distância Parâmetros Alpha: 0.0008180196196858587
Média das distâncias: 0.0004097696891160327
Iniciando passo 5


  8%|▊         | 8/100 [00:02<00:29,  3.17epoch/s, loss=0.704, loss_val=0.733]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 1.7623881421193938e-06
Distância Parâmetros Alpha: 0.0009693911255577205
Média das distâncias: 0.0004855767568499199
Iniciando passo 6


  7%|▋         | 7/100 [00:02<00:29,  3.15epoch/s, loss=0.764, loss_val=0.754]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 3.207243780404991e-06
Distância Parâmetros Alpha: 0.0006746147580734464
Média das distâncias: 0.0003389110009269257
Iniciando passo 7


  9%|▉         | 9/100 [00:03<00:30,  2.97epoch/s, loss=0.648, loss_val=0.715]
  0%|          | 0/100 [00:00<?, ?epoch/s]

Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 4.238417429116356e-06
Distância Parâmetros Alpha: 0.00010869457513570261
Média das distâncias: 5.6466496282409487e-05
Iniciando passo 8


  9%|▉         | 9/100 [00:02<00:28,  3.17epoch/s, loss=0.815, loss_val=0.739]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 4.045019456970221e-06
Distância Parâmetros Alpha: 7.182100857940142e-05
Média das distâncias: 3.793301401818582e-05
Iniciando passo 9


 10%|█         | 10/100 [00:03<00:29,  3.08epoch/s, loss=0.684, loss_val=0.761]
  0%|          | 0/100 [00:00<?, ?epoch/s]

Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 5.421875296097679e-06
Distância Parâmetros Alpha: 0.00017474311804131773
Média das distâncias: 9.00824966687077e-05
Iniciando passo 10


 12%|█▏        | 12/100 [00:03<00:28,  3.09epoch/s, loss=0.696, loss_val=0.762]
  0%|          | 0/100 [00:00<?, ?epoch/s]

Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 5.953084185540851e-06
Distância Parâmetros Alpha: 0.00015076549795819968
Média das distâncias: 7.835929107187026e-05
Learning rate reduzida para 0.0001
Iniciando passo 11


  6%|▌         | 6/100 [00:01<00:28,  3.26epoch/s, loss=0.668, loss_val=0.779]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 7.137630042323165e-09
Distância Parâmetros Alpha: 0.00027525930606618246
Média das distâncias: 0.0001376332218481124
Iniciando passo 12


  6%|▌         | 6/100 [00:01<00:28,  3.29epoch/s, loss=0.887, loss_val=0.776]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 3.0664917975708782e-09
Distância Parâmetros Alpha: 7.268895432844582e-05
Média das distâncias: 3.63460104101217e-05
Iniciando passo 13


 10%|█         | 10/100 [00:03<00:27,  3.26epoch/s, loss=0.662, loss_val=0.785]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 9.088233081216753e-08
Distância Parâmetros Alpha: 6.53669299283478e-05
Média das distâncias: 3.272890612957998e-05
Iniciando passo 14


  8%|▊         | 8/100 [00:02<00:28,  3.25epoch/s, loss=0.82, loss_val=0.797] 


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 3.041399029446672e-08
Distância Parâmetros Alpha: 8.151346645296103e-05
Média das distâncias: 4.077194022162775e-05
Iniciando passo 15


  7%|▋         | 7/100 [00:02<00:28,  3.21epoch/s, loss=0.682, loss_val=0.811]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 1.887223715565087e-08
Distância Parâmetros Alpha: 0.00010919140865735777
Média das distâncias: 5.460514044725671e-05
Iniciando passo 16


  8%|▊         | 8/100 [00:02<00:27,  3.29epoch/s, loss=0.744, loss_val=0.823]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 3.2592707353686074e-08
Distância Parâmetros Alpha: 7.202630383488246e-05
Média das distâncias: 3.602944827111807e-05
Iniciando passo 17


  6%|▌         | 6/100 [00:01<00:28,  3.27epoch/s, loss=0.751, loss_val=0.823]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 3.777293992344831e-09
Distância Parâmetros Alpha: 1.924460448232802e-05
Média das distâncias: 9.624190888160182e-06
Iniciando passo 18


  6%|▌         | 6/100 [00:01<00:29,  3.20epoch/s, loss=0.739, loss_val=0.822]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 8.569759706369892e-09
Distância Parâmetros Alpha: 4.665342472570217e-06
Média das distâncias: 2.3369561161382932e-06
Iniciando passo 19


  6%|▌         | 6/100 [00:01<00:29,  3.19epoch/s, loss=0.97, loss_val=0.835] 


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 1.5273468486111723e-08
Distância Parâmetros Alpha: 2.6562754370907745e-05
Média das distâncias: 1.3289013919696929e-05
Iniciando passo 20


  6%|▌         | 6/100 [00:01<00:28,  3.25epoch/s, loss=0.735, loss_val=0.834]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 1.390211772420564e-08
Distância Parâmetros Alpha: 4.1816204965575795e-06
Média das distâncias: 2.0977613071408925e-06
Learning rate reduzida para 1e-05
Iniciando passo 21


  6%|▌         | 6/100 [00:01<00:28,  3.26epoch/s, loss=0.61, loss_val=0.836] 


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 8.827342890290649e-11
Distância Parâmetros Alpha: 6.5941566161362195e-06
Média das distâncias: 3.2971224447825613e-06
Iniciando passo 22


  7%|▋         | 7/100 [00:02<00:28,  3.27epoch/s, loss=0.857, loss_val=0.84]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 5.652043045399506e-10
Distância Parâmetros Alpha: 6.283625193036536e-06
Média das distâncias: 3.1420951986705376e-06
Iniciando passo 23


  6%|▌         | 6/100 [00:01<00:28,  3.28epoch/s, loss=0.862, loss_val=0.842]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 4.9742358044842946e-11
Distância Parâmetros Alpha: 3.4454463765224306e-06
Média das distâncias: 1.7227480594402377e-06
Iniciando passo 24


  7%|▋         | 7/100 [00:02<00:28,  3.26epoch/s, loss=0.873, loss_val=0.843]


Iniciando treinamento:
Tamanho da amostra de treino: 280
Tamanho da amostra de validação: 72
Distância Parâmetros Rede Neural: 3.136832742540842e-10
Distância Parâmetros Alpha: 1.2124051512452814e-06
Média das distâncias: 6.063594172597677e-07
Algoritmo convergiu após 24 iterações. Retornando.


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Número de arquivos no diretório: 24


{'new_model': <MPScrModel name=mp_scr_model_24, built=True>,
 'model_history': [<MPScrModel name=mp_scr_model_1, built=True>,
  <MPScrModel name=mp_scr_model_2, built=True>,
  <MPScrModel name=mp_scr_model_3, built=True>,
  <MPScrModel name=mp_scr_model_4, built=True>,
  <MPScrModel name=mp_scr_model_5, built=True>,
  <MPScrModel name=mp_scr_model_6, built=True>,
  <MPScrModel name=mp_scr_model_7, built=True>,
  <MPScrModel name=mp_scr_model_8, built=True>,
  <MPScrModel name=mp_scr_model_9, built=True>,
  <MPScrModel name=mp_scr_model_10, built=True>,
  <MPScrModel name=mp_scr_model_11, built=True>,
  <MPScrModel name=mp_scr_model_12, built=True>,
  <MPScrModel name=mp_scr_model_13, built=True>,
  <MPScrModel name=mp_scr_model_14, built=True>,
  <MPScrModel name=mp_scr_model_15, built=True>,
  <MPScrModel name=mp_scr_model_16, built=True>,
  <MPScrModel name=mp_scr_model_17, built=True>,
  <MPScrModel name=mp_scr_model_18, built=True>,
  <MPScrModel name=mp_scr_model_19, built=True>,


In [11]:
s_t = np.array([0.0, 2.062, 3.36, 4.495, 6.32, 12.2])

tv = np.arange(0, s_t[-1], 0.1)
S1v = S1(tv, sim_results["alpha_history"][-1], s_t)

alpha_xie = np.array([0.01570256, 0.04739518, 0.09240146, 0.13731525, 0.43543998, 1.])
S1v_xie = S1(tv, alpha_xie, s_t)

print("alpha estimado: {}".format(sim_results["alpha_history"][-1]))
print("alpha xie: {}".format(alpha_xie))

fig, ax = plt.subplots(figsize = (12, 6))
plt.plot(tv, S1v)
plt.plot(tv, S1v_xie)
plt.axhline(0.6, color = "black")
plt.axvline(6, color = "black")
plt.grid()
plt.show()

NameError: name 'sim_results' is not defined

In [2]:
# sim_results = fit_simulation("poisson",
#                file_info["t_train"], file_info["t_val"],
#                file_info["delta_train"], file_info["delta_val"],
#                file_info["img_train"], file_info["img_val"],
#                seed = 1)

In [3]:
# p_pred_train = 1/(1+np.exp( -sim_results["new_model"].predict(file_info["img_train"]) )).flatten()
# p_pred_test = 1/(1+np.exp( -sim_results["new_model"].predict(file_info["img_test"]) )).flatten()

In [4]:
# p_real_train = np.exp( log_a_poisson(0.0) - np.log(C_poisson( file_info["theta_train"] )) ).reset_index(drop = True)
# p_real_test = np.exp( log_a_poisson(0.0) - np.log(C_poisson( file_info["theta_test"] )) ).reset_index(drop = True)
# p_real_train.shape

In [88]:
# for i in range(20):
#     print("{} - {}".format(p_real_test[i], p_pred_test[i]))

0.9048374180359595 - 0.8699249662940587
0.4231620823177489 - 0.22500862403234267
0.5769498103804866 - 0.8410797003413634
0.9048374180359595 - 0.05346514411405707
0.39851904108451414 - 0.25801286525202055
0.5769498103804866 - 0.551390488413146
0.39851904108451414 - 0.13407821917610752
0.5769498103804866 - 0.3867666413189469
0.4231620823177489 - 0.24402015556658424
0.4584060113052235 - 0.3622043247318423
0.4231620823177489 - 0.6195901536458333
0.4231620823177489 - 0.07533997251511029
0.5769498103804866 - 0.8496327632917278
0.39851904108451414 - 0.2797780216720133
0.39851904108451414 - 0.14184990980746678
0.39851904108451414 - 0.1554440158227789
0.39851904108451414 - 0.03761490093418762
0.4231620823177489 - 0.2838149735956074
0.39851904108451414 - 0.09760707033601172
0.9048374180359595 - 0.8808189545782467


In [9]:
load_file("SimulationDataset/Scenario1/n500", 1, "bernoulli")

TypeError: load_file() missing 2 required positional arguments: 'train_images' and 'test_images'