# Target cost strategy

- Trouver l'allocation des échantillons sur chaque niveau de fidélité (eq. 2.39 Mycek & De Lozzo) :
    - $\mathcal{V}_\ell = \mathbb{V}[f_\ell(X)^2 - f_{\ell-1}(X)^2]$
        - à estimer avec un échantillon "pilote" indépendant de taille $n = 10000$
    - $\mathcal{C}_\ell = 2\mathcal{C}_{\ell-1}$
    - Pour 2 niveaux :
        - $\mathcal{V}_0 = \mathbb{V}[f_0(X)^2]$
        - $\mathcal{V}_1 = \mathbb{V}[f_1(X)^2 - f_0(X)^2]$
        - $\mathcal{C}_1 = 1$
        - $\mathcal{C}_0 = 0.5$
    - on se donne un budget $\eta = 100$.
    - dans notre cas, $m=0$

In [1]:
import numpy as np 

In [3]:
# Constants 
d = 10


#print(np.random.uniform(-1,1,d))
v_1= np.array([-0.18268292, -0.63730044,  0.49158538, -0.51712638, -0.90171302,  0.40921266,  0.63791406,  0.70701292, -0.24888679,  0.94455888])

def f_vec(X,v):
    """
    X : (d,n) matrix
    v : d vector 
    """
    return v.T@X

def f_vec_squared(X,v):
    """
    X : (d,n) matrix
    v : d vector 
    """
    return (v.T@X)**2

exp_var = np.sum(np.square(v_1))

eps = np.random.normal(0,0.01,d)
# print(eps)

v_0 = v_1 + eps

Première chose à faire : Trouver $\mathcal{V}_0$ et $\mathcal{V}_1$

In [20]:
tab_V_0 = []
tab_V_1 = []

N = 100000
n0 = 100
n1 = 10

for _ in range(N):
    X1 = np.random.standard_normal((d,n1))
    X0 = np.random.standard_normal((d,n0))
    tab_V_0.append(f_vec_squared(X0,v_0))
    tab_V_1.append(f_vec_squared(X1,v_1) - f_vec_squared(X1,v_0))


In [22]:
V_0 = np.var(tab_V_0)
V_1 = np.var(tab_V_1)

In [23]:
print(V_0, V_1)

29.049978736999503 0.00714186789750937


Calcul de $M_\ell = m + 1 + \lfloor (\tilde{\eta} / \mathcal{S}_L) \sqrt{\mathcal{V}_\ell / \mathcal{C}_\ell} \rfloor > m $

avec : 
$$
 \tilde{\eta} = \eta - m \sum_{\ell' \le L} \mathcal{C}_{\ell'} \\
 \mathcal{S}_L = \sum_{\ell \le L} \sqrt{\mathcal{V}_\ell \mathcal{C}_\ell}
 $$


Ici, nous avons :
$$
m = 0 \\
\mathcal{C}_1 = 1 \\
\mathcal{C}_0 = 0.5 \\
\eta = 100
$$

In [28]:
def M_ell(eta, V_ell, C_ell,ell, m=0):
    """
    eta : budget
    V_ell : tableau contenant [V_0,V_1,...,V_L]
    C_ell : tableau contenant [C_0,C_1,...,C_L]

    return : la formule M_ell au dessus qui nous donne le nombre d'élement optimal à simuler
    """
    eta_tilde = eta + m
    S_L = np.sum(np.sqrt(np.multiply(V_ell,C_ell)))
    
    return m + 1 + np.floor(
        (eta_tilde/S_L)*np.sqrt(V_ell[ell]/C_ell[ell])
    )


In [26]:
V_ell = [V_0,V_1]
C_ell = [1.,0.5]
eta=100

M_0 = M_ell(eta,V_ell,C_ell,0)
M_1 = M_ell(eta,V_ell,C_ell,1)

In [27]:
print(M_0,M_1)

99.0 3.0


CCL : On aurait 99 pour n_0 et 3 pour n_1, ie 99 simulations basse fidélité et 3 haute fidélité pour obtenir un resultat optimal avec un budget de $\eta = 100$