# Maximisation de la fonction de vraissemblance 

In [2]:
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 
from scipy.optimize import minimize
from datetime import datetime, timedelta
from scipy.integrate import quad
import random
from tqdm import tqdm
from decimal import Decimal, getcontext
import tensorflow_probability as tfp
from sklearn.impute import SimpleImputer
import mpmath

## Quelques notations 

- $X \equiv$ un vecteur contenant les déterminants observables de $T_s$ et $T_d$ (genre, jour de naissance, département de naissance, etc.)

- $\tau_{birth} \equiv$ la date de naissance de l'individu

- $\tau_{contract} \equiv$ la date de la vente en viager

- $\tau_{begin} \equiv$ la date du début de la période d'observation des fichiers INSEE (1-1-1970)

- $\tau_{end} \equiv$ la date de la fin de la période d'observation des fichiers INSEE (1-6-2023)

- $V_d \equiv$ une variable captant l'effet des déterminants inobservables de $T_d$ (état de santé, richesse, niveau d'éducation)

- $V_s \equiv$ une variable captant l'effet des déterminants inobservables de $T_s$ (potentiellement les mêmes variables que celles captées par $V_d$, une variable indiquant si la personne a des enfants, une autre variable indiquant si elle a perdu son conjoint, etc.)

- $V \equiv (V_d,V_s)$

La distribution de $T_d$ conditionnellement à $T_s$, $X$ et $V$, notée $T_d|T_s,X,V$, est complètement caractérisée par le taux de hasard (comme $T_d$ représente une durée de vie il s'agit en fait d'un taux de mortalité) :
\begin{equation*}
\underset{\Delta \downarrow 0}{\text{lim}} \frac{Pr(t \leq T_d< t
+\Delta |T_d \geq t,T_s=t_s,X=x, V=v)}{\Delta} \equiv \theta_d(t|t_s,x,v).
\end{equation*}

Donc $\theta_d(t|t_s,x,v)\Delta$ s'interprète comme la probabilité qu'une personne décède durant l'interval $[t,t+{\Delta})$ sachant $T_s$, $X$ et $V$, et le fait que cette personne soit toujours vivante à l'âge $t$.

De la même manière, la distribution de $T_s$ conditionnellement à $X$ et $V$ est complètement déterminée par le taux de hasard
\begin{equation*}
\underset{\Delta \downarrow 0}{\text{lim}} \frac{Pr(t \leq T_s< t
+\Delta |T_s \geq t,X=x, V=v)}{\Delta} \equiv \theta_s(t|x,v).
\end{equation*}

Finalement, on note $F_d(t|t_s,x,v)=Pr(T_d<t|T_s=t_s,X=x, V=v)$ la fonction de répartition conditionnelle de $T_d$, et $f_d(t|t_s,x,v)=\partial F_d(t|t_s,x,v)/\partial t$ la fonction de densité associée. Ces fonctions sont liées au taux de hasard $\theta_d(t|t_s,x,v)$ de la façon suivante :
\begin{equation*}
    \theta_d(t|t_s,x,v)=\frac{f_d(t|t_s,x,v)}{1-F_d(t|t_s,x,v)}
\end{equation*}
et
\begin{equation*}
1-F_d(t|t_s,x,v)=exp\left[-\int_0 ^t \theta_d(u|t_s,x,v) du \right].
\end{equation*}

Faisons maintenant l'hypothèse que les taux de hasard s'écrivent comme :

$$ \theta_d(t|t_s,x,v)=
    \lambda_d(t) \phi_d(x) v_d \text{ si } t \le t_s \\
  \theta_d(t|t_s,x,v)=
    \lambda_d(t) \phi_d(x) \delta(t,t_s,x) v_d \text{ si } t >t_s $$

et

$$ \theta_s(t|x,v)=\lambda_s(t) \phi_s(x) v_s.$$

- Les fonctions $\lambda_d(t)$ et $\lambda_s(t)$ (parfois appelés taux de hasard de base) mesurent comment les taux de hasard dépendent respectivement de la durée $T_d$ et $T_s$. 

- Les termes $\phi_d(x)$ et $\phi_x(x)$ mesurent l'effet des variables observés sur les taux de hasard. 

- La composante cruciale dans ce modèle est $\delta(t,t_s,x)$. Cette dernière fonction capte comment le taux de mortalité change après la vente en viager. Elle mesure donc comment les supplements d'argent reçus par le vendeur affecte sa durée de vie, et cet effet peut dépendre de l'âge $t$, l'âge $t_s$ auquel l'individu a vendu son bien immobilier en viager, et les caractéristiques $x$.

### 1er cas : Modèle le plus simple 

On suppose que $var(V_d)=var(V_s)=0$ et $\delta(t,t_s,x)=\delta$.

$$
\theta_d(t|t_s,x)= 
    \lambda_d \phi_d(x) \text{ si } t \le t_s\\
\theta_d(t|t_s,x)= 
    \lambda_d \phi_d(x) \delta \text{ si } t >t_s
$$

et

$$
\theta_s(t|x)=\lambda_s \phi_s(x).
$$

On a donc fait l'hypothèse que l'hétérogénéité inobservée est absente et que les durées $T_d|T_s,X$ et $T_s|X$ suivent des lois exponentielles (les taux de hasard de base $\lambda_d(t)$ et $\lambda_s(t)$ ne dépendent pas de $t$).

$L_i^{seller} \space = \space \displaystyle \frac{f_d(t_{id}^{seller}|t_{is}^{seller},x_i)f_s(t_{is}^{seller}|x_i)}{Pr(\tau_{begin}<\tau_{i,birth}+T_{id}^{seller}<\tau_{end}|X_i=x_i)} \\$ 
<br>
<br>
$= \displaystyle \frac{f_d(t_{id}^{seller}|t_{is}^{seller},x_i)f_s(t_{is}^{seller}|x_i)}{\int \left[F_d(\tau_{end}-\tau_{i,birth}|t_s,x_i)-F_d(\tau_{begin}-\tau_{i,birth}|t_s,x_i) \right] f_s(t_s|x_i)dt_s} \\$
<br>
<br>
$= \displaystyle \frac{\lambda_d \phi_d(x_i) \delta e^{-\phi_d(x_i)I_d(t_{id}^{seller},t_{is}^{seller})} \lambda_s \phi_s(x_i) e^{-\phi_s(x_i)I_s(t_{is}^{seller})}}{\int \left[e^{-\phi_d(x_i)I_d(\tau_{begin}-\tau_{i,birth},t_s)}-e^{-\phi_d(x_i)I_d(\tau_{end}-\tau_{i,birth},t_s)}\right] \lambda_s \phi_s(x_i) e^{-\phi_s(x_i)I_s(t_s)} dt_s}$
<br>
<br>
<br>
<br>

$L_i^{clone} = \displaystyle \int_{t_{id}^{clone}} ^{\infty} \frac{f_d(t_{id}^{clone}|u,x_i)f_s(u|x_i)}{Pr(\tau_{contract}<\tau_{i,birth}+T_{id}^{seller}<\tau_{end}|X_i=x_i)}du \\$
<br>
<br>
$= \displaystyle \frac{\lambda_d \phi_d(x_i)e^{-\phi_d(x_i)I_d(t_{id}^{clone})}e^{-\phi_s(x_i)I_s(t_{id}^{clone})}}{\int \left[e^{-\phi_d(x_i)I_d(\tau_{contract}-\tau_{i,birth},t_s)}-e^{-\phi_d(x_i)I_d(\tau_{end}-\tau_{i,birth},t_s)}\right] \lambda_s \phi_s(x_i) e^{-\phi_s(x_i)I_s(t_s)} dt_s}.$ <br>
<br>
<br>
On spécifie $\phi_j(x_i)=exp(x_i'\beta_j)$, $j=d,s$, où $x_i'\beta_j=x_{i1}\beta_{j1}+x_{i2}\beta_{j2}+ ...+x_{iK}\beta_{jK}$, avec $K$ le nombre de variables explicatives.

Type of solver in scikit.spicy.minimize : [Have a look](https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.minimize.html) <br>

- ‘Nelder-Mead’  <br>

- ‘Powell’ 

- ‘CG’ 

- ‘BFGS’ 

- ‘Newton-CG’ 

- ‘L-BFGS-B’ 

- ‘TNC’ 

- ‘COBYLA’ 

- ‘SLSQP’ 

- ‘trust-constr’

- ‘dogleg’ 

- ‘trust-ncg’ 

- ‘trust-exact’ 

- ‘trust-krylov’ 

Nos variables sont :

- $x_1 = $ type_libre 

- $x_2 = $ sexe_homme

- $x_3 = $ sexe_femme$

- $x_4 = $ idf 

- $x_5 = $ étranger 

- $x_6 = $ une_tete

- $x_7 = $ dec1

- $x_8 = $ dec2

- $x_9 = $ dec3

In [6]:
"""""
df = pd.read_csv('Data/seller.csv')

X = ['type_libre','sexe_homme','idf','etranger','une_tete','dec1','dec2','dec3']
columns = ['type_libre','sexe_homme','idf','etranger','une_tete','dec1','dec2','dec3','tau_birth','tau_contract','Td','Ts','Td_clone','Ts_clone','tau_begin','tau_end']
#seller = df.copy().drop([635,906]).reset_index().drop(53).reset_index()
seller = df.copy()
seller.rename(columns={'dateA':'tau_contract'},inplace=True)
"""

seller = pd.read_csv('Data/df_vraissemblance1.csv')

FileNotFoundError: [Errno 2] No such file or directory: 'Data/df_vraissemblance1.csv'

In [1]:
X = ['type_libre','sexe_homme','sexe_femme','idf','etranger','une_tete','dec1','dec2','dec3']
columns = ['type_libre','sexe_homme','sexe_femme','idf','etranger','une_tete','dec1','dec2','dec3','tau_birth','tau_contract','Td','Ts','Td_clone','Ts_clone','tau_begin','tau_end']

In [9]:
parameters_list = [
    "lambda_d", "lambda_s", "delta",
    *["beta_d" + str(i) for i in range(9)],
    *["beta_s" + str(i) for i in range(9)]
]

# Créer un DataFrame avec la colonne "parameters" et la colonne "valeurs"
data = {"parameters": parameters_list, "valeurs": [0] * len(parameters_list)}
result = pd.DataFrame(data)

In [15]:
data['valeurs'][2]

0

##### Pour créer seller

Nous rappelons que dans le fichier seller, datetime(1960,1,1) = 0 jours (date de départ).

$\tau_{birth} \equiv$ la date de naissance de l'individu

$\tau_{contract} \equiv$ la date de la vente en viager

$\tau_{begin} \equiv$ la date du début de la période d'observation des fichiers INSEE (1-1-1970)

$\tau_{end} \equiv$ la date de la fin de la période d'observation des fichiers INSEE (1-6-2023)

In [3]:
def get_tau_birth(row):
    tau_birth = (pd.Timestamp(row['b_annee'], row['b_mois'], row['b_jour']) - pd.Timestamp(1960, 1, 1)).days
    return tau_birth

#seller['tau_birth'] = seller.apply(get_tau_birth,axis=1)

In [4]:
"""""
tau_birth = (seller['tau_birth']  / seller['tau_birth'].mean()).to_list()

tau_contract = (seller['dateA']  / seller['dateA'].mean()).to_list()

tau_begin = (datetime(1970, 1, 1) - datetime(1960, 1, 1)).days * 10**(-4)

tau_end = (datetime(2023, 7, 1) - datetime(1960, 1, 1)).days * 10**(-4)

"""""

tau_birth = seller['tau_birth'].to_list()

tau_contract = seller['tau_contract'].to_list()

tau_begin = (datetime(1970, 1, 1) - datetime(1960, 1, 1)).days 

tau_end = (datetime(2023, 7, 1) - datetime(1960, 1, 1)).days 



In [5]:
#seller['tau_begin'] = tau_begin
#seller['tau_end'] = tau_end

##### Définissons quelques fonctions : 

On commence par définir $\phi $, ainsie définie : $ \phi _j (x_i) = e^{x_i ^T \beta _j}$ avec $j \in $ {$d,s$} où $\beta _d$ est un vecteur de taille 8.

In [4]:
def phiD(beta_d): # beta_d est un vecteur de taille 8
    x_i = seller[X].values 
    phi = np.exp(np.dot(x_i,beta_d))
    return phi
    #return phi / phi.mean() 
     # retourne une liste de taille N (chaque individu) 


def phiS(beta_s): #beta_d est un vecteur de taille 8
    x_i = seller[X].values 
    phi = np.exp(np.dot(x_i,beta_s))
    return phi
    #return phi / phi.mean()
    #return (phi - phi.mean()) / phi.std()  # retourne une liste de taille N (chaque individu) 

Nous introduisons ensuite $\theta _d $, ainsi définie : $\theta _d (t|t_s,x) = \lambda _d \phi_d(x) \space $ si $ \space t \le t_s$ et $ \space \theta _d (t|t_s,x) = \lambda _d \phi_d(x) \delta \space $ si $\space t > t_s$.

In [8]:
def thetaD(lambda_d,phi_d,t,t_s, delta):
    if t <= t_s:
        theta = lambda_d * phi_d
    else: 
        theta = lambda_d * phi_d * delta
    return theta

Puis $ \theta _s(t|x) = \lambda _s \phi_s (x) $ : 

In [9]:
def thetaS(lambda_s,phi_s):
    theta = lambda_s * phi_s 
    return theta

$ I_d(t_1,t_2) = \lambda_d (t_2 + \delta (t_1 - t_2))  $ si $t_1 > t_2$ et $ I_d(t_1,t_2) = \lambda _d t_1 $ si $t_1 \le t_2$

$ I_d(t) = \lambda_d t $

$ I_s(t) = \lambda _s t $ 

In [10]:
def IDD(delta,lambda_d,t_1,t_2): 
    if t_1 <= t_2:
        I = lambda_d * t_1
    else: 
        I = lambda_d * (t_2 + delta * (t_1 - t_2))
    return I 


def ID(lambda_d,t):
    I = lambda_d * t
    return I 

def IS(lambda_s,t):
    I = lambda_s * t
    return I 

Définir $L_i ^{seller}$ et $L_i ^{clone}$ : 

- $L_i ^{seller} = \displaystyle \frac{\lambda_d \phi_d(x_i) \delta e^{-\phi_d(x_i)I_d(t_{id}^{seller},t_{is}^{seller})} \lambda_s \phi_s(x_i) e^{-\phi_s(x_i)I_s(t_{is}^{seller})}}{\int \left[e^{-\phi_d(x_i)I_d(\tau_{begin}-\tau_{i,birth},t_s)}-e^{-\phi_d(x_i)I_d(\tau_{end}-\tau_{i,birth},t_s)}\right] \lambda_s \phi_s(x_i) e^{-\phi_s(x_i)I_s(t_s)} dt_s} $
<br>
<br>

- $L_i^{clone} = \displaystyle \frac{\lambda_d \phi_d(x_i)e^{-\phi_d(x_i)I_d(t_{id}^{clone})}e^{-\phi_s(x_i)I_s(t_{id}^{clone})}}{\int \left[e^{-\phi_d(x_i)I_d(\tau_{contract}-\tau_{i,birth},t_s)}-e^{-\phi_d(x_i)I_d(\tau_{end}-\tau_{i,birth},t_s)}\right] \lambda_s \phi_s(x_i) e^{-\phi_s(x_i)I_s(t_s)} dt_s}.$ 

##### Cette première cellule de code calcul $L_i ^{seller}$ et $L_i ^{clone}$ avec les intégrales. Cette méthode prend du temps, c'est pourquoi nous résolvons l'intégrale au dénominateur dans un calcul qui suit.

Ne pas utiliser

In [133]:
getcontext().prec = 50  

def LSeller_i_test(lambda_d, lambda_s, phi_d, phi_s,delta, T_d_seller, T_d_clone, T_s_seller, T_s_clone, i):

    # numérateur
    numerateur_d_exp =  mp.exp(Decimal(-(phi_d[i] * IDD(delta,lambda_d,T_d_seller[i],T_s_seller[i]))))
    numerateur_d = lambda_d * phi_d[i] * delta * numerateur_d_exp

    numerateur_s_exp = mp.exp(Decimal(-(phi_s[i] * IS(lambda_s,T_s_seller[i]))))
    numerateur_s = lambda_s * phi_s[i] * numerateur_s_exp

    numerateur = numerateur_d * numerateur_s

    # dénominateur 
    def f(t_s):
        exp_1 = mp.exp(Decimal(- phi_d[i] * IDD(delta,lambda_d,tau_contract[i] - tau_birth[i], t_s)))
        exp_2 = mp.exp(Decimal(- phi_d[i] * IDD(delta,lambda_d,tau_end - tau_birth[i],t_s)))
        if phi_d[i]!=0:
            left = exp_1 - exp_2
        else:
            left = 1
        exp_right = mp.exp(Decimal(- phi_s[i] * IS(lambda_s,t_s)))
        if phi_s[i] != 0:
            right = lambda_s * phi_s[i] * exp_right
        else: 
            right = lambda_s * exp_right
        integrande = left * right 
        return integrande 
    
    denominateur = quad(f, 0, 10000)[0]
    
    resultat = numerateur / denominateur
    return resultat


def LClone_i_test(lambda_d, lambda_s, phi_d, phi_s,delta, T_d_seller, T_d_clone, T_s_seller, T_s_clone,i):
    # numérateur
    numerateur_d_exp =  mp.exp(Decimal(-(phi_d[i] * ID(lambda_d,T_d_clone[i]))))
    numerateur_d = lambda_d * phi_d[i] * numerateur_d_exp

    numerateur_s_exp = mp.exp(Decimal(-(phi_s[i] * IS(lambda_s,T_s_clone[i]))))
    numerateur_s = numerateur_s_exp

    numerateur = numerateur_d * numerateur_s

    # dénominateur 
    def f(t_s):
        exp_1 = mp.exp(Decimal(- phi_d[i] * IDD(delta,lambda_d,tau_contract[i] - tau_birth[i], t_s)))
        exp_2 = mp.exp(Decimal(- phi_d[i] * IDD(delta,lambda_d,tau_end - tau_birth[i],t_s)))
        if phi_d[i]!=0:
            left = exp_1 - exp_2
        else:
            left = 1
        exp_right = mp.exp(Decimal(- phi_s[i] * IS(lambda_s,t_s)))
        if phi_s[i] != 0:
            right = lambda_s * phi_s[i] * exp_right
        else: 
            right = lambda_s * exp_right
        integrande = left * right 
        return integrande 

    denominateur = quad(f, 0, 10000)[0]
    
    resultat = numerateur / denominateur
    return resultat

##### Le dénominateur pour les vendeurs peut se réécrire : 

$ \displaystyle  \int _0 ^{+ \infty} \left[e^{-\phi_d(x_i)I_d(\tau_{begin}-\tau_{i,birth},t_s)}-e^{-\phi_d(x_i)I_d(\tau_{end}-\tau_{i,birth},t_s)}\right] \lambda_s \phi_s(x_i) e^{-\phi_s(x_i)I_s(t_s)} dt_s = $ <br>
<br>

$ \displaystyle \int _0 ^{\tau _{begin} - \tau _{i,birth}} \left[e^{- \lambda_d \phi_d(x_i) (t_s + \delta (\tau _{begin} - \tau _{i,birth} - t_s))}-e^{-\lambda_d \phi_d(x_i) (t_s + \delta (\tau _{end} - \tau _{i,birth} - t_s))}\right] \lambda_s \phi_s(x_i) e^{- \lambda _s \phi_s(x_i) t_s} dt_s \space \space \space \space (1)$ <br>
<br>

$ \displaystyle + \int _{\tau _{begin} - \tau _{i,birth}} ^{\tau _{end} - \tau _{i,birth}} \left[e^{- \lambda_d \phi_d(x_i) (\tau _{begin} - \tau _{i,birth})}-e^{-\lambda_d \phi_d(x_i) (t_s + \delta (\tau _{end} - \tau _{i,birth} - t_s))} \right] \lambda_s \phi_s(x_i) e^{- \lambda _s \phi_s(x_i) t_s} dt_s \space \space \space \space (2)$ <br>
<br>

$ \displaystyle + \int _{\tau _{end} - \tau _{i,birth}} ^{+ \infty } \left[e^{-\lambda_d \phi_d(x_i) (\tau _{begin} - \tau _{i,birth})}-e^{-\lambda_d \phi_d(x_i) (\tau _{end} - \tau _{i,birth})}\right] \lambda_s \phi_s(x_i) e^{- \lambda _s \phi_s(x_i) t_s} dt_s \space \space \space \space  (3)$ <br>
<br>
<br>

Le dénominateur pour les clones peut se réécrire : <br>
<br>

$ \displaystyle \int \left[e^{-\phi_d(x_i)I_d(\tau_{contract}-\tau_{i,birth},t_s)}-e^{-\phi_d(x_i)I_d(\tau_{end}-\tau_{i,birth},t_s)}\right] \lambda_s \phi_s(x_i) e^{-\phi_s(x_i)I_s(t_s)} dt_s = $ <br>
<br>

$\displaystyle  \int _0 ^{\tau _{contract} - \tau _{i,birth}} \left[e^{- \lambda_d \phi_d(x_i) (t_s + \delta (\tau _{contract} - \tau _{i,birth} - t_s))}-e^{-\lambda_d \phi_d(x_i) (t_s + \delta (\tau _{end} - \tau _{i,birth} - t_s))}\right] \lambda_s \phi_s(x_i) e^{- \lambda _s \phi_s(x_i) t_s} dt_s \space \space \space \space (1)$ <br>
<br>

$ \displaystyle + \int _{\tau _{contract} - \tau _{i,birth}} ^{\tau _{end} - \tau _{i,birth}} \left[e^{- \lambda_d \phi_d(x_i) (\tau _{contract} - \tau _{i,birth})}-e^{-\lambda_d \phi_d(x_i) (t_s + \delta (\tau _{end} - \tau _{i,birth} - t_s))} \right] \lambda_s \phi_s(x_i) e^{- \lambda _s \phi_s(x_i) t_s} dt_s \space \space \space \space (2)$ <br>
<br>

$\displaystyle  + \int _{\tau _{end} - \tau _{i,birth}} ^{+ \infty } \left[e^{-\lambda_d \phi_d(x_i) (\tau _{contract} - \tau _{i,birth})}-e^{-\lambda_d \phi_d(x_i) (\tau _{end} - \tau _{i,birth})}\right] \lambda_s \phi_s(x_i) e^{- \lambda _s \phi_s(x_i) t_s} dt_s \space \space \space \space  (3)$ 

Calcul pour les vendeurs (nous sautons quelques étapes afin de rendre la lecture plus agréable) : <br>
<br>

$ \displaystyle (1) = \displaystyle \lambda _s \phi _s (x_i) \displaystyle \int _0 ^{\tau _{begin} - \tau _{i,birth}} e^{- \lambda_d \phi_d(x_i) \left[(1 - \delta )t_s + \delta (\tau _{begin} - \tau _{i,birth})\right] - \lambda _s \phi _s (x_i) t_s} dt_s \space -  \space \displaystyle \lambda _s \phi _s (x_i) \displaystyle \int _0 ^{\tau _{begin} - \tau _{i,birth}} e^{- \lambda_d \phi_d(x_i) \left[(1 - \delta )t_s + \delta (\tau _{end} - \tau _{i,birth})\right] - \lambda _s \phi _s (x_i) t_s} dt_s$ <br>
<br>

$ \displaystyle = \displaystyle - \frac{\lambda _s \phi _s (x_i) \left[e^{- (\tau _{begin} - \tau _{i,birth}) ( \lambda _d \phi _d (x_i) + \lambda _s \phi _s (x_i))} - e^{- \lambda _d \phi _d (x_i) \left[ \delta (\tau _{end} - \tau _{i,birth}) + (1 -\delta ) (\tau _{begin} - \tau _{i,birth}) \right] - \lambda _s \phi _s (x_i) (\tau _{begin} - \tau _{i,birth})} \right]}{\lambda _d \phi _d (x_i) (1 - \delta) + \lambda _s \phi _s (x_i)}$ <br>
<br>
<br>


$ \displaystyle (2) = \displaystyle \int _{\tau _{begin} - \tau _{i,birth}} ^{\tau _{end} - \tau _{i,birth}} \left[e^{- \lambda_d \phi_d(x_i) (\tau _{begin} - \tau _{i,birth})}-e^{-\lambda_d \phi_d(x_i) (t_s + \delta (\tau _{end} - \tau _{i,birth} - t_s))} \right] \lambda_s \phi_s(x_i) e^{- \lambda _s \phi_s(x_i) t_s} dt_s $ <br>
<br>

$\displaystyle = \displaystyle e^{- (\tau _{begin} - \tau _{i,birth})(\lambda _d \phi _d (x_i) + \lambda _s \phi _s (x_i))} - \displaystyle e^{ - (\tau _{begin} - \tau _{i,birth}) \lambda _d \phi _d (x_i) - (\tau _{end} - \tau _{i,birth}) \lambda _s \phi _s (x_i)} - $ <br>
<br> 

$\displaystyle \frac{\lambda _s \phi _s (x_i) \left[e^{- \lambda _d \phi _d (x_i) \left[ \delta (\tau _{end} - \tau _{i,birth}) - (1 - \delta )(\tau _{begin} - \tau _{i,birth}) \right] - \lambda _s (\tau _{begin} - \tau _{i,birth}) \phi _s (x_i)} - e^{- (\tau _{end} - \tau _{i,birth})( \lambda _d \phi _d (x_i) + \lambda _s \phi _s (x_i))} \right]}{\lambda _d \phi _d (x_i) (1 - \delta) + \lambda _s \phi _s (x_i)} $ <br>
<br>

$ (3) = \displaystyle e^{- \lambda _d \phi _d (x_i) (\tau _{begin} - \tau _{i,birth}) - \lambda _s \phi _s (x_i) (\tau _{end} - \tau _{i,birth})} - \displaystyle e^{- (\tau _{end} - \tau _{i,birth})(\lambda _d \phi _d (x_i) + \lambda _s \phi _s (x_i))}$

On remplace simplement $ \tau _{begin} $ par $ \tau _{contract}$ pour obtenir l'expression pour les clones ...

In [12]:
def LSeller_i(lambda_d, lambda_s, phi_d, phi_s,delta, seller, i):
    
    # numérateur
    numerateur_d_exp =  np.exp(-(phi_d[i] * IDD(delta,lambda_d,seller['Td'][i],seller['Ts'][i])))
    
    numerateur_d = lambda_d * phi_d[i] * delta * numerateur_d_exp
    
    numerateur_s_exp = np.exp(-(phi_s[i] * IS(lambda_s,seller['Ts'][i])))
    numerateur_s = lambda_s * phi_s[i] * numerateur_s_exp
    
    numerateur = numerateur_d * numerateur_s
    
    # dénominateur 
    s = lambda_s * phi_s[i] 
    d = lambda_d * phi_d[i] 
    t_end = seller['tau_end'][i] - seller['tau_birth'][i]
    t_begin = seller['tau_begin'][i] - seller['tau_birth'][i]
    deno = d * (1 - delta) + s
    

    membre_1 = - (s * (np.exp( - d * (delta * t_end - (1 - delta) * t_begin )) - np.exp(- t_end * (d - s)))) / deno
    
    membre_2 = np.exp( - t_end * (d + s)) - np.exp( - d * t_begin - s * t_end)
    
    membre_3 = np.exp(- d * t_begin - s * t_end) - np.exp( - t_end * (d + s)) - s * (np.exp(- d * (delta * t_end - (1 - delta) * t_begin ) - s * t_begin ) - np.exp( - t_end * (s + d))) / deno
    
    denominateur = membre_1 + membre_2 + membre_3
    
    resultat = numerateur / denominateur

    
    return resultat


def LClone_i(lambda_d, lambda_s, phi_d, phi_s,delta, seller, i):

    # numérateur
    numerateur_d_exp =  np.exp(-(phi_d[i] * IDD(delta,lambda_d,seller['Td_clone'][i],seller['Ts_clone'][i])))
    numerateur_d = lambda_d * phi_d[i] * delta * numerateur_d_exp

    numerateur_s_exp = np.exp(-(phi_s[i] * IS(lambda_s,seller['Ts_clone'][i])))
    numerateur_s = lambda_s * phi_s[i] * numerateur_s_exp

    numerateur = numerateur_d * numerateur_s

    # dénominateur 
    s = lambda_s * phi_s[i] 
    d = lambda_d * phi_d[i] 
    t_end = seller['tau_end'][i] - seller['tau_birth'][i]
    t_begin = seller['tau_begin'][i] - seller['tau_birth'][i]
    deno = d * (1 - delta) + s


    membre_1 = - (s * (np.exp( - d * (delta * t_end - (1 - delta) * t_begin )) - np.exp(- t_end * (d - s)))) / deno
    
    membre_2 = np.exp( - t_end * (d + s)) - np.exp( - d * t_begin - s * t_end)

    membre_3 = np.exp(- d * t_begin - s * t_end) - np.exp( - t_end * (d + s)) - s * (np.exp(- d * (delta * t_end - (1 - delta) * t_begin ) - s * t_begin ) - np.exp( - t_end * (s + d))) / deno
    
    denominateur = membre_1 + membre_2 + membre_3
    
    resultat = numerateur / denominateur
    return resultat

##### Si on souhaite utiliser la log-vraisemblance on peut run les cellules suivantes (en pratique pas utile)


$$ l = \displaystyle \log (\prod _{i=1} ^N L_i ^{seller} . \space L_i ^{clone}) = \displaystyle  (\sum _{i=1} ^N \log (L_i ^{seller}) + \log(L_i ^{clone}))$$

$ \displaystyle \log (L_i ^{seller}) = \displaystyle \log \left[ \lambda_d \phi_d(x_i) \delta e^{-\phi_d(x_i)I_d(t_{id}^{seller},t_{is}^{seller})} \lambda_s \phi_s(x_i) e^{-\phi_s(x_i)I_s(t_{is}^{seller})}\right] - \displaystyle \log \left[ \int \left[e^{-\phi_d(x_i)I_d(\tau_{begin}-\tau_{i,birth},t_s)}-e^{-\phi_d(x_i)I_d(\tau_{end}-\tau_{i,birth},t_s)}\right] \lambda_s \phi_s(x_i) e^{-\phi_s(x_i)I_s(t_s)} dt_s \right] $
<br>
<br>

In [135]:
def log_LSeller_i(lambda_d, lambda_s, phi_d, phi_s,delta, T_d_seller, T_d_clone, T_s_seller, T_s_clone, i):
    
    # numérateur
    numerateur_log = np.log(phi_d[i] * lambda_d * delta * lambda_s * phi_s[i])
    numerateur = numerateur_log - phi_d[i] * IDD(delta,lambda_d,T_d_seller[i],T_s_seller[i]) - phi_s[i] * IS(lambda_s,T_s_seller[i])

    # dénominateur 
    s = lambda_s * phi_s[i] 
    d = lambda_d * phi_d[i] 
    t_end = tau_end - tau_birth[i]
    t_begin = tau_begin - tau_birth[i]
    deno = np.log(d * (1 - delta) + s)
    
    membre_1 = - (s * (np.exp( - d * (delta * t_end - (1 - delta) * t_begin )) - np.exp(- t_end * (d - s)))) / deno
    
    membre_2 = np.exp( - t_end * (d + s)) - np.exp( - d * t_begin - s * t_end)

    membre_3 = np.exp(- d * t_begin - s * t_end) - np.exp( - t_end * (d + s)) - s * (np.exp(- d * (delta * t_end - (1 - delta) * t_begin ) - s * t_begin ) - np.exp( - t_end * (s + d))) / deno
    
    denominateur = np.log(membre_1 + membre_2 + membre_3)
    

    resultat = numerateur - denominateur

    return resultat


def log_LClone_i(lambda_d, lambda_s, phi_d, phi_s,delta, T_d_seller, T_d_clone, T_s_seller, T_s_clone, i):

    # numérateur
    numerateur_log = np.log(phi_d[i] * lambda_d * delta * lambda_s * phi_s[i])
    numerateur = numerateur_log - phi_d[i] * IDD(delta,lambda_d,T_d_seller[i],T_s_seller[i]) - phi_s[i] * IS(lambda_s,T_s_seller[i])

    # dénominateur 
    s = lambda_s * phi_s[i] 
    d = lambda_d * phi_d[i] 
    t_end = tau_end - tau_birth[i]
    t_begin = tau_contract[i] - tau_birth[i]
    deno = np.log(d * (1 - delta) + s)
    
    membre_1 = - (s * (np.exp( - d * (delta * t_end - (1 - delta) * t_begin )) - np.exp(- t_end * (d - s)))) / deno
    
    membre_2 = np.exp( - t_end * (d + s)) - np.exp( - d * t_begin - s * t_end)

    membre_3 = np.exp(- d * t_begin - s * t_end) - np.exp( - t_end * (d + s)) - s * (np.exp(- d * (delta * t_end - (1 - delta) * t_begin ) - s * t_begin ) - np.exp( - t_end * (s + d))) / deno
    
    denominateur = np.log(membre_1 + membre_2 + membre_3)
    

    resultat = numerateur - denominateur

    return resultat

In [136]:
# Définir la log-vraisemblance 

def log_likelihood(parameters):

    # Paramètres à trouver
    # lambda_d, lambda_s et delta des réels 
    # beta_d et beta_s des vecteurs de taille N
    parameters = list(parameters)
    lambda_d = parameters[0]
    lambda_s = parameters[1]
    beta_d = list(parameters[2:10])
    beta_s = list(parameters[10:18])
    delta = parameters[-1]

    phi_d = phiD(beta_d)
    phi_s = phiS(beta_s)
    log_L_seller_vector = []
    log_L_clone_vector = []

    for i in tqdm(seller.index.to_list()): 
        log_L_seller_i = log_LSeller_i(lambda_d, lambda_s, phi_d, phi_s,delta, T_d_seller, T_d_clone, T_s_seller, T_s_clone, i)
        log_L_clone_i = log_LClone_i(lambda_d, lambda_s, phi_d, phi_s,delta, T_d_seller, T_d_clone, T_s_seller, T_s_clone, i)
        log_L_seller_vector.append(log_L_seller_i)
        log_L_clone_vector.append(log_L_clone_i)
            
        

    log_L_seller_vector = np.array(log_L_seller_vector)
    log_L_clone_vector = np.array(log_L_clone_vector)
    L_vector = log_L_seller_vector + log_L_clone_vector
    log_Likelihood = np.sum(L_vector)
    
    return -log_Likelihood # Retourner le négatif de la log_vraisemblance car minimize va minimiser la fonction

##### Cellule de debugage 

In [137]:
lambda_d, lambda_s, phi_d, phi_s,delta, T_d_seller, T_d_clone, T_s_seller, T_s_clone, i = 1.8365724339605265, 4.70236396326959, 16.950167357612912, 1.3241113481683418, 2.474934449942431, -0.9894083280847973, -1.7523798267466055, -2.0961926645937052, -2.0998141170750753, 1


numerateur_d_exp =  np.exp(-(phi_d * IDD(delta,lambda_d,T_d_seller,T_s_seller)))
numerateur_d = lambda_d * phi_d * delta * numerateur_d_exp
    
numerateur_s_exp = np.exp(-(phi_s * IS(lambda_s,T_s_seller)))
numerateur_s = lambda_s * phi_s * numerateur_s_exp
numerateur = numerateur_d * numerateur_s

# dénominateur 
s = lambda_s * phi_s
d = lambda_d * phi_d 
t_end = seller['tau_end'][i] - seller['tau_birth'][i]
t_begin = seller['tau_begin'][i] - seller['tau_birth'][i]
deno = d * (1 - delta) + s
membre_1 = - (s * (np.exp( - d * (delta * t_end - (1 - delta) * t_begin )) - np.exp(- t_end * (d - s)))) / deno
    
membre_2 = np.exp(-t_end * (d + s)) - np.exp(- d * t_begin - s * t_end)

membre_3 = np.exp(- d * t_begin - s * t_end) - np.exp( - t_end * (d + s)) - s * (np.exp(- d * (delta * t_end - (1 - delta) * t_begin ) - s * t_begin ) - np.exp( - t_end * (s + d))) / deno
    
denominateur = membre_1 + membre_2 + membre_3
    

resultat = numerateur / denominateur


  resultat = numerateur / denominateur


##### Passons au calcul de la fonction de vraisemblance : 

$$ L = \displaystyle \prod _{i=1} ^N L_i = \displaystyle \prod _{i=1} ^N L_i ^{seller} . \space L_i ^{clone}$$ 

In [12]:
seller[columns].head()

Unnamed: 0,type_libre,sexe_homme,idf,etranger,une_tete,dec1,dec2,dec3,tau_birth,tau_contract,Td,Ts,Td_clone,Ts_clone,tau_begin,tau_end
0,1,0,0,0,1,0,0,1,-14750,12774,31235,27524,29777,27513,3653,23192
1,0,0,0,1,1,0,0,0,-12643,9645,28235,22288,30652,22278,3653,23192
2,0,1,0,0,1,1,0,0,-20582,12260,34150,32842,33270,32845,3653,23192
3,0,0,0,1,1,0,1,0,-16541,11442,32221,27983,34555,27998,3653,23192
4,0,1,1,0,0,0,1,0,-17541,10777,31075,28318,29516,28332,3653,23192


Les dernière colonnes ont des valeurs trop importantes, c'est pourquoi nous multiplions ces colonnes par $10^{-4}$

In [205]:
seller['tau_birth'] *= 10**-3
seller['tau_contract'] *= 10**-3
seller['Td'] *= 10**-3
seller['Ts'] *= 10**-3
seller['Td_clone'] *= 10**-3
seller['Ts_clone'] *= 10**-3
seller['tau_begin'] *= 10**-3
seller['tau_end'] *= 10**-3

In [13]:
seller[columns].to_csv('Data/df_vraissemblance1.csv')
seller[columns].head()

Unnamed: 0,type_libre,sexe_homme,idf,etranger,une_tete,dec1,dec2,dec3,tau_birth,tau_contract,Td,Ts,Td_clone,Ts_clone,tau_begin,tau_end
0,1,0,0,0,1,0,0,1,-14750,12774,31235,27524,29777,27513,3653,23192
1,0,0,0,1,1,0,0,0,-12643,9645,28235,22288,30652,22278,3653,23192
2,0,1,0,0,1,1,0,0,-20582,12260,34150,32842,33270,32845,3653,23192
3,0,0,0,1,1,0,1,0,-16541,11442,32221,27983,34555,27998,3653,23192
4,0,1,1,0,0,0,1,0,-17541,10777,31075,28318,29516,28332,3653,23192


In [13]:
def log_negatif(x):
    if x > 0: return np.log(x)
    elif x <= 0: return -np.log(-x)

vlog_negatif = np.vectorize(log_negatif)

T_d_seller = seller['Td'].to_list()
T_s_seller = seller['Ts'].to_list()

T_d_clone = seller['Td_clone'].to_list()
T_s_clone = seller['Ts_clone'].to_list()

# Définir la fonction de vraisemblance (à maximiser) 
def likelihood(parameters):

    # Paramètres à trouver
    # lambda_d, lambda_s et delta des réels 
    # beta_d et beta_s des vecteurs de taille 8
    parameters = list(parameters)
    lambda_d = parameters[0]
    lambda_s = parameters[1]
    beta_d = list(parameters[2:10])
    beta_s = list(parameters[10:18])
    delta = parameters[-1]

    phi_d = phiD(beta_d)
    phi_s = phiS(beta_s)
    L_seller_sum = 0
    L_clone_sum = 0

    for i in tqdm(seller.index.to_list()): 
        L_seller_sum = L_seller_sum + np.log(LSeller_i(lambda_d, lambda_s, phi_d, phi_s,delta, seller, i))
        L_clone_sum = L_clone_sum + np.log(LClone_i(lambda_d, lambda_s, phi_d, phi_s,delta, seller, i))

    
    # Log_vraisemblance
    L_1 = np.sum(L_seller_sum)
    L_2 = np.sum(L_clone_sum)
    Likelihood = L_1 + L_2
    
    return -Likelihood # Retourner le négatif de la vraisemblance car minimize va minimiser la fonction

Minimiser l'opposé de la fonction de vraisemblance : 

C'est ici que j'ai un problème ! 

In [None]:
# Initialisation des paramètres

initial_params = np.random.uniform(2,15,size=19)

result = minimize(likelihood, initial_params, method='L-BFGS-B', options={'maxiter':1000, 'disp': True, 'ftol': 1e-1})

# Résultats
estimated_params = result.x
print("Estimated Parameters:", estimated_params)
print("success ? ", result.success)
print(result.message)

In [2]:
import numpy as np 
a = np.random.uniform(1,5, size = 9)
print(a)
print(a[0:6], a[6:])

[3.16692926 1.18563204 4.87009989 1.78924658 4.64425623 1.67880207
 2.50645933 1.71901116 2.77340229]
[3.16692926 1.18563204 4.87009989 1.78924658 4.64425623 1.67880207] [2.50645933 1.71901116 2.77340229]
