# Red Bayesiana para predecir la combinacion de medicamentos mas adecuada en pacientes geriatricos
El objetivo del presente proyecto es poder crear una red Bayesiana, la cual modele probabilisticamente un dominio para predicción de medicamentos para diversas patologias y segun la naturaleza del paciente. 
A continuacion, se muestran algunas de las variables aleatórias involucradas en el dominio

## Variables destinadas a los antecedentes del paciente geriatrico

<b>EP_Insuficiencia_Cardiaca</b>: Background o Antecedentes de enfermedades de los pacientes geriatricos(Presente, Ausente)

<b>EP_Asma_Bronquial</b>: Background o Antecedentes de enfermedades de los pacientes geriatricos. (Presente, Ausente)

<b>EP_Diabetes</b>: Background o Antecedentes de enfermedades de los pacientes geriatricos. (Presente,Ausente)

<b>EP_Gota</b>: Background o Antecedentes de enfermedades de los pacientes geriatricos. (Presente,Ausente)

<b>MP_Ibuprofeno</b>: Background o Antecedentes de los medicamentos que consumen los pacientes geriatricos. (Prescrito,No Prescrito)

## Variables destinadas a los posibles medicamentos a recetar

<b>MR_metropolol</b>: Metropolol (Prescribir Normal, Prescribir condicion Diabetes, No Prescribir)

!!!!<b>MR_hidroclorothiazida</b>: Hidroclorothiazida (Prescribir Normal, Prescribir condicion Diabetes, No Prescribir)

<b>MR_amlodipino</b>: Amlodipino (Prescribir, No Prescribir)

<b>MR_losartan</b>: Losartan (Prescribir, No Prescribir)

<b>MR_enalapril</b>: Enalapril (Prescribir, No Prescribir)

<b>MR_furosemida</b>: Furosemida (Prescribir, No Prescribir)

<b>MR_prazosin</b>: Prazosin (Prescribir, No Prescribir)

<b>MR_verapamilo</b>: Verapamilo (Prescribir, No Prescribir)

<b>MR_propanolol</b>: Propanolol (Prescribir, No Prescribir)

<b>MR_carvedilol</b>: Carvedilol (Prescribir, No Prescribir)


## Variables destinadas a los sintomas y efectos secundarios resultantes

<b>SA_angina_de_pecho</b>: Angina de Pecho (Presente, Ausente)

<b>SA_presion_arterial</b>: Presion arterial (Alta, Normal,Baja)

<b>SA_danho_rinhones</b>: Danho en Rinhones (Presente, Ausente)


In [1]:
from pgmpy.models import BayesianModel
from pgmpy.factors.discrete import TabularCPD
from pgmpy.inference import BeliefPropagation
from pgmpy.factors.discrete import DiscreteFactor

from utils import *
import pandas as pd
import numpy as np



# Creacion de la tabla de verdad que brinda evidencia de los medicamentos hacia algun sintoma



Base: Numero que indica la cantidad a repetirse

Por ejemplo:

- tamanho base 4: [ 1 1 0 0 ]               

- tamanho base 8: [ 1 1 1 1 0 0 0 0]      

- tamanho base 6: [ 2 2 1 1 0 0]       

# Seteo de probabilidades

<b>Combinaciones de 4 a mas medicamentos:</b> La probabilidad de la presencia del sintoma es muy alta

<b>Combinaciones entre 2 a 3:</b> La probabilidad de la ausencia del sintoma variara de acuerdo a la efectividad del medicamento y a la naturaleza del paciente

<b>Solo un medicamento: </b> La probabilidad de la ausencia del sintoma variara de acuerdo a la efectividad del medicamento y a la naturaleza del paciente

# Aplicando lo realizado anteriormente

## Variable Metoprolol

In [2]:
arrStateEvidence    = [2,2,2]
arrVariableEvidence = ['EP_Asma_Bronquial','EP_Diabetes', 'EP_Insuficiencia_Cardiaca']
arrSingleProbabilisticEvidence =[[0,0.10,0.90],[0.20,0.65,0.15],[0.50,0.35,0.15]]
arrStateVarible  = ['Prescribir_Normal', 'Prescribir_Bajas_Dosis', 'No_Prescribir']
arrProbabilistic = [0.00,0.01,0.99]

In [3]:
values_metoprolol = generateProbabilisticList(arrStateEvidence, arrVariableEvidence,arrSingleProbabilisticEvidence,arrStateVarible, arrProbabilistic)

In [None]:
values_metoprolol

## Variable Hidroclorothiazida

** Para el caso de un medicamento hacia una patologia, se debera cambiar la forma con se interactuan**

In [4]:
arrStateEvidence    = [2,2,2]
arrVariableEvidence = ['EP_Diabetes', 'EP_Gota', 'MP_ibuprofeno']
arrSingleProbabilisticEvidence =[[0,0.80,0.20],[0.20,0.70,0.10],[0.05,0.15,0.80]]
arrStateVarible  = ['Prescribir_Normal', 'Prescribir_Bajas_Dosis', 'No_Prescribir']
arrProbabilistic = [0.00,0.01,0.99]

In [5]:
values_hidroclorothiazida = generateProbabilisticList(arrStateEvidence, arrVariableEvidence,arrSingleProbabilisticEvidence,arrStateVarible, arrProbabilistic)

In [None]:
values_hidroclorothiazida

## Variable Angina

In [6]:
arrStateEvidence    = [2,2,3]
arrVariableEvidence = ['MR_amlodipino', 'MR_losartan', 'MR_metropolol']
arrSingleProbabilisticEvidence =[[0.20,0.80],[0.70,0.30],[0.40,0.60]]
arrStateVarible  = ['Presente', 'Ausente']
arrProbabilistic = [0.30,0.70]

In [7]:
values_angina = generateProbabilisticList(arrStateEvidence, arrVariableEvidence,arrSingleProbabilisticEvidence, arrStateVarible, arrProbabilistic)

In [None]:
values_angina

## Variable Presion_Arterial

In [28]:
arrStateEvidence    = [2,2,2,2,2,2,3,2,2,2]
arrVariableEvidence = ['MR_amlodipino','MR_captopril' ,'MR_carvedilol','MR_enalapril','MR_furosemida','MR_losartan','MR_metropolol','MR_prazosin','MR_propanolol','MR_verapamilo']
arrSingleProbabilisticEvidence =[[0.20,0.70,0.10],[0.10,0.80,0.10],[0.05,0.85,0.10],[0.10,0.75,0.15],[0.25,0.75,0.00],[0.10,0.80,0.10],[0.05,0.95,0.00],[0.20,0.75,0.05],[0.15,0.80,0.05],[0.10,0.80,0.10]]
arrStateVarible  = ['Alta','Normal','Baja']
arrProbabilistic = [0.33,0.34,0.33]

In [29]:
values_presion_arterial = generateProbabilisticList(arrStateEvidence, arrVariableEvidence,arrSingleProbabilisticEvidence,arrStateVarible, arrProbabilistic)

In [None]:
print(values_presion_arterial)

## Variable Danho en Rinhones 

In [19]:

arrStateEvidence    = [2,2,2,2,2,2,3,2,2,2]
arrVariableEvidence =           ['MR_amlodipino','MR_captopril','MR_carvedilol','MR_enalapril','MR_furosemida','MR_losartan', 'MR_metropolol','MR_prazosin', 'MR_propanolol','MR_verapamilo']
arrSingleProbabilisticEvidence =[[0.20,0.80]    ,[0.40,0.60]   ,[0.10,0.90]    ,[0.35,0.65]   , [0.30,0.70]   ,[0.32,0.68]  ,[0.25,0.75]     ,[0.30,0.70]  ,  [0.45,0.55]     ,[0.60,0.40]]
arrStateVarible  = ['Presente', 'Ausente']
arrProbabilistic = [0.75,0.25]

In [10]:

arrStateEvidence    = [2,2,2,2,2,3,2,3,2,2,2]
arrVariableEvidence =           ['MR_amlodipino','MR_captopril','MR_carvedilol','MR_enalapril','MR_furosemida','MR_hidroclorothiazida','MR_losartan', 'MR_metropolol','MR_prazosin', 'MR_propanolol','MR_verapamilo']
arrSingleProbabilisticEvidence =[[0.20,0.80]    ,[0.40,0.60]   ,[0.10,0.90]    ,[0.35,0.65]   , [0.30,0.70]   , [0.60,0.40]         ,[0.32,0.68]  ,[0.25,0.75]     ,[0.30,0.70]  ,  [0.45,0.55]     ,[0.60,0.40]]
arrStateVarible  = ['Presente', 'Ausente']
arrProbabilistic = [0.75,0.25]

In [20]:
values_danho_rinhones = generateProbabilisticList(arrStateEvidence, arrVariableEvidence,arrSingleProbabilisticEvidence, arrStateVarible, arrProbabilistic)

In [None]:
print(values_danho_rinhones)

# Creando la estructura de la RB

In [30]:
bn0 = BayesianModel([('EP_Insuficiencia_Cardiaca', 'MR_metropolol'),              
                    ('EP_Asma_Bronquial'         , 'MR_metropolol'), 
                    ('EP_Diabetes'               , 'MR_metropolol'), 
                    ('EP_Diabetes'  , 'MR_hidroclorothiazida'), 
                    ('MP_ibuprofeno', 'MR_hidroclorothiazida'), 
                    ('EP_Gota'      , 'MR_hidroclorothiazida'), 
                    ('MR_metropolol', 'SA_angina_de_pecho'),
                    ('MR_metropolol', 'SA_danho_rinhones'),
                    ('MR_metropolol', 'SA_presion_arterial'),
                    #('MR_hidroclorothiazida', 'SA_danho_rinhones'),
                    #('MR_hidroclorothiazida', 'SA_presion_arterial'),
                    ('MR_amlodipino', 'SA_angina_de_pecho'),
                    ('MR_amlodipino', 'SA_danho_rinhones'),
                    ('MR_amlodipino', 'SA_presion_arterial'),
                    ('MR_losartan'  , 'SA_angina_de_pecho'),
                    ('MR_losartan'  , 'SA_danho_rinhones'),
                    ('MR_losartan'  , 'SA_presion_arterial'),
                    ('MR_enalapril' , 'SA_danho_rinhones'),
                    ('MR_enalapril' , 'SA_presion_arterial'),
                    ('MR_furosemida', 'SA_presion_arterial'),
                    ('MR_furosemida', 'SA_danho_rinhones'),
                    ('MR_prazosin'  , 'SA_presion_arterial'),
                    ('MR_prazosin'  , 'SA_danho_rinhones'),
                    ('MR_verapamilo', 'SA_presion_arterial'),
                    ('MR_verapamilo', 'SA_danho_rinhones'),
                    ('MR_captopril', 'SA_presion_arterial'),
                    ('MR_captopril', 'SA_danho_rinhones'),
                    ('MR_propanolol', 'SA_presion_arterial'),
                    ('MR_propanolol', 'SA_danho_rinhones'),
                    ('MR_carvedilol', 'SA_presion_arterial'),
                    ('MR_carvedilol', 'SA_danho_rinhones')
                    ])

# Definiendo los parametros del modelo (CPTs)
En pgmpy las columnas son los valores de los padres (evidencias) y las filas son los estados de las variables 

In [31]:
#Antecendentes de los pacientes geriatricos

cpt_Insuficiencia_Cardiaca = TabularCPD('EP_Insuficiencia_Cardiaca', 2, [[0.5], [0.5]])
cpt_Asma_Bronquial = TabularCPD('EP_Asma_Bronquial', 2, [[0.5], [0.5]])
cpt_Diabetes= TabularCPD('EP_Diabetes', 2,[[0.5], [0.5]])
cpt_Ibuprofeno= TabularCPD('MP_ibuprofeno',2, [[0.5], [0.5]])
cpt_Gota= TabularCPD('EP_Gota', 2, [[0.5], [0.5]])

In [32]:
#Medicamentos a recetar

cpt_metoprolol = TabularCPD('MR_metropolol', 3, values_metoprolol, evidence= ['EP_Asma_Bronquial','EP_Diabetes','EP_Insuficiencia_Cardiaca'],evidence_card=[2,2,2])
cpt_hidroclorothiazida = TabularCPD('MR_hidroclorothiazida', 3,values_hidroclorothiazida,evidence=['EP_Diabetes','EP_Gota','MP_ibuprofeno'],evidence_card=[2,2,2])
cpt_amlodipino = TabularCPD('MR_amlodipino', 2,[[0.5], [0.5]])
cpt_losartan   = TabularCPD('MR_losartan'  , 2,[[0.5], [0.5]])
cpt_enalapril  = TabularCPD('MR_enalapril' , 2,[[0.5], [0.5]])
cpt_furosemida = TabularCPD('MR_furosemida', 2,[[0.5], [0.5]])
cpt_prazosin   = TabularCPD('MR_prazosin'  , 2,[[0.5], [0.5]])
cpt_verapamilo = TabularCPD('MR_verapamilo', 2,[[0.5], [0.5]])
cpt_captopril  = TabularCPD('MR_captopril' , 2,[[0.5], [0.5]])
cpt_propanolol = TabularCPD('MR_propanolol', 2,[[0.5], [0.5]])
cpt_carvedilol = TabularCPD('MR_carvedilol', 2,[[0.5], [0.5]])



In [33]:
#Sintomas resultantes
cpt_angina_pecho     = TabularCPD('SA_angina_de_pecho' ,2,values_angina    ,['MR_amlodipino','MR_losartan','MR_metropolol'], [2,2,3])
cpt_danho_rinhones   = TabularCPD('SA_danho_rinhones'  ,2,values_danho_rinhones  ,['MR_amlodipino','MR_enalapril','MR_captopril' ,'MR_carvedilol','MR_furosemida','MR_losartan','MR_metropolol','MR_prazosin','MR_propanolol','MR_verapamilo'],[2,2,2,2,2,2,3,2,2,2])
cpt_presion_arterial = TabularCPD('SA_presion_arterial',3,values_presion_arterial,['MR_amlodipino','MR_enalapril','MR_captopril' ,'MR_carvedilol','MR_furosemida','MR_losartan','MR_metropolol','MR_prazosin','MR_propanolol','MR_verapamilo'],[2,2,2,2,2,2,3,2,2,2])

## Asociando los CPTs con la estructura del modelo


In [34]:
bn0.add_cpds(cpt_Insuficiencia_Cardiaca, cpt_Asma_Bronquial, cpt_Diabetes, cpt_Ibuprofeno, cpt_Gota,
             cpt_metoprolol, cpt_amlodipino,  cpt_hidroclorothiazida,cpt_enalapril,cpt_furosemida, cpt_losartan ,cpt_propanolol,
             cpt_prazosin, cpt_verapamilo, cpt_captopril,cpt_carvedilol, cpt_angina_pecho, cpt_danho_rinhones, cpt_presion_arterial)

## Chequeando consistencia de la Red Bayesiana
Chequea que todos los CPTs sean válidos para el modelo

In [35]:
bn0.check_model()

True

## Haciendo inferencias en la RB con algoritmo BeliefPropagation


Vamos a preguntar a la RB con el algoritmo ** VariableElimination ** Cuál es la distribucion de "B" (Burglary) habiendo obsevado que "J" y "M" son true (John y Mary llaman)  

In [18]:
type(bn0)

pgmpy.models.BayesianModel.BayesianModel

In [67]:
bp = BeliefPropagation(bn0)

In [42]:
bp.calibrate()

In [68]:
phi = bp.query(variables=['SA_danho_rinhones','SA_presion_arterial'], 
                            evidence={'EP_Insuficiencia_Cardiaca':1, 'EP_Asma_Bronquial':1, 'EP_Diabetes':1, 
                                      'MR_metropolol':1, 'MR_amlodipino':0,'MR_enalapril':0,'MR_captopril':0,
                                      'MR_carvedilol':0,'MR_furosemida': 0,'MR_hidroclorothiazida':0,'MR_losartan':0,
                                      'MR_prazosin':0,'MR_propanolol':0,'MR_verapamilo':0})

In [50]:
array =phi['SA_presion_arterial'].values

In [80]:
array[0]

0.33000000000000002

In [None]:
def formSingleProbability(arrState, arrProbability):
    probability_string=""
    dicc = {}
    for idx,val in enumerate(arrState):
        dicc[val] = [arrProbability[idx]]
    return dicc

In [76]:
print(createEvidence({'MR_metropolol':1, 'MR_amlodipino':0,'MR_enalapril':0},{'EP_Insuficiencia_Cardiaca':1}))

{'EP_Insuficiencia_Cardiaca': 1, 'MR_metropolol': 1, 'MR_amlodipino': 0, 'MR_enalapril': 0}


In [75]:
def createEvidence(dicc1, dicc2):
    evidence = dicc1.copy()
    evidence.update(dicc2)
    return evidence

In [96]:
#Le paso la red bayesiana o ya propagada?
#bp = beliefPropagation(bn)
#arrProb es el arreglo de la probabilidad de ausencia del sintoma o efecto resultante

def fitnessFunction(diccBackground, diccMedicines, arrSymtopm, arrEfects, arrWeight,bp):

    mergeSymEff = arrSymtopm + arrEfects
    evidence = createEvidence(diccBackground,diccMedicines)   
    phi = bp.query(variables=mergeSymEff, evidence = evidence)
    sumAbsen = 0
    sumTotal = 0
    for i,val in enumerate(mergeSymEff):
        arrProb = phi[val].values
        large = len(arrProb)
        sumAbsen += arrProb[large-1]*arrWeight[i]
        sumTotal += 1*arrWeight[i]
    score = sumAbsen / sumTotal
    return score
    #Se busca maximizar la ausencia
           

In [97]:
score = fitnessFunction({'EP_Insuficiencia_Cardiaca':0},{'MR_metropolol':1, 'MR_amlodipino':0,'MR_enalapril':0},
                 ['SA_presion_arterial','SA_angina_de_pecho'],['SA_danho_rinhones'],[1,1,1],bp )