In [1]:
import numpy as np
import pandas as pd
from pgmpy.estimators import MaximumLikelihoodEstimator
from pgmpy.models import BayesianModel
from pgmpy.inference import VariableElimination

In [4]:
#attributes = ['age', 'sex', 'cp', 'trestbps', 'chol', 'fbs', 'restecg', 'thalach', 'exang', 'oldpeak', 'slope', 'ca', 'thal', 'heartdisease']

heartDisease = pd.read_csv('HeartDisease.csv')#, names = attributes)
heartDisease = heartDisease.replace('?', np.nan)

print('Few examples from the dataset are given below')
print(heartDisease.head())


model = BayesianModel([('age', 'trestbps'), ('age', 'fbs'), ('sex','trestbps'), ('sex','trestbps'), ('exang', 'trestbps'), ('trestbps', 'heartdisease'), ('fbs', 'heartdisease'), ('heartdisease', 'restecg'), ('heartdisease', 'restecg'), ('heartdisease', 'thalach'), ('heartdisease', 'chol')])

print('\nLearning conditional probability distributions using maximum likelihood estimators..')
model.fit(heartDisease, estimator = MaximumLikelihoodEstimator)

Few examples from the dataset are given below
   age  sex  cp  trestbps  chol  fbs  restecg  thalach  exang  oldpeak  slope  \
0   63    1   1       145   233    1        2      150      0      2.3      3   
1   67    1   4       160   286    0        2      108      1      1.5      2   
2   67    1   4       120   229    0        2      129      1      2.6      2   
3   37    1   3       130   250    0        0      187      0      3.5      3   
4   41    0   2       130   204    0        2      172      0      1.4      1   

  ca thal  heartdisease  
0  0    6             0  
1  3    3             2  
2  2    7             1  
3  0    3             0  
4  0    3             0  

Learning conditional probability distributions using maximum likelihood estimators..


In [5]:
print(model.nodes())
model.get_cpds()

['age', 'trestbps', 'fbs', 'sex', 'exang', 'heartdisease', 'restecg', 'thalach', 'chol']


[<TabularCPD representing P(age:41) at 0x234f7b2b2b0>,
 <TabularCPD representing P(chol:152 | heartdisease:5) at 0x234f7aa9d68>,
 <TabularCPD representing P(exang:2) at 0x234f7aa9dd8>,
 <TabularCPD representing P(fbs:2 | age:41) at 0x234f7b1bb00>,
 <TabularCPD representing P(heartdisease:5 | fbs:2, trestbps:50) at 0x234f7aa9da0>,
 <TabularCPD representing P(restecg:3 | heartdisease:5) at 0x234f7aa9e80>,
 <TabularCPD representing P(sex:2) at 0x234f7b1bac8>,
 <TabularCPD representing P(thalach:91 | heartdisease:5) at 0x234f7b36a20>,
 <TabularCPD representing P(trestbps:50 | age:41, exang:2, sex:2) at 0x234f7b2cd68>]

In [6]:
print(model.get_cpds('age'))

╒═════════╤════════════╕
│ age(29) │ 0.003367   │
├─────────┼────────────┤
│ age(34) │ 0.00673401 │
├─────────┼────────────┤
│ age(35) │ 0.013468   │
├─────────┼────────────┤
│ age(37) │ 0.00673401 │
├─────────┼────────────┤
│ age(38) │ 0.003367   │
├─────────┼────────────┤
│ age(39) │ 0.013468   │
├─────────┼────────────┤
│ age(40) │ 0.010101   │
├─────────┼────────────┤
│ age(41) │ 0.03367    │
├─────────┼────────────┤
│ age(42) │ 0.026936   │
├─────────┼────────────┤
│ age(43) │ 0.023569   │
├─────────┼────────────┤
│ age(44) │ 0.037037   │
├─────────┼────────────┤
│ age(45) │ 0.026936   │
├─────────┼────────────┤
│ age(46) │ 0.023569   │
├─────────┼────────────┤
│ age(47) │ 0.016835   │
├─────────┼────────────┤
│ age(48) │ 0.023569   │
├─────────┼────────────┤
│ age(49) │ 0.016835   │
├─────────┼────────────┤
│ age(50) │ 0.023569   │
├─────────┼────────────┤
│ age(51) │ 0.040404   │
├─────────┼────────────┤
│ age(52) │ 0.037037   │
├─────────┼────────────┤
│ age(53) │ 0.023569   │


In [7]:
print(model.get_cpds('heartdisease'))

╒═════════════════╤══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═════════════════════╤════════════════════╤═══════════════╤═══════════════╤═══════════════╤═════════════════════╤═════════════════════╤═══════════════╤═══════════════╤═══════════════╤═════════════════════╤═══════════════╤═══════════════╤═══════════════╤═════════════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═════════════════════╤════════════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═════════════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤════════════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤═══════════════╤══════════════

In [8]:
print('\nInferencing with Bayesian Network: ')
HeartDisease_infer = VariableElimination(model)
print('\nComputing the probability of heart disease given age = 28')

q = HeartDisease_infer.query(variables = ['heartdisease'], evidence = {'age': 28})

print(q['heartdisease'])
print('\nComputing the probability of heart disease given chol = 100')

q = HeartDisease_infer.query(variables = ['heartdisease'], evidence = {'chol': 100})
print(q['heartdisease'])


Inferencing with Bayesian Network: 

Computing the probability of heart disease given age = 28


  phi1.values = phi1.values[slice_]
  phi.values = phi.values[slice_]


╒════════════════╤═════════════════════╕
│ heartdisease   │   phi(heartdisease) │
╞════════════════╪═════════════════════╡
│ heartdisease_0 │              0.6791 │
├────────────────┼─────────────────────┤
│ heartdisease_1 │              0.1212 │
├────────────────┼─────────────────────┤
│ heartdisease_2 │              0.0810 │
├────────────────┼─────────────────────┤
│ heartdisease_3 │              0.0939 │
├────────────────┼─────────────────────┤
│ heartdisease_4 │              0.0247 │
╘════════════════╧═════════════════════╛

Computing the probability of heart disease given chol = 100
╒════════════════╤═════════════════════╕
│ heartdisease   │   phi(heartdisease) │
╞════════════════╪═════════════════════╡
│ heartdisease_0 │              0.5400 │
├────────────────┼─────────────────────┤
│ heartdisease_1 │              0.1533 │
├────────────────┼─────────────────────┤
│ heartdisease_2 │              0.1303 │
├────────────────┼─────────────────────┤
│ heartdisease_3 │              0.125