<a href="https://colab.research.google.com/github/marquinamaria/UCB_MDSv4_ML/blob/main/Bayesian_Belief_Networks.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Publicacion que propuso el Algoritmo

- Bouckaert, R. R. (1995). Bayesian Belief Networks: From Construction to Inference. PhD thesis, Utrecht University, The Netherlands.

- Properties of Bayesian Belief Network Learning Algorithms. arXiv:1302.6792 [cs.AI]. https://doi.org/10.48550/arXiv.1302.6792

- A Bayesian Method for Constructing Bayesian Belief Networks from Databases. (2013). arXiv:1303.5714 [cs.AI]. https://doi.org/10.48550/arXiv.1303.5714


# Breve Explicacion de como funciona

El algoritmo de Bayesian Belief Networks se utiliza para modelar relaciones probabilísticas entre variables en un grafo dirigido acíclico (DAG). Estas redes capturan la dependencia condicional entre las variables, lo que significa que una variable puede depender de una o varias otras en función de las relaciones especificadas en el modelo. Aquí se explica cómo funciona el algoritmo en términos generales:

1. **Definición de la Estructura**:

    El primer paso es definir la estructura de la red bayesiana, que consta de nodos y arcos. Cada nodo representa una variable aleatoria, y los arcos indican las relaciones de dependencia entre estas variables. La estructura se puede especificar a priori o aprender a partir de datos observacionales.

2. **Asignación de Probabilidades Iniciales**:
    
    Para cada nodo en la red, se asignan probabilidades iniciales que representan la probabilidad marginal de cada valor que puede tomar la variable en ese nodo. Estas son las probabilidades antes de observar cualquier evidencia.

3. **Estimación de Probabilidades Condicionales**:
    
    El paso más crítico en la construcción de una Bayesian Belief Network es la estimación de las probabilidades condicionales. Esto implica calcular la probabilidad de que una variable tome un valor dado, dado el valor de sus nodos padres en el grafo. Se pueden utilizar varios métodos para estimar estas probabilidades, como el estimador de máxima verosimilitud o el estimador de máxima verosimilitud bayesiana.

4.  **Inferencia**:
    
    Una vez que se ha construido la red y se han estimado las probabilidades, se puede utilizar para hacer inferencias. La inferencia implica calcular la distribución de probabilidad posterior de una o más variables en función de la evidencia observada. Esto se hace utilizando el Teorema de Bayes y el concepto de propagación de probabilidades a lo largo de los arcos en la red.

    4.1 **Inferencia exacta**:
    
    Algunos algoritmos, como el algoritmo de eliminación de variables (Variable Elimination) o el algoritmo de retropropagación de creencias (Belief Propagation), pueden calcular la distribución posterior de manera exacta. Sin embargo, estos algoritmos pueden ser costosos computacionalmente para redes grandes.

    4.2 **Inferencia aproximada**:
    
    Para redes más grandes o complejas, se pueden utilizar métodos de inferencia aproximada, como el muestreo de Monte Carlo Markov Chain (MCMC) o la propagación de creencias aproximada, para aproximar la distribución posterior.

## Tipos de Entrada
## Casos de Uso

1. **Diagnóstico Médico**:

    En medicina, se pueden utilizar para diagnosticar enfermedades a partir de síntomas y resultados de pruebas médicas. Cada síntoma o prueba puede considerarse como un nodo en la red, y las probabilidades condicionales modelarán cómo estos indicadores están relacionados con diferentes enfermedades.

2. **Evaluación de Riesgos y Seguros**:

    Las Bayesian Belief Networks se utilizan para evaluar y gestionar riesgos en la industria de seguros. Pueden ayudar a calcular la probabilidad de que ocurra un evento asegurado (como un accidente automovilístico) en función de diversos factores, como la edad del conductor, el historial de conducción, las condiciones climáticas, etc.
3. **Análisis de Sentimientos**:

    En procesamiento de lenguaje natural, se pueden utilizar para el análisis de sentimientos. Los nodos representarían palabras o características del texto, y las conexiones modelarían cómo estas palabras afectan la polaridad del sentimiento (positivo, negativo, neutral) del texto.

4. **Predicción del Comportamiento del Consumidor**:

    En marketing y comercio electrónico, se pueden emplear para predecir el comportamiento de los consumidores en función de su historial de compras, comportamiento en línea, preferencias y otros factores relevantes.

5. **Detección de Fraude**:

    Las Bayesian Belief Networks son útiles en la detección de fraudes financieros, donde los nodos representan transacciones o comportamientos sospechosos, y las relaciones modelan cómo se relacionan estos comportamientos con la probabilidad de fraude.

6. **Mantenimiento Predictivo**:

    En la industria, se pueden utilizar para predecir cuándo es más probable que se produzca una falla en una máquina o equipo en función de factores como el tiempo de funcionamiento, la temperatura y otros indicadores.

7. **Biología y Genética**:

    En biología y genética, se pueden utilizar para modelar la relación entre diferentes genes y fenotipos (características observables). Ayudan en la identificación de genes que pueden estar relacionados con enfermedades hereditarias.

8. **Control de Calidad y Procesos Industriales**:

    En la manufactura, las Bayesian Belief Networks pueden usarse para monitorear y controlar la calidad de los productos en función de variables como la temperatura, la presión, la humedad, etc.

9. **Planificación y Toma de Decisiones**:

    En general, las Bayesian Belief Networks pueden ser valiosas en situaciones de toma de decisiones donde se deben considerar múltiples factores y existe incertidumbre. Pueden ayudar a evaluar diferentes escenarios y sus probabilidades para tomar decisiones informadas.

10. **Predicción del Tiempo**:

    En meteorología, estas redes pueden utilizarse para modelar la probabilidad de diferentes condiciones climáticas en función de observaciones meteorológicas y datos históricos.

# Source Code

In [60]:
!chmod 600 /root/.kaggle/kaggle.json

In [61]:
!kaggle competitions download -c titanic --force

Downloading titanic.zip to /content
  0% 0.00/34.1k [00:00<?, ?B/s]
100% 34.1k/34.1k [00:00<00:00, 39.2MB/s]


In [62]:
!unzip titanic.zip

Archive:  titanic.zip
replace gender_submission.csv? [y]es, [n]o, [A]ll, [N]one, [r]ename: 

In [63]:
import pandas as pd

In [64]:
df = pd.read_csv('train.csv')
df.head()

Unnamed: 0,PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
0,1,0,3,"Braund, Mr. Owen Harris",male,22.0,1,0,A/5 21171,7.25,,S
1,2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Th...",female,38.0,1,0,PC 17599,71.2833,C85,C
2,3,1,3,"Heikkinen, Miss. Laina",female,26.0,0,0,STON/O2. 3101282,7.925,,S
3,4,1,1,"Futrelle, Mrs. Jacques Heath (Lily May Peel)",female,35.0,1,0,113803,53.1,C123,S
4,5,0,3,"Allen, Mr. William Henry",male,35.0,0,0,373450,8.05,,S


In [65]:
df.shape

(891, 12)

In [66]:
df.dtypes

PassengerId      int64
Survived         int64
Pclass           int64
Name            object
Sex             object
Age            float64
SibSp            int64
Parch            int64
Ticket          object
Fare           float64
Cabin           object
Embarked        object
dtype: object

In [67]:
df.isnull().sum()

PassengerId      0
Survived         0
Pclass           0
Name             0
Sex              0
Age            177
SibSp            0
Parch            0
Ticket           0
Fare             0
Cabin          687
Embarked         2
dtype: int64

In [68]:
df.describe()

Unnamed: 0,PassengerId,Survived,Pclass,Age,SibSp,Parch,Fare
count,891.0,891.0,891.0,714.0,891.0,891.0,891.0
mean,446.0,0.383838,2.308642,29.699118,0.523008,0.381594,32.204208
std,257.353842,0.486592,0.836071,14.526497,1.102743,0.806057,49.693429
min,1.0,0.0,1.0,0.42,0.0,0.0,0.0
25%,223.5,0.0,2.0,20.125,0.0,0.0,7.9104
50%,446.0,0.0,3.0,28.0,0.0,0.0,14.4542
75%,668.5,1.0,3.0,38.0,1.0,0.0,31.0
max,891.0,1.0,3.0,80.0,8.0,6.0,512.3292


In [69]:
# from sklearn.preprocessing import LabelEncoder
# labelencoder= LabelEncoder()
# df['Sex'] = labelencoder.fit_transform(df['Sex'])

In [70]:
# df.dtypes

In [71]:
!pip install pgmpy



In [72]:
import pandas as pd
from pgmpy.models import BayesianNetwork
from pgmpy.estimators import ParameterEstimator
from pgmpy.estimators import MaximumLikelihoodEstimator

In [73]:
model = BayesianNetwork()

In [74]:
# Definir las variables y sus estados
model.add_nodes_from(['Pclass', 'Sex', 'Age', 'Survived'])

In [75]:
# Definir las relaciones de dependencia
model.add_edge('Pclass', 'Survived')
model.add_edge('Sex', 'Survived')
model.add_edge('Age', 'Survived')

In [76]:
# Estimar los parámetros (probabilidades condicionales) del modelo
pe = ParameterEstimator(model, df)

In [77]:
print("\n", pe.state_counts('Pclass'))  # unconditional
print("\n", pe.state_counts('Survived'))  # conditional on Pclass, Sex and Age


    Pclass
1     158
2      15
3      10

 Age       0.42                                0.67                    ...  \
Pclass        1           2           3           1           2       ...   
Sex      female male female male female male female male female male  ...   
Survived                                                              ...   
0           0.0  0.0    0.0  0.0    0.0  0.0    0.0  0.0    0.0  0.0  ...   
1           0.0  0.0    0.0  0.0    0.0  0.0    0.0  0.0    0.0  0.0  ...   

Age       74.00                   80.00                               
Pclass        2           3           1           2           3       
Sex      female male female male female male female male female male  
Survived                                                              
0           0.0  0.0    0.0  0.0    0.0  0.0    0.0  0.0    0.0  0.0  
1           0.0  0.0    0.0  0.0    0.0  1.0    0.0  0.0    0.0  0.0  

[2 rows x 528 columns]


In [78]:
from pgmpy.estimators import MaximumLikelihoodEstimator
mle = MaximumLikelihoodEstimator(model, df)
print(mle.estimate_cpd('Pclass'))  # unconditional
print(mle.estimate_cpd('Survived'))  # conditional

+-----------+-----------+
| Pclass(1) | 0.863388  |
+-----------+-----------+
| Pclass(2) | 0.0819672 |
+-----------+-----------+
| Pclass(3) | 0.0546448 |
+-----------+-----------+
+-------------+-------------+-----+-------------+-----------+
| Age         | Age(0.42)   | ... | Age(80.0)   | Age(80.0) |
+-------------+-------------+-----+-------------+-----------+
| Pclass      | Pclass(1)   | ... | Pclass(3)   | Pclass(3) |
+-------------+-------------+-----+-------------+-----------+
| Sex         | Sex(female) | ... | Sex(female) | Sex(male) |
+-------------+-------------+-----+-------------+-----------+
| Survived(0) | 0.5         | ... | 0.5         | 0.5       |
+-------------+-------------+-----+-------------+-----------+
| Survived(1) | 0.5         | ... | 0.5         | 0.5       |
+-------------+-------------+-----+-------------+-----------+


In [79]:
# Calibrate all CPDs of `model` using MLE:
model.fit(df, estimator=MaximumLikelihoodEstimator)

In [80]:
# Realizar inferencias en el modelo (por ejemplo, predecir la supervivencia)
from pgmpy.inference import VariableElimination
inference = VariableElimination(model)
predicted_survival = inference.query(variables=['Survived'], evidence={'Pclass': 1, 'Sex': 'female', 'Age': 25})
print(predicted_survival)

+-------------+-----------------+
| Survived    |   phi(Survived) |
| Survived(0) |          1.0000 |
+-------------+-----------------+
| Survived(1) |          0.0000 |
+-------------+-----------------+
