<h1 style="color:red; text-align:center; text-decoration:underline;">R√©seaux bay√©siens</h1>

<h2 style="color:green; text-decoration:underline;">Test 1 : D√©cision m√©t√©o (prendre un parapluie)</h2>

Ce test simule une prise de d√©cision face √† l‚Äôincertitude m√©t√©orologique. Un r√©seau bay√©sien mod√©lise la probabilit√© qu‚Äôil pleuve en fonction de certaines observations telles que la m√©t√©o pr√©vue ou l‚Äô√©tat du ciel. L‚Äôobjectif est de d√©terminer s‚Äôil faut emporter un parapluie ou non, en mettant √† jour automatiquement les probabilit√©s avec la r√®gle de Bayes.

In [6]:
from pgmpy.models import DiscreteBayesianNetwork
from pgmpy.factors.discrete import TabularCPD
from pgmpy.inference import VariableElimination

# 1. D√©finir la structure du graphe
model = DiscreteBayesianNetwork([
    ('Cloudy', 'Rain'),
    ('Rain', 'Report'),
    ('Rain', 'Umbrella')
])

# 2. D√©finir les CPDs (probabilit√©s conditionnelles)

# P(Cloudy)
cpd_cloudy = TabularCPD(
    variable='Cloudy', variable_card=2,
    values=[[0.5], [0.5]],
    state_names={'Cloudy': ['Non', 'Oui']}
)

# P(Rain | Cloudy)
cpd_rain = TabularCPD(
    variable='Rain', variable_card=2,
    values=[[0.8, 0.2],  # Rain = Non
            [0.2, 0.8]], # Rain = Oui
    evidence=['Cloudy'],
    evidence_card=[2],
    state_names={'Rain': ['Non', 'Oui'], 'Cloudy': ['Non', 'Oui']}
)

# P(Report | Rain)
cpd_report = TabularCPD(
    variable='Report', variable_card=2,
    values=[[0.9, 0.1],  # Report = Non
            [0.1, 0.9]], # Report = Oui
    evidence=['Rain'],
    evidence_card=[2],
    state_names={'Report': ['Non', 'Oui'], 'Rain': ['Non', 'Oui']}
)

# P(Umbrella | Rain)
cpd_umbrella = TabularCPD(
    variable='Umbrella', variable_card=2,
    values=[[0.05, 0.95],  # Umbrella = Non
            [0.95, 0.05]], # Umbrella = Oui
    evidence=['Rain'],
    evidence_card=[2],
    state_names={'Umbrella': ['Non', 'Oui'], 'Rain': ['Non', 'Oui']}
)

# 3. Ajouter les CPDs au mod√®le
model.add_cpds(cpd_cloudy, cpd_rain, cpd_report, cpd_umbrella)

# 4. V√©rifier la validit√© du mod√®le
assert model.check_model()

# 5. Inf√©rence
infer = VariableElimination(model)

# üîç Cas 1 : La m√©t√©o dit qu'il va pleuvoir (Report = Oui)
print("üîé Cas 1 : Report = Oui (pr√©vision m√©t√©o)")
result1 = infer.query(variables=['Umbrella'], evidence={'Report': 'Oui'})
print(result1)

# üîç Cas 2 : Le ciel est nuageux (Cloudy = Oui)
print("\nüîé Cas 2 : Cloudy = Oui (le ciel est gris)")
result2 = infer.query(variables=['Umbrella'], evidence={'Cloudy': 'Oui'})
print(result2)

# üîç Cas 3 : Report = Oui ET Cloudy = Oui
print("\nüîé Cas 3 : Report = Oui ET Cloudy = Oui")
result3 = infer.query(variables=['Umbrella'], evidence={'Report': 'Oui', 'Cloudy': 'Oui'})
print(result3)

# üîç Cas 4 : Aucun indice (aucune √©vidence) ‚Üí proba globale
print("\nüîé Cas 4 : Aucun indice (probabilit√© globale d‚Äôavoir un parapluie)")
result4 = infer.query(variables=['Umbrella'])
print(result4)


üîé Cas 1 : Report = Oui (pr√©vision m√©t√©o)
+---------------+-----------------+
| Umbrella      |   phi(Umbrella) |
| Umbrella(Non) |          0.8600 |
+---------------+-----------------+
| Umbrella(Oui) |          0.1400 |
+---------------+-----------------+

üîé Cas 2 : Cloudy = Oui (le ciel est gris)
+---------------+-----------------+
| Umbrella      |   phi(Umbrella) |
| Umbrella(Non) |          0.7700 |
+---------------+-----------------+
| Umbrella(Oui) |          0.2300 |
+---------------+-----------------+

üîé Cas 3 : Report = Oui ET Cloudy = Oui
+---------------+-----------------+
| Umbrella      |   phi(Umbrella) |
| Umbrella(Non) |          0.9257 |
+---------------+-----------------+
| Umbrella(Oui) |          0.0743 |
+---------------+-----------------+

üîé Cas 4 : Aucun indice (probabilit√© globale d‚Äôavoir un parapluie)
+---------------+-----------------+
| Umbrella      |   phi(Umbrella) |
| Umbrella(Non) |          0.5000 |
+---------------+-----------------+

<h2 style="color:#0056b3; text-decoration:underline;">R√©sultats</h2>
Dans ce premier test, un r√©seau bay√©sien a √©t√© utilis√© pour mod√©liser une situation de d√©cision incertaine : faut-il emporter un parapluie ou non ?  
Le mod√®le int√®gre divers facteurs contextuels, tels que la m√©t√©o et l‚Äô√©tat du ciel, et met √† jour automatiquement les probabilit√©s √† l‚Äôaide de la r√®gle de Bayes d√®s qu‚Äôune information devient disponible (par exemple, un ciel nuageux).  
Ce type de raisonnement probabiliste permet d‚Äôaboutir √† une d√©cision rationnelle m√™me en pr√©sence d‚Äôinformations incompl√®tes ou incertaines.  
Il s‚Äôagit d‚Äôune approche particuli√®rement pertinente dans des domaines comme la m√©decine, les pr√©visions m√©t√©orologiques ou l‚Äôintelligence artificielle d√©cisionnelle.

<h2 style="color:green; text-decoration:underline;">Test 2 : D√©tection d'intrusion r√©seau</h2>

Ce sc√©nario mod√©lise un syst√®me intelligent de cybers√©curit√©. Le r√©seau bay√©sien √©value la probabilit√© d‚Äôune attaque en fonction de sympt√¥mes observ√©s comme une surcharge CPU, des erreurs de connexion ou un trafic inhabituel. Le syst√®me met √† jour ses estimations automatiquement selon les observations disponibles, m√™me si certaines donn√©es sont incompl√®tes.

In [7]:
from pgmpy.models import DiscreteBayesianNetwork
from pgmpy.factors.discrete import TabularCPD
from pgmpy.inference import VariableElimination

# 1. D√©finition de la structure du r√©seau bay√©sien
model = DiscreteBayesianNetwork([
    ('Intrusion', 'FailedLogin'),
    ('Intrusion', 'HighTraffic'),
    ('Intrusion', 'CpuOverload'),
    ('FailedLogin', 'OffHoursActivity')
])

# 2. D√©finition des tables de probabilit√©s conditionnelles (CPD)

cpd_intrusion = TabularCPD(
    variable='Intrusion', variable_card=2,
    values=[[0.95], [0.05]],
    state_names={'Intrusion': ['Non', 'Oui']}
)

cpd_failedlogin = TabularCPD(
    variable='FailedLogin', variable_card=2,
    values=[[0.8, 0.15], [0.2, 0.85]],
    evidence=['Intrusion'],
    evidence_card=[2],
    state_names={'FailedLogin': ['Non', 'Oui'], 'Intrusion': ['Non', 'Oui']}
)

cpd_hightraffic = TabularCPD(
    variable='HighTraffic', variable_card=2,
    values=[[0.7, 0.1], [0.3, 0.9]],
    evidence=['Intrusion'],
    evidence_card=[2],
    state_names={'HighTraffic': ['Non', 'Oui'], 'Intrusion': ['Non', 'Oui']}
)

cpd_cpuoverload = TabularCPD(
    variable='CpuOverload', variable_card=2,
    values=[[0.85, 0.25], [0.15, 0.75]],
    evidence=['Intrusion'],
    evidence_card=[2],
    state_names={'CpuOverload': ['Non', 'Oui'], 'Intrusion': ['Non', 'Oui']}
)

cpd_offhours = TabularCPD(
    variable='OffHoursActivity', variable_card=2,
    values=[[0.6, 0.35], [0.4, 0.65]],
    evidence=['FailedLogin'],
    evidence_card=[2],
    state_names={'OffHoursActivity': ['Non', 'Oui'], 'FailedLogin': ['Non', 'Oui']}
)

# 3. Ajout des CPDs au mod√®le
model.add_cpds(cpd_intrusion, cpd_failedlogin, cpd_hightraffic, cpd_cpuoverload, cpd_offhours)

# 4. V√©rification de la validit√© du mod√®le
assert model.check_model()

# 5. Inf√©rence
infer = VariableElimination(model)

# 6. Cas d‚Äôanalyse avec commentaires explicatifs

print("\nüîç Cas 1 : CpuOverload = Oui (seulement surcharge du CPU)")
print(infer.query(variables=['Intrusion'], evidence={'CpuOverload': 'Oui'}))

print("\nüîç Cas 2 : FailedLogin = Oui et OffHoursActivity = Oui")
print(infer.query(variables=['Intrusion'], evidence={'FailedLogin': 'Oui', 'OffHoursActivity': 'Oui'}))

print("\nüîç Cas 3 : HighTraffic = Oui et CpuOverload = Oui")
print(infer.query(variables=['Intrusion'], evidence={'HighTraffic': 'Oui', 'CpuOverload': 'Oui'}))

print("\nüîç Cas 4 : Tous les sympt√¥mes activ√©s")
print(infer.query(variables=['Intrusion'], evidence={
    'FailedLogin': 'Oui',
    'HighTraffic': 'Oui',
    'CpuOverload': 'Oui',
    'OffHoursActivity': 'Oui'
}))

print("\nüîç Cas 5 : Aucun sympt√¥me observ√© (probabilit√© a priori)")
print(infer.query(variables=['Intrusion']))



üîç Cas 1 : CpuOverload = Oui (seulement surcharge du CPU)
+----------------+------------------+
| Intrusion      |   phi(Intrusion) |
| Intrusion(Non) |           0.7917 |
+----------------+------------------+
| Intrusion(Oui) |           0.2083 |
+----------------+------------------+

üîç Cas 2 : FailedLogin = Oui et OffHoursActivity = Oui
+----------------+------------------+
| Intrusion      |   phi(Intrusion) |
| Intrusion(Non) |           0.8172 |
+----------------+------------------+
| Intrusion(Oui) |           0.1828 |
+----------------+------------------+

üîç Cas 3 : HighTraffic = Oui et CpuOverload = Oui
+----------------+------------------+
| Intrusion      |   phi(Intrusion) |
| Intrusion(Non) |           0.5588 |
+----------------+------------------+
| Intrusion(Oui) |           0.4412 |
+----------------+------------------+

üîç Cas 4 : Tous les sympt√¥mes activ√©s
+----------------+------------------+
| Intrusion      |   phi(Intrusion) |
| Intrusion(Non) |       

<h2 style="color:#0056b3; text-decoration:underline;">R√©sultats</h2>
Le second test repose sur la mod√©lisation d‚Äôun syst√®me de d√©tection d‚Äôintrusion √† l‚Äôaide d‚Äôun r√©seau bay√©sien.  
√Ä partir d‚Äôobservations concr√®tes (surcharge CPU, √©checs de connexion, trafic anormal), le mod√®le calcule la probabilit√© d‚Äôun comportement malveillant en cours.  
Les variables sont reli√©es par des liens causaux, permettant au mod√®le d‚Äôajuster dynamiquement ses estimations en fonction des donn√©es observ√©es.  
Ce type de mod√©lisation probabiliste est particuli√®rement adapt√© aux syst√®mes de s√©curit√© intelligents, car il conserve son efficacit√© m√™me en pr√©sence de donn√©es incompl√®tes ou bruit√©es.