In [2]:
from collections import defaultdict, Counter
import itertools
import math
import random

class BayesNet(object):
    "Bayesian network: a graph of variables connected by parent links."
     
    def __init__(self): 
        self.variables = [] # List of variables, in parent-first topological sort order
        self.lookup = {}    # Mapping of {variable_name: variable} pairs
            
    def add(self, name, parentnames, cpt):
        "Add a new Variable to the BayesNet. Parentnames must have been added previously."
        parents = [self.lookup[name] for name in parentnames]
        var = Variable(name, cpt, parents)
        self.variables.append(var)
        self.lookup[name] = var
        return self
    
class Variable(object):
    "A discrete random variable; conditional on zero or more parent Variables."
    
    def __init__(self, name, cpt, parents=()):
        "A variable has a name, list of parent variables, and a Conditional Probability Table."
        self.__name__ = name
        self.parents  = parents
        self.cpt      = CPTable(cpt, parents)
        self.domain   = set(itertools.chain(*self.cpt.values())) # All the outcomes in the CPT
                
    def __repr__(self): return self.__name__
    
class Factor(dict): "An {outcome: frequency} mapping."

class ProbDist(Factor):
    """A Probability Distribution is an {outcome: probability} mapping. 
    The values are normalized to sum to 1.
    ProbDist(0.75) is an abbreviation for ProbDist({T: 0.75, F: 0.25})."""
    def __init__(self, mapping=(), **kwargs):
        if isinstance(mapping, float):
            mapping = {T: mapping, F: 1 - mapping}
        self.update(mapping, **kwargs)
        normalize(self)
        
class Evidence(dict): 
    "A {variable: value} mapping, describing what we know for sure."
        
class CPTable(dict):
    "A mapping of {row: ProbDist, ...} where each row is a tuple of values of the parent variables."
    
    def __init__(self, mapping, parents=()):
        """Provides two shortcuts for writing a Conditional Probability Table. 
        With no parents, CPTable(dist) means CPTable({(): dist}).
        With one parent, CPTable({val: dist,...}) means CPTable({(val,): dist,...})."""
        if len(parents) == 0 and not (isinstance(mapping, dict) and set(mapping.keys()) == {()}):
            mapping = {(): mapping}
        for (row, dist) in mapping.items():
            if len(parents) == 1 and not isinstance(row, tuple): 
                row = (row,)
            self[row] = ProbDist(dist)

class Bool(int):
    "Just like `bool`, except values display as 'T' and 'F' instead of 'True' and 'False'"
    __str__ = __repr__ = lambda self: 'T' if self else 'F'
        
T = Bool(True)
F = Bool(False)

In [3]:
def P(var, evidence={}):
    "The probability distribution for P(variable | evidence), when all parent variables are known (in evidence)."
    row = tuple(evidence[parent] for parent in var.parents)
    return var.cpt[row]

def normalize(dist):
    "Normalize a {key: value} distribution so values sum to 1.0. Mutates dist and returns it."
    total = sum(dist.values())
    for key in dist:
        dist[key] = dist[key] / total
        assert 0 <= dist[key] <= 1, "Probabilities must be between 0 and 1."
    return dist

def sample(probdist):
    "Randomly sample an outcome from a probability distribution."
    r = random.random() # r is a random point in the probability distribution
    c = 0.0             # c is the cumulative probability of outcomes seen so far
    for outcome in probdist:
        c += probdist[outcome]
        if r <= c:
            return outcome
        
def globalize(mapping):
    "Given a {name: value} mapping, export all the names to the `globals()` namespace."
    globals().update(mapping)

In [4]:
def joint_distribution(net):
    "Given a Bayes net, create the joint distribution over all variables."
    return ProbDist({row: prod(P_xi_given_parents(var, row, net)
                               for var in net.variables)
                     for row in all_rows(net)})

def all_rows(net): return itertools.product(*[var.domain for var in net.variables])

def P_xi_given_parents(var, row, net):
    "The probability that var = xi, given the values in this row."
    dist = P(var, Evidence(zip(net.variables, row)))
    xi = row[net.variables.index(var)]
    return dist[xi]

def prod(numbers):
    "The product of numbers: prod([2, 3, 5]) == 30. Analogous to `sum([2, 3, 5]) == 10`."
    result = 1
    for x in numbers:
        result *= x
    return result

In [5]:
def enumeration_ask(X, evidence, net):
    "The probability distribution for query variable X in a belief net, given evidence."
    i    = net.variables.index(X) # The index of the query variable X in the row
    dist = defaultdict(float)     # The resulting probability distribution over X
    for (row, p) in joint_distribution(net).items():
        if matches_evidence(row, evidence, net):
            dist[row[i]] += p
    return ProbDist(dist)

def matches_evidence(row, evidence, net):
    "Does the tuple of values for this row agree with the evidence?"
    return all(evidence[v] == row[net.variables.index(v)]
               for v in evidence)

In [11]:
#stworzenie sieci Bayesa
net = BayesNet()
net.add('zarobki', [], {'małe': 0.5, 'umiarkowane': 0.3, 'wysokie': 0.1})
net.add('wiek', [], {'młodociany': 0.3, 'dorosły': 0.3, 'starszy': 0.1})
net.add("aktualny_dług", [], {"mały": 0.5, "średni": 0.3, "duży": 0.1})
net.add("kwota_kredytu", ["zarobki", "wiek", "aktualny_dług"], {
  ("małe", "młodociany", "duży"): 0.1,  
  ("małe", "starszy", "średni"): 0.3,
  ("umiarkowane", "młodociany", "duży"): 0.5,
  ("małe", "dorosły", "duży"): 0.3,
  ("małe", "młodociany", "duży"): 0.2,
  ("umiarkowane", "dorosły", "duży"): 0.3,
  ("małe", "młodociany", "średni"): 0.2,
  ("małe", "dorosły", "średni"): 0.3,
  ("umiarkowane", "starszy", "duży"): 0.4,
  ("małe", "młodociany", "duży"): 0.5,
  ("umiarkowane", "dorosły", "średni"): 0.6,
  ("małe", "młodociany", "średni"): 0.7,
  ("małe", "dorosły", "średni"): 0.4,
  ("umiarkowane", "młodociany", "średni"): 0.3,
  ("umiarkowane", "dorosły", "średni"): 0.2,
  ("małe", "młodociany", "duży"): 0.2,
  ("małe", "dorosły", "duży"): 0.1,
  ("małe", "starszy", "mały"): 0.1,
})

<__main__.BayesNet at 0x1c3b37159c0>

In [10]:
globalize(net.lookup)
print("Losowe prawdopodobieństwo wieku:", sample(P(wiek)))
print("Losowe prawdopodobieństwo wieku:", sample(P(wiek)))
print("Losowe prawdopodobieństwo wieku:", sample(P(wiek)))
print("Losowe prawdopodobieństwo wieku:", sample(P(wiek)))
print("Rozkład probabilistyczny dla wieku:", P(wiek))
print(kwota_kredytu.cpt)

Losowe prawdopodobieństwo wieku: dorosły
Losowe prawdopodobieństwo wieku: starszy
Losowe prawdopodobieństwo wieku: dorosły
Losowe prawdopodobieństwo wieku: młodociany
Rozkład probabilistyczny dla wieku: {'młodociany': 0.4285714285714286, 'dorosły': 0.4285714285714286, 'starszy': 0.14285714285714288}
{('małe', 'młodociany', 'duży'): {T: 0.2, F: 0.8}, ('małe', 'starszy', 'średni'): {T: 0.3, F: 0.7}, ('umiarkowane', 'młodociany', 'duży'): {T: 0.5, F: 0.5}, ('małe', 'dorosły', 'duży'): {T: 0.1, F: 0.9}, ('umiarkowane', 'dorosły', 'duży'): {T: 0.3, F: 0.7}, ('małe', 'młodociany', 'średni'): {T: 0.7, F: 0.30000000000000004}, ('małe', 'dorosły', 'średni'): {T: 0.4, F: 0.6}, ('umiarkowane', 'starszy', 'duży'): {T: 0.4, F: 0.6}, ('umiarkowane', 'dorosły', 'średni'): {T: 0.2, F: 0.8}, ('umiarkowane', 'młodociany', 'średni'): {T: 0.3, F: 0.7}, ('małe', 'starszy', 'mały'): {T: 0.1, F: 0.9}}


In [12]:
set(all_rows(net)) #połączenie wszystkich rzędów w celu pokazania dystrybucji

{('małe', 'dorosły', 'duży', F),
 ('małe', 'dorosły', 'duży', T),
 ('małe', 'dorosły', 'mały', F),
 ('małe', 'dorosły', 'mały', T),
 ('małe', 'dorosły', 'średni', F),
 ('małe', 'dorosły', 'średni', T),
 ('małe', 'młodociany', 'duży', F),
 ('małe', 'młodociany', 'duży', T),
 ('małe', 'młodociany', 'mały', F),
 ('małe', 'młodociany', 'mały', T),
 ('małe', 'młodociany', 'średni', F),
 ('małe', 'młodociany', 'średni', T),
 ('małe', 'starszy', 'duży', F),
 ('małe', 'starszy', 'duży', T),
 ('małe', 'starszy', 'mały', F),
 ('małe', 'starszy', 'mały', T),
 ('małe', 'starszy', 'średni', F),
 ('małe', 'starszy', 'średni', T),
 ('umiarkowane', 'dorosły', 'duży', F),
 ('umiarkowane', 'dorosły', 'duży', T),
 ('umiarkowane', 'dorosły', 'mały', F),
 ('umiarkowane', 'dorosły', 'mały', T),
 ('umiarkowane', 'dorosły', 'średni', F),
 ('umiarkowane', 'dorosły', 'średni', T),
 ('umiarkowane', 'młodociany', 'duży', F),
 ('umiarkowane', 'młodociany', 'duży', T),
 ('umiarkowane', 'młodociany', 'mały', F),
 ('

In [15]:
P_xi_given_parents(kwota_kredytu, ('umiarkowane', 'dorosły', 'duży', F), net)

KeyError: zarobki

In [18]:
evidence = {zarobki: "wysokie", wiek: "dorosły"}
result = enumeration_ask(kwota_kredytu, evidence, net)

ValueError: kwota_kredytu is not in list

Stworzyć własną sieć Bayesa wraz z wnioskowaniem dla zagadnienia:
1. Decyzja o nadanie kredytu finansowego
2. Decyzja o złożeniu ezgaminu zawierającego dwie częsci
3. Decyzja o warunkach pogodowych odpowiednich dla gry w piłkę nożną
4. Decyzja o diagnozie choroby na podstawie danych ECG i USG
5. Decyzja o nadanie kredytu finansowego
6. Decyzja o złożeniu ezgaminu zawierającego dwie częsci
7. Decyzja o warunkach pogodowych odpowiednich dla gry w piłkę nożną
8. Decyzja o diagnozie choroby na podstawie danych ECG i USG
9. Decyzja o nadanie kredytu finansowego
10. Decyzja o złożeniu ezgaminu zawierającego dwie częsci
11. Decyzja o warunkach pogodowych odpowiednich dla gry w piłkę nożną
12. Decyzja o diagnozie choroby na podstawie danych ECG i USG
