In [1]:
from IPython.core.display import HTML

HTML("<style>" + open("style.css").read() + "</style>")

<div class="headline">
Grundlagen künstlicher Intelligenz
<br><br>
Sommersemester 2019
</div>
<br>
<div class="description">
    Übung zum Thema <i id="topic">"Uncertainty"</i>
    <br><br>
    Deadline Abgabe: <i #id="submission">Freitag, XX.X.2019 (23:55 Uhr)</i>
</div>

## Präsenzübung

* https://github.com/norvig/pytudes/blob/master/ipynb/Probability.ipynb

In [None]:
import itertools
import random

from math import factorial
from fractions import Fraction

def cross(A, B):
    "The set of ways of concatenating one item from collection A with one from B."
    return {a + b 
            for a in A for b in B}

def combos(items, n):
    "All combinations of n items; each combo as a concatenated str."
    return {' '.join(combo) 
            for combo in itertools.combinations(items, n)}
            
def P(event, space): 
    "The probability of an event, given a sample space of equiprobable outcomes."
    return Fraction(len(event & space), 
                    len(space))

def printProb(event, space):
    prob = len(event & space) / len(space)
    print("P: {:.5f}".format(prob))

def choose(n, c):
    "Number of ways to choose c items from a list of n items."
    return factorial(n) // (factorial(n - c) * factorial(c))

### Event Space

<div class="task_description">
    <i class="task">Task 6.1:</i>
Eine Urne enthält 23 Bälle: 8 weiße, 6 blaue und 9 rote. Wir wählen sechs Bälle zufällig aus (jede Auswahl ist gleich wahrscheinlich). Schreiben Sie Python-Methoden für folgendes: <br>
</div>

*An urn contains 23 balls: 8 white, 6 blue, and 9 red. We select six balls at random (each possible selection is equally likely). Write Python-methods for the following:*

*Task 6.1.1:* Wie würde der Sample Space fomalisiert werden und was ist dessen Größe? <br>
*How would the sample space be formalized and what is its size?*



<strong style="color: blue">Lösung:</strong>

In [None]:
urn = cross('W', '12345678') | cross('B', '123456') | cross('R', '123456789') 
print("Balls in urn: " + str(len(urn)))
print(urn)

In [None]:
sampleSpace = combos(urn, 6)
print("Sample Space size: " + str(len(sampleSpace)))

In [None]:
print("A random sample: ")
print(*random.sample(sampleSpace, 10), sep="\n")

*Task 6.1.2:* Wie viele Möglichkeiten gibt es, sechs rote Bälle zu ziehen? <br>
*How many ways of getting 6 red balls are there?*

<strong style="color: blue">Lösung:</strong>

In [None]:
red6 = {s for s in sampleSpace if s.count('R') == 6}
print("How many ways of getting 6 red balls are there?")
print(len(red6))

Wie ist die Wahrscheinlichkeit jeder dieser Möglichen Ergebnisse? <br>
*What is the probability of each of these possible outcomes:* <br><br>
*Task 6.1.3:* Wahrscheinlichkeit, dass alle Bälle rot sind <br>*Probability of all balls being red*

<strong style="color: blue">Lösung:</strong>

In [None]:
print("Probability of selecting 6 red balls:")
print(P(red6, sampleSpace))
#or
#probabilty of 6 red balls is 9 choose 6 divided by the size of the sample space
print(Fraction(choose(9, 6), len(sampleSpace)))
printProb(red6, sampleSpace)

*Task 6.1.4:* Wahrscheinlichkeit drei blauer, zwei weißer und eines roten Balls <br>
*Probability of 3 blue, 2 white, and 1 red ball*

<strong style="color: blue">Lösung:</strong>

In [None]:
print("Probability of 3 blue, 2 white, and 1 red?")
b3w2r1 = {s for s in sampleSpace if s.count('B') == 3 and s.count('W') == 2 and s.count('R') == 1}
print(P(b3w2r1, sampleSpace))
Fraction(choose(6, 3) * choose(8, 2) * choose(9, 1), len(sampleSpace))
printProb(b3w2r1, sampleSpace)

*Task 6.1.5:* Wahrscheinlichkeit von mindestens vier weißen Bällen <br>
*Probability of at least 4 white balls*

<strong style="color: blue">Lösung:</strong>

In [None]:
print("Probability of at least 4 white balls")
atLeast4 = {s for s in sampleSpace if s.count('W') >= 4}
P(atLeast4, sampleSpace)
printProb(atLeast4, sampleSpace)

<div class="task_description">
    <i class="task">Task 6.2:</i>
    Das Beispiel aus der Vorlesung mit 5 Würfeln: <br>*Lecture example with 5 dice*
</div> 

In [None]:
D = {"1", "2", "3", "4", "5", "6"}
five_dice = cross(cross(cross(cross(D, D), D), D), D)
print(len(five_dice))

sumGreater15 = {roll for roll in five_dice if sum(int(dice) for dice in roll) > 15}

print(P(sumGreater15, five_dice))
printProb(sumGreater15, five_dice)

<div class="task_description">
    <i class="task">Task 6.3:</i>
Anna und Otto würfeln jeweils ein Mal mit zwei Würfeln. Anna sagt: „Dass ich mindestens auf einem Würfel
eine 4 habe ist wahrscheinlicher als dass du eine Summe von 9 oder höher würfelst."<br>
Hat Anna Recht?<br>
</div>

*Anna and Otto both dice once with two dice. Anna says: "That I have a 4 on at least one die is more likely than you dicing a sum of 9 or higher."<br>
Is Anna right?*<br>

*Task 6.3.1:* Definieren Sie zuerst den Sample Space. (*Define the sample space first*)

<strong style="color: blue">Lösung:</strong>

In [None]:
# {1,2,3,4,5,6} x {1,2,3,4,5,6} --> {11,12,13,14,15,16,...,66}
two_dice = cross(D, D)
random.sample(two_dice, 5)

*Task 6.3.2:* Definieren Sie nun den Event Space für beide Ereignisse. (*Now define the event space for both events*)<br>

<strong style="color: blue">Lösung:</strong>

In [None]:
# mindestens eine 4: {x4,4x} bzw. {14,24,34,41,42,43,44,45,46,54,64} also 11/36 
# 9 oder höher: {xy} mit x + y ≈ 9 bzw. {36,45,46,54,55,56,63,64,65,66,} also 10/36.

atLeastOne4 = {roll for roll in two_dice if roll.count('4') >= 1}
sumGreater9 = {roll for roll in two_dice if sum(int(dice) for dice in roll) >= 9}

print(P(atLeastOne4, two_dice))
printProb(atLeastOne4, two_dice)
print(P(sumGreater9, two_dice))
printProb(sumGreater9, two_dice)

<strong style="color: blue">Lösung:</strong> <br>
Anna hat Recht.


*Task 6.3.3:* Schreiben Sie Python-Code für folgende Problemstellung: Nun soll dreimal gewürfelt werden. Ist die Wahrscheinlichkeit dass Anna genau eine drei und mindestens eine fünf würfelt größer als dass Otto eine Summe von 9 würfelt? Gehen Sie schrittweise vor. Definieren Sie zunächst, wie Sie den Sample Space repräsentieren wollen. Entwickeln Sie nun Methoden, um den Event Space zu erfassen. <br><br>
*Write Python-methods for the following problem: Now the dice should roll three times. Is the probability that Anna rolls exactly one three and a five at least once higher than the probabilty that Otto rolls a sum of 9? Proceed step by step. First, define how you want to represent the sample space. Now develop methods to capture the event space.*

<strong style="color: blue">Lösung:</strong>

In [None]:
# sample space
three_dice = cross(cross(D,D), D) 
print(random.sample(three_dice, 3))

# mind. 2x eine 4
threeAndFive = {roll for roll in three_dice if roll.count('3') == 1 and roll.count('5') >= 1}
sum9 = {roll for roll in three_dice if sum(int(dice) for dice in roll) == 9}

print(P(threeAndFive, three_dice))
printProb(threeAndFive, three_dice)

print(P(sum9, three_dice))
printProb(sum9, three_dice)

<strong style="color: blue">Lösung:</strong> <br>
Die Wahrscheinlichkeit, dass Anna genau eine drei und mindestens eine fünf würfelt ist größer.


*Task 6.3.4:* Nun wollen Anna und Otto nachdem sie jeweils zwei Mal gewürfelt haben noch zwei Mal eine Münze werfen und dann erneut zwei Würfel werfen. Nennen Sie drei Beispiele, die im Sample Space enthalten sind. <br>
*Now Anna and Otto want to throw a coin twice after dicing twice, and then throw two more dice. Give three examples that are included in the sample space.*

<strong style="color: blue">Lösung:</strong>

In [None]:
# {14HH65}, {51TH25}, {11TH34}
C = {"H", "T"} 
coin = cross(C,C)
diceAndCoin = {a+b+c for a in two_dice for b in coin for c in two_dice}
random.sample(diceAndCoin, 3)


*Task 6.3.5:* Wie sähe im gleichen Schema jetzt der Event Space für „mindestens ein Mal Zahl“ aus? Irrelevante Stellen können als X bezeichnet werden. <br>*In the same scheme, what would the event space look like for "at least once number"? Irrelevant places can be called X.*

<strong style="color: blue">Lösung:</strong>

In [None]:
# {XXXZXX, XXZXXX}

atLeastOne ={a+b+c for a in two_dice for b in coin for c in two_dice if b!='HH'}
random.sample(atLeastOne, 3)

<div class="task_description">
    <i class="task">Task 6.4:</i>
    
Beim Spiel Schnick Schnack Schnuck wählen zwei Spieler je eins der drei möglichen Symbole Schere, Stein
oder Papier und zeigen dieses dann auf ein Kommando gleichzeitig mit ihrer Hand an. Das Ergebnis wird wie folgt
bewertet: Die Schere schneidet das Papier (Schere gewinnt), das Papier wickelt den Stein ein (Papier gewinnt), und der Stein macht die Schere stumpf (Stein gewinnt). Entscheiden sich beide Spieler für dasselbe Symbol, wird das Spiel als unentschieden gewertet und wiederholt. <br><br>
*In the game rock-paper-scissors two players each choose one of the three possible symbols scissors, stone
and paper and then, on a command, simultaneously display it with their hand. The result will be rated as follows: The scissors cut the paper (scissors win), the paper wraps the stone (paper wins), and the stone makes the scissors dull (stone wins). If both players decide for the same symbol, the game is counted as a tie and repeated.*</div>

*Task 6.4.1:* Bestimmen Sie den Sample Space für Schnick Schnack Schnuck. <br>
*Determine the sample space for rock-paper-scissors.*

<strong style="color: blue">Lösung:</strong>

In [None]:
# rock / paper / scissors
move = {"r", "p", "s"}
rps = cross(move, move)
print(rps)

*Task 6.4.2:* Wie hoch ist die Wahrscheinlichkeit zu gewinnen wenn ich (Spieler 1) Stein wähle? <br>
*What is the probability of winning if I (player 1) choose stone?*

<strong style="color: blue">Lösung:</strong>

In [None]:
stoneMoves = {move for move in rps if move.startswith("r")}
print(stoneMoves)
print(P({"rs"}, stoneMoves))

*Task 6.4.3:* Wie hoch ist die Wahrscheinlichkeit nicht zu verlieren wenn ich Stein wähle? <br>
*What is the probability of not losing when I choose stone?*

<strong style="color: blue">Lösung:</strong>

In [None]:
print(P({"rr", "rp"}, stoneMoves))

*Task 6.4.4:* Spielen Sie 15 Mal mit einem Partner und notieren Sie die Ergebnisse. Wie häufig werden die einzelnen Symbole gewählt?  <br>
*Play with a partner 15 times and record the results. How often are the individual symbols chosen?*

*Task 6.4.5:*
In offiziellen Statistiken bei Wettbewerben hat sich gezeigt, dass Schere mit einer Wahrscheinlichkeit von 0.296 gewählt wird. Wie hoch ist die Wahrscheinlichkeit für Schere in Ihrer Spielserie?<br><br>
*In official statistics at competitions it has been shown that scissors are chosen with a probability of 0.296. What is the probability of scissors in your game series?*

*Task 6.4.6:* In einer Variante gibt es noch das zusätzliche Symbol Brunnen. Brunnen verliert gegen Papier und gewinnt gegen Schere und Stein. Wie verändern sich dadurch die Gewinnwahrscheinlichkeiten? Mit welchem Symbol ist die Wahrscheinlichkeit zu verlieren höher? <br><br>
*In one variant, there is the additional symbol well. Well loses against paper and wins against scissors and stone. How does this change the chances of winning? With which symbol is the probability of losing higher?*

<strong style="color: blue">Lösung:</strong>

In [None]:
move_ext = {"r", "p", "s", "w"}
rpsw = cross(move_ext, move_ext)
print(rpsw)

print("Ich verliere mit Schere:  ", P({"sw", "sr"}, rpsw))
print("Ich verliere mit Stein:   ", P({"rw", "rp"}, rpsw))
print("Ich verliere mit Papier:  ", P({"ps"}, rpsw))
print("Ich verliere mit Brunnen: ", P({"wp"}, rpsw))



### Bedingte Wahrscheinlichkeit

<div class="task_description">
    <i class="task">Task 6.5:</i>
In der Statistik-Vorlesung im letzten Semester gab es zwei Klausuren: eine Midtermklausur und eine am
Ende des Semesters. 42% der Studentinnen und Studenten haben die Midtermklausur bestanden. 25% haben beide
Klausuren bestanden. Wie viel Prozent von denen die die erste Klausur bestanden haben, haben ebenfalls die zweite
bestanden?<br>
</div>

*In the statistics lecture last semester, there were two exams: a midterm exam and one at the end of the semester. 42% of the students passed the midterm exam. 25% have passed both exams. What percentage of those who passed the first exam also passed the second?*

<strong style="color: blue">Lösung:</strong>

In [None]:
# Multiplication rule: P(A,B) = P(B|A) * P(A)

P_A = 0.42 
P_AB = 0.25
P_BcA = P_AB / P_A 
print(P_BcA)

<div class="task_description">
    <i class="task">Task 6.6:</i>
    
Ein HIV-Test gibt mit 98% ein positives Ergebnis zurück, wenn der Patient tatsächlich von HIV betroffen ist, während er mit 99% ein negatives Ergebnis liefert, wenn der Patient nicht von HIV betroffen ist. Nehmen wir an, Sie gehören zu einer Gruppe mit niedrigem Risiko und haben eine prior probability für eine HIV-Infektion von 0,1%. Sie erhalten ein positives Testergebnis. <br>
Wie wahrscheinlich ist es, dass Sie HIV haben? <br><br>
*An HIV test gives a positive result with probability 98% when the patient is indeed affected by HIV, while it
gives a negative result with 99% probability when the patient is not affected by HIV. Let’s assume that you belong to a low-risk group and have a prior probability of getting infected with HIV of 0.1%. You receive a positive test result.<br>
How likely is it that you have HIV?*
 </div>

<strong style="color: blue">Lösung:</strong>

In [None]:
#prior probabilities
P_hiv = 0.001 
P_nohiv = 1 - P_hiv

P_pos_C_hiv = 0.98
P_neg_C_hiv = 0.02


P_neg_C_nohiv = 0.99 
P_pos_C_nohiv = 0.01

P_pos = ((P_pos_C_hiv * P_hiv) + (P_pos_C_nohiv * P_nohiv))
print(P_pos)

P_hiv_C_pos = (P_pos_C_hiv * P_hiv) / P_pos
print(P_hiv_C_pos)

<strong style="color: blue">Lösung:</strong><br>
In probabilistic terms, we can formulate the problem as follows:<br> <br>
$P(positive|HIV) = 0.98$  <br>
$P(positive|NOHIV) = 1 – 0.99 = 0.01$<br>
$P(HIV) = 0.001$<br>
$P(NOHIV) = 1 – 0.001 = 0.999$<br><br>
Furthermore, the unconditional probability of being found positive can be derived using the law of total probability:<br>
$P(positive) = P(positive|HIV)P(HIV) + P(positive|NOHIV)P(NOHIV)$
$= 0.98 ≈ 0.001 + 0.01 ≈ 0.999$<br>
$= 0.00098 + 0.00999$<br>
$= 0.01097$<br><br>

Therefore, Bayes’ rule gives:<br><br>
$P(HIV|positive) = \frac{P(positive|HIV)P(HIV)}{P(positive)} $<br><br>
$= \frac{0.98 * 0.001}{0.01097} $ <br><br>
$= \frac{0.00098}{0.01097}≈ 0.08933 $ <br><br>


Therefore, even if the test is conditionally very accurate, the unconditional probability of being affected by HIV when
found positive is less than 10%!



<div class="task_description">
    <i class="task">Task 6.7:</i>

Es werden zwei Runden Schnick Schnack Schnuck gespielt (Schere, Stein, Papier, Brunnen). 
</div>

<strong style="color: blue">Lösung:</strong>

In [None]:
from collections import Counter

move = {"r", "p", "s" , "w"}
won = {"rs","pr","pw","sp","wr","ws"}
rpsw = cross(cross(cross(move,move),move),move)

*Task 6.7.1:* Wie ist die Wahrscheinlichkeit, dass ich (Spieler1) beide Spiele gewinne?

<strong style="color: blue">Lösung:</strong>

In [None]:
winBoth = {a for a in rpsw for b in won for c in won if a==b+c}
print("Chances for winning both:", P(winBoth, rpsw))

*Task 6.7.2:*
Wie ist die Wahrscheinlichkeit, dass auch die zweite Runde zu gewinnen, wenn ich bereits die erste gewonnen habe?

<strong style="color: blue">Lösung:</strong>

In [None]:
rpswWonFirst = {a for a in rpsw for b in won if a.startswith(b)}
winSecond = {a for a in rpswWonFirst for b in won for c in won if a==b+c}
print("Chances for winning the second round after winning the first:", P(winSecond, rpswWonFirst))

*Task 6.7.3:* Mit welcher Wahl von Symbolen gewinne ich am wahrscheinlichsten beide Runden?

<strong style="color: blue">Lösung:</strong>

In [None]:
best = []
for e in winBoth:
    best.append((e[0],e[2]))

print(Counter(best))

## Hausübung

__Achtung:__ Wenn Sie nur die Wahrscheinlichkeiten angeben ohne den Code dazu, gibt es 0 Punkte.
Wenn Sie nicht wissen, wie Sie anfangen sollen, gehen Sie am besten schrittweise vor: Versuchen Sie zunächst den
Sample Space zu repräsentieren. Entwickeln Sie dann Methoden, die den Event Space ermitteln. Anhand von Sample
Space und Event Space können Sie dann die Wahrscheinlichkeit berechnen.
<br>
*__Attention:__ If you only specify the probabilities without the code, you get 0 points.
If you do not know how to get started, it is best to do it step by step: try to represent the sample space. Then develop methods that determine the event space. Based on sample space and event space you can then calculate the probability.*

<div class="task_description">
    <i class="task">Homework 6.1:</i>
        ::: 2 Hausaufgabenpunkte :::</div>
        
Es gibt eine Variante von Schnick Schnack Schnuck, die durch die Serie Big Bang Theory bekannt geworden ist (siehe Abb. 2.). In dieser Variante gibt es 5 Symbole: Schere, Stein, Papier, Echse, Spock. Schere schneidet Papier, Papier bedeckt Stein, Stein zerquetscht Echse, Echse vergiftet Spock, Spock zertrümmert Schere, Schere köpft Echse, Echse frisst Papier, Papier widerlegt Spock, Spock verdampft Stein, und Stein macht die Schere stumpf. Diese Variante reduziert die Anzahl von Unentschieden.

*There is a variant of rock-paper-scissors, which has become known through the series Big Bang Theory (see Fig. 2.). In this variant there are 5 symbols: scissors, stone, paper, lizard, spock.
Scissors cuts paper, paper covers rock, rock crushes lizard, lizard poisons spock, spock smashes scissors, scissors decapitates lizard, lizard eats paper, paper disproves Spock, spock vaporizes rock and rock crushes scissors.*

<img src="img/exercise6/spock.png" width="300"/>

Abbildung 2: Visualisierung für die Schnick Schnack Schnuck Variante Schere-Stein-Papier-Echse-Spock", siehe
http://www.samkass.com/theories/RPSSL.html

*Task 6.1.1:* Definieren sie den Sample Space und den Event Space für die Originalversion und die Big Bang Theory Version.
Schreiben Sie dazu kommentierten Python-Code.<br>
<br>
*Define the sample space and the event space for the original version and the Big Bang Theory version. Write annotated Python code.*

<div class="task_description">
    <i class="task">Homework 6.2:</i>
        ::: 3 Hausaufgabenpunkte :::</div>
        
Eine Analysesoftware erkennt in Videoaufnahmen die Gesichter von gesuchten Personen mit einer Wahrscheinlichkeit von 93%. Allerdings markiert die Software in 1% aller Fälle eine unverdächtige Person irrtümlich als gesucht. Die Sicherheitsbehörden erwarten, dass am Donnerstag 10 gesuchte Personen am Flughafen ankommen werden. Das Personenaufkommen pro Tag liegt bei 10.000 Fluggästen.<br>
Sie können annehmen, dass alle anderen Personen, die an diesem Tag ankommen unverdächtig sind. Schreiben Sie kommentierten Python-Code, der die folgenden Wahrscheinlichkeiten berechnet:<br><br>
*An analysis software recognizes the faces of wanted persons in video footage with a probability of 93%. However, in 1% of cases, the software erroneously marks an unsuspecting person as being wanted. Security authorities expect that 10 wanted people will arrive at the airport on Thursday. The number of passengers per day is 10,000. <br>
You can assume that all other people who arrive that day are unsuspicious. Write annotated Python code that calculates the following probabilities:*

*Task 6.2.1*: Wie viele Personen wird die Software wahrscheinlich fälschlicherweise als “gesucht” markieren?  <br>
*How many people will likely be mistaken as "wanted" by the software?*

*Task 6.2.2*: Die Software schlägt Alarm. Wie groß ist die Wahrscheinlichkeit dafür, dass tatsächlich eine gesuchte Person entdeckt wurde? <br>
*The software raises an alarm. What is the probability that a wanted person was actually discovered?*

<div class="task_description">
    <i class="task">Homework 6.3:</i>
        ::: 5 Hausaufgabenpunkte :::</div>
        
Anna zieht 3 Karten von einem gemischten Skatspiel (7 bis Ass, 4 Farben: Herz, Karo, Kreuz, Pik, 32 Karten). Schreiben Sie kommentierten Python-Code, der die folgenden Wahrscheinlichkeiten berechnet: <br>
*Anna draws 3 cards from a mixed skat game (7 to ace, 4 colors: hearts, diamonds, clubs, spades, 32 cards). Write annotated Python code that calculates the following probabilities:*

*Task 6.3.1*: Mit welcher Wahrscheinlichkeit hat Anna drei Karten mit gleicher Farbe (z.B. Herz 7/Herz Bube/Herz As)? <br>
*What is the probability that Anna has three cards of the same color (for example, Heart 7 / Heart Jack / Heart As)?*

Task 6.3.2:  Mit welcher Wahrscheinlichkeit hat Anna drei Karten mit dem gleichen Wert? <br>
*What is the probability that Anna has three cards of equal value (for example, Heart Jack / Pik Jack / Cross Jack)?*