```{eval-rst}
:orphan:
```

In [3]:
#Import libraries
from matplotlib_venn import venn2, venn2_circles, venn2_unweighted
from matplotlib_venn import venn3, venn3_circles
from matplotlib import pyplot as plt
%matplotlib inline

# Εισαγωγή στη Θεωρία Πιθανοτήτων

Σε αυτό το κεφάλαιο θα κάνουμε μία εισαγωγή στις βασικές έννοιες και αντικείμενα της *θεωρίας πιθανοτήτων* (probability theory).
Θα δούμε τα διάφορα είδη πιθανοτήτων και πως υπολογίζουμε τις πιθανότητες να συμβούν διάφορα συμβάντα (γεγονότα) της καθημερινής ζωής.

Για να μπορέσουμε να εξηγήσουμε τις έννοιες που συναντάμε στην πιθανοτική θεωρία θα πρέπει πρώτα να αποσαφηνίσουμε μερικούς όρους που χρησιμοποιούνται συχνά στο συγκεκριμένο χώρο.
Θα πρέπει επίσης να ξαναθυμηθούμε και μερικά στοιχεία από τη *Θεωρία Συνόλων*, καθώς οι έννοιες που συναντάμε στο χώρο των πιθανοτήτων, βασίζονται πάνω στη συγκεκριμένη θεωρία.
Θα δούμε πως μπλέκονται όλα αυτά μαζί.



## Στοιχεία θεωρίας συνόλων

Ένα *σύνολο* (set) είναι μία οποιαδήποτε συλλογή αντικειμένων (objects) που ονομάζονται στοιχεία (elements) ή σημεία (points).
Για παράδειγμα, τα {math}`A=\{-1, 1\}`, $B=\{3, 5, 9\}$, $\mathbb{Z}=\{\ldots, -1, 0, 1, 2, \ldots\}$ (ακέραιοι), $\mathbb{R}$ (πραγματικοί αριθμοί), {math}`E = \{A, B, 5, \{5\}, \mathbb{R}\} ` κ.λπ. είναι όλα σύνολα.

Η μεγαλύτερη δυνατή συλλογή στοιχείων που μπορεί να υπάρχει στο αντικείμενο που εξετάζουμε, δηλαδή το μεγαλύτερο σύνολο, λέγεται *χώρος* (space) ή *διάστημα* (universe) ή *παγκόσμιο σύνολο* (universal set).
Στη θεωρία πιθανοτήτων που μας ενδιαφέρει, το σύνολο αυτό λέγεται *δειγματικός χώρος* (sample space).

```{info}
Στη συνέχεια αλλά και γενικότερα, το δειγματικό χώρο το χαρακτηρίζουμε "δ.χ." για συντομία.
```

Ένα σύνολο συνήθως συμβολίζεται με ένα κεφαλαίο γράμμα του ελληνικού ή λατινικού αλφάβητου.
Επειδή σε είναι και ένας μαθηματικός όρος, θα έχει και πλάγια μορφή.
Στη συνέχεια θα συμβολίζουμε τα σύνολα με μαθηματικές εκφράσεις κεφαλαίων λατινικών γραμμάτων.

Ένα σύνολο $A$ λέμε ότι είναι *υποσύνολο* ενός άλλου συνόλου $B$ (και τότε γράφουμε $A \subseteq B$) όταν κάθε στοιχείο του $A$ είναι και στοιχείο του $B$.
Η περίπτωση αυτή εμπεριέχει και την περίπτωση τα δύο σύνολα να είναι *ίσα*.

Ένα σύνολο $A$ λέμε ότι είναι *γνήσιο υποσύνολο* του $Β$ (και γράφουμε $A \subset B$) αν κάθε στοιχείο του $Α$ είναι και στοιχείο του $Β$ αλλά και τουλάχιστο ένα στοιχείο του $Β$ δεν ανήκει στο $Α$.
Η περίπτωση αυτή αποκλείει την ισότητα.

Δύο σύνολα $Α$ και $Β$ λέμε ότι είναι ισοδύναμα (equivalent) ή ίσα (equal) όταν το ένα είναι υποσύνολο του άλλου δηλαδή αν $A \subseteq B$ **και** $Β \subseteq Α$ 

## Η έννοια της πιθανότητας

Η έννοια της πιθανότητας είναι κάτι που μας απασχολεί κάθε μέρα της ζωής μας, σε όλο το εύρος της.
Το τι καιρό θα κάνει αύριο ή ακόμη και στις επόμενες ώρες, ποια ποδοσφαιρική ομάδα μπορεί να κερδίσει το πρωτάθλημα φέτος και το αν το φαγητό που ετοιμάζουμε θα είναι πετυχημένο σε όψη και γεύση, είναι μερικά μόνο από τα εκατοντάδες συμβάντα ή γεγονότα, που τα αντιμετωπίζουμε καθημερινά, με όρους πιθανοτήτων.

Με απλά λόγια, πιθανότητα είναι το κατά πόσο μπορεί κάποιο γεγονός να συμβεί, όπως το να βρέξει αύριο ή να νικήσει η ομάδας μας κ.λπ.
Προσέξτε ότι δεν προσθέσαμε και την περίπτωση του να μη συμβεί το γεγονός.
Αυτή η περίπτωση είναι από μόνη της ένα άλλο, ανεξάρτητο γεγονός, με δική του πιθανότητα.

Για να ορίσουμε με περισσότερη ακρίβεια τι εννοούμε όταν λέμε πιθανότητα, θα πρέπει να καθορ

### Πράξεις με ενδεχόμενα (θεωρία συνόλων)




Είδαμε επίσης ότι, ειδικότερα στο χώρο της θεωρίας πιθανοτήτων, όλα τα σύνολα που μας ενδιαφέρουν είναι υποσύνολα ενός βασικού συνόλου, το οποίο παραδοσιακά συμβολίζεται $\Omega$.

### Πείραμα τύχης

Γνωρίζουμε από τα μαθητικά μας χρόνια την έννοια του πειράματος σαν την εκτέλεση συγκεκριμένων ενεργειών, υπό συγκεκριμένες συνθήκες, προκειμένου να παρατηρήσουμε ένα αναμενόμενο αποτέλεσμα.
Για παράδειγμα, ξέρουμε ότι αν αφήσουμε ένα αντικείμενο από ένα γνωστό ύψος, τότε υπό την επίδραση της βαρύτητας θα αναπτύξει μία συγκεκριμένη επιτάχυνση (επιτάχυνση της βαρύτητας), οπότε θα διανύει συγκεκριμένες αποστάσεις σε συγκεκριμένους χρόνους.
Ήμαστε σε θέση να γνωρίζουμε ή να προβλέπουμε όλες αυτές τις παραμέτρους.

Ένα άλλο πείραμα είναι η θέρμανση νερού στους {math}`100^\circ\ C` σε υψόμετρο κοντά σε αυτό του μηδενός (επίπεδο θάλασσας).
Γνωρίζουμε ότι υπό αυτές τις συνθήκες το νερό θα βράσει.

Όλα αυτά τα πειράματα για τα οποία γνωρίζουμε εκ των προτέρων τις συνθήκες κάτω από τις οποίες συμβαίνουν, αλλά εκ των προτέρων επίσης γνωρίζουμε και ποιο θα είναι το αποτέλεσμα, λέγονται **ντετερμινιστικά** (deterministic) ή **αιτιοκρατικά** πειράματα.

Υπάρχουν όμως και πειράματα που, ενώ γνωρίζουμε τις συνθήκες κάτω από τις οποίες θα γίνουν, δεν μπορούμε να γνωρίζουμε το αποτέλεσμα.
Τέτοια πειράματα λέγονται **πειράματα τύχης** (random experiments).
Μερικά τέτοια πειράματα είναι:

- Η ρίψη ενός ή περισσότερων ζαριών και η καταγραφή του αποτελέσματος.
- Με ανάλογο τρόπο, η ρίψη ενός νομίσματος.
- Η κλήρωση ενός τυχερού παιχνιδιού (π.χ. Λοττο).
- Η τηλεθέαση δηλαδή επιλογή μίας ημέρας της εβδομάδας και η καταμέτρηση του αριθμού των τηλεθεατών που παρακολουθούν μία συγκεκριμένη εκπομπή.
- κ.α.

Συνεπώς, στη γενικότερη περίπτωση, πείραμα είναι οτιδήποτε μπορεί να επαναληφθεί με τις ίδιες συνθήκες, όσες φορές θέλουμε και το αποτέλεσμά του δεν μπορεί να προβλεφθεί με βεβαιότητα.
Μπορούμε όμως να καταγράψουμε όλα τα δυνατά αποτελέσματά του.

Στη θεωρία των πιθανοτήτων (και σε αυτές τις σημειώσεις) μας ενδιαφέρουν τα πειράματα τύχης.

### Δειγματικός χώρος

Ο **χώρος πιθανότητας** ή **δειγματικός χώρος** (sample space) είναι το σύνολο όλων των δυνατών αποτελεσμάτων ενός τυχαίου πειράματος.
Για λόγους τυποποίησης ο δειγματικός χώρος ενός πειράματος συμβολίζεται $\Omega$.
Αν δηλαδή $\omega_1, \omega_2, \omega_3, \ldots \omega_k$ είναι τα δυνατά αποτελέσματα ενός πειράματος τύχης, ο δ.χ του πειράματος είναι:

```{math}
\Omega = \{\omega_1, \omega_2, \omega_3, \ldots \omega_k\}
```

Αν υποθέσουμε σαν πείραμα τη ρίψη ενός ζαριού τότε τα δυνατά αποτελέσματα είναι $\{1, 2, 3, 4, 5, 6\}$.
Σε αυτή την περίπτωση λέμε ότι ο δ.χ. του συγκεκριμένου πειράματος είναι $\Omega = \{1, 2, 3, 4, 5, 6\}$.

### Ενδεχόμενο

Το σύνολο που έχει σαν στοιχεία ένα ή περισσότερα αποτελέσματα του πειράματος (ή αλλιώς, ένα ή περισσότερα στοιχεία του δ.χ.), λέγεται **ενδεχόμενο** (event) του πειράματος και συνήθως συμβολίζεται με ένα κεφαλαίο γράμμα του ελληνικού αλφάβητου, π.χ. $Α$.
Είναι φανερό ότι ένα τέτοιο σύνολο είναι υποσύνολο του δ.χ. $\Omega$, δηλαδή $A \subset \Omega$.

Στο παραπάνω παράδειγμα, ας υποθέσουμε ότι ενδιαφερόμαστε για το αν η ρίψη ενός ζαριού θα έχει σαν αποτέλεσμα 2, 3 ή 6 και μόνο αυτά!
Αυτό είναι ένα ενδεχόμενο π.χ. $Α$ και ισχύει $Α = \{2, 3, 6\}$.
Τότε, επειδή $\{2, 3, 6\} \subset \{1, 2, 3, 4, 5, 6\} = \Omega$ λέμε ότι το $A$ είναι ένα ενδεχόμενο του $\Omega$.

Τα ενδεχόμενα που αποτελούνται από ένα μόνο στοιχείο, δηλαδή τα υποσύνολα $A \subset \Omega$, τέτοια ώστε $Α = \{\omega\}$, για κάποιο $\omega \in \Omega$, λέγονται **στοιχειώδη** ή **απλά** ενδεχόμενα.

Δύο ενδεχόμενα $A$, $B$ είναι λέμε ότι είναι **ξένα** ή **ασυμβίβαστα** ή **αμοιβαία αποκλειόμενα** μεταξύ τους, όταν δεν έχουν κανένα κοινό στοιχείο δηλαδή αν και μόνο αν $A \cap B = \emptyset$.
Διαισθητικά, τα $A$ και $B$ είναι ξένα αν είναι αδύνατον να συμβούν συγχρόνως.

Ο ίδιος ο δ.χ. $\Omega$ θεωρείται οτι είναι ένα **βέβαιο** ενδεχόμενο αφού όποιο και αν είναι το αποτέλεσμα, αυτό θα ανήκει και πάλι στο $\Omega$.

Το κενό σύνολο $\emptyset$ είναι και αυτό ένα ενδεχόμενο το οποίο όμως δε συμβαίνει ποτέ.
Λέμε τότε ότι το $\emptyset$ είναι το **αδύνατο** ενδεχόμενο.

Το πλήθος των στοιχείων ενός ενδεχομένου $Α$ συμβολίζεται $Ν(Α)$ (αντίστοιχα το πλήθος του δ.χ. συμβολίζεται $Ν(\Omega)$).
Συνεπώς, στην περίπτωση της παραπάνω ρίψης του ζαριού:

- $Ν(Α) = 3$
- $N(\Omega) = 6$
- $N(\emptyset) = 0$

### Πράξεις με ενδεχόμενα (θεωρία συνόλων)

Μέχρι στιγμής έχουμε δει ότι πρακτικά, τα ενδεχόμενα δεν είναι τίποτε άλλο από σύνολα δηλαδή μία συλλογή στοιχείων.
Για παράδειγμα, τα {math}`A=\{-1, 1\}`, $B=\{3, 5, 9\}$, $\mathbb{Z}=\{\ldots, -1, 0, 1, 2, \ldots\}$ (ακέραιοι), $\mathbb{R}$ (πραγματικοί αριθμοί), {math}`E = \{A, B, 5, \{5\}, \mathbb{R}\} ` κ.λπ. είναι όλα σύνολα.

Είδαμε επίσης ότι, ειδικότερα στο χώρο της θεωρίας πιθανοτήτων, όλα τα σύνολα που μας ενδιαφέρουν είναι υποσύνολα ενός βασικού συνόλου, το οποίο παραδοσιακά συμβολίζεται $\Omega$.

Αφού λοιπόν τα ενδεχόμενα είναι σύνολα, ισχύουν και γι αυτά οι ιδιότητες των συνόλων, οι βασικές από τις οποίες είναι:

- Αν κάποιο στοιχείο $\alpha$ **ανήκει** σε ένα σύνολο $A$, γράφουμε {math}`\alpha \in A`.
  Αν το $\alpha$ **δεν ανήκει** στο $A$, γράφουμε {math}`\alpha \notin A`

- To $Α$ είναι υποσύνολο του $B$ αν κάθε στοιχείο του $Α$ ανήκει στο $B$ και τότε γράφουμε {math}`A \subset B` ή {math}`A \subseteq B`.

- Το **κενό σύνολο** $\varnothing$ ή $\{\}$ έχει την ιδιότητα ότι δεν περιέχει κανένα στοιχειο δηλαδή {math}`\alpha \notin \emptyset\, \forall \alpha`.

- Η **ένωση** δύο ενδεχόμενων {math}`A \cup B` είναι το ενδεχόμενο με τα στοιχεία που ανήκουν στο $A$ **ή** στο $B$ **ή** και στα δύο.

   ```{figure} img/union.jpg
  :align: center
  :name: img-event-union

  Ένωση των ενδεχομένων Α και Β
  ```

- Η **τομή** δύο ενδεχόμενων {math}`A \cap B` είναι ένα άλλο ενδεχόμενο που αποτελείται από τα στοιχεία του $A$ **και** του $B$.

  ```{figure} img/intersection.jpg
  :align: center
  :name: img-event-intersection

  Τομή των ενδεχομένων Α και Β
  ```

- Το **συμπλήρωμα** του ενδεχόμενου $A$ είναι το ενδεχόμενο $A'$, υποσύνολο του $\Omega$, τα στοιχεία του οποίου είναι όλα τα στοιχεία του $\Omega$ που δεν ανήκουν στο $A$.

  ```{figure} img/coplement.jpg
  :align: center
  :name: img-event-coplement

  Συμπλήρωμα του ενδεχόμενου Α
  ```

- Η **διαφορά** του ενδεχόμενου $Β$ από το ενδεχόμενο $Α$, {math}`A - B`, είναι το ενδεχόμενο εκείνο που περιλαμβάνει όλα τα στοιχεία του $A$ εκτός από τα κοινά ίσως στοιχεία του με το $Β$.

  ```{figure} img/difference.jpg
  :align: center
  :name: img-event-difference

  Διαφορά του ενδεχόμενου Β από το ενδεχόμενο Α
  ```

  Ένα τέτοιο ενδεχόμενο συμβαίνει όταν **συμβαίνει** το $Α$ **αλλά όχι** το $Β$ και μπορεί εύκολα να αποδειχθεί ότι $Α - Β = Α \cap B'$.

## Τι είναι λοιπόν Πιθανότητα;

Είδαμε ότι αν κάτι χαρακτηρίζει ένα πείραμα τύχης, είναι η αβεβαιότητα για το ποιο αποτέλεσμα θα εμφανιστεί σε μια συγκεκριμένη εκτέλεσή του.
Αν λοιπόν το $Α$ είναι ένα από τα ενδεχόμενα του πειράματος, δεν μπορούμε να προβλέψουμε με βεβαιότητα, πότε και αν αυτό θα πραγματοποιηθεί.
Θα πρέπει λοιπόν να αντιστοιχίσουμε σε κάθε ένα τέτοιο ενδεχόμενο $Α$, έναν αριθμό που θα εκφράζει το μέτρο της "προσδοκίας" με την οποία αναμένουμε να πραγματοποιηθεί.
Τον αριθμό αυτό τον ονομάζουμε *πιθανότητα να συμβεί το $Α$* και το συμβολίζουμε με $P(Α)$.

Υπάρχουν διάφοροι τρόποι για να οριστεί αυτή η έννοια της πιθανότητας, ανάλογα με το αν γνωρίζουμε ή όχι ποια μπορεί να είναι τα ενδεχόμενα ενός πειράματος.

http://ebooks.edu.gr/ebooks/v/html/8547/2656/Algebra_A-Lykeiou_html-empl/index1.html

### Κλασσικός ορισμός πιθανότητας

Αν ο δειγματικός χώρος $\Omega$ ενός πειράματος είναι γνωστός και πεπερασμένος και όλα τα στοιχειώδη ενδεχόμενά του έχουν την ίδια πιθανότητα επιλογής (ισοπίθανα), τότε η πιθανότητα να συμβεί ένα ενδεχόμενο $Α \subseteq \Omega$ είναι:

```{math}
:label: classic-probability

P(A) = \frac{N(A)}{N(\Omega)} = \frac{\text{πλήθος στοιχείων του}\, A}{\text{πλήθος στοιχείων του}\, \Omega} = \frac{\text{πλήθος ευνοϊκών περιπτώσεων}}{\text{πλήθος δυνατών περιπτώσεων}}
```

Ας δούμε ένα παράδειγμα:

Έστω ότι ρίχνουμε δύο ζάρια και θεωρούμε σαν $A$ το γεγονός (ενδεχόμενο) το άθροισμα των δύο ζαριών να είναι 2 ή 3 ή 4 ή 5, δηλαδή $A = \{2, 3, 4, 5\}$.
Θέλουμε να βρούμε ποια είναι η πιθανότητα να συμβεί το $A$.

Ο δειγματικός χώρος $\Omega$ του συγκεκριμένου πειράματος είναι γνωστός και πεπερασμένος.
Είναι όλα τα δυνατά ζεύγη ενδείξεων που μπορούν να φέρουν τα δύο ζάρια και τα οποία φαίνονται στον {numref}`Πιν. %s <tbl-twodices>` που ακολουθεί.
Από τις ενδείξεις των δύο ζαριών, αυτές που έχουν άθροισμα 2 ή 3 ή 4 ή 5 (δηλαδή το ενδεχόμενο $Α$), φαίνονται με έντονη και πλάγια γραφή.

```{list-table} "Όλες οι δυνατές ενδείξεις της ρίψης δύο ζαριών (ο δειγματικός χώρος $\Omega$ του πειράματος)"
:header-rows: 1
:stub-columns: 1
:name: tbl-twodices

* - 
  - 1
  - 2
  - 3
  - 4
  - 5
  - 6
* - 1
  - __*(1,1)*__
  - __*(1,2)*__
  - __*(1,3)*__
  - __*(1,4)*__
  - (1,5)
  - (1,6)
* - 2
  - __*(2,1)*__
  - __*(2,2)*__
  - __*(2,3)*__
  - (2,4)
  - (2,5)
  - (2,6) 
* - 3
  - __*(3,1)*__
  - __*(3,2)*__
  - (3,3)
  - (3,4)
  - (3,5)
  - (3,6) 
* - 4
  - __*(4,1)*__
  - (4,2)
  - (4,3)
  - (4,4)
  - (4,5)
  - (4,6) 
* - 5
  - (5,1)
  - (5,2)
  - (5,3)
  - (5,4)
  - (5,5)
  - (5,6) 
* - 6
  - (6,1)
  - (6,2)
  - (6,3)
  - (6,4)
  - (6,5)
  - (6,6) 
```

Το πλήθος όλων των δυνατών εξαγόμενων του πειράματος είναι $36$ δηλαδή το πλήθος των στοιχείων του {numref}`Πιν. %s <tbl-twodices>`.
Αντίστοιχα, το πλήθος των στοιχείων του ενδεχόμενου $Α$ είναι $10$.
Σύμφωνα με την κλασσική ερμηνεία της πιθανότητας, η πιθανότητα να συμβεί το ενδεχόμενο $Α$ είναι:

```{math}
P(A) = \frac{N(A)}{N(\Omega)} = \frac{10}{36} = 0.28
```

δηλαδή $28\%$ πιθανότητα.

Ο παραπάνω κλασσικός ορισμός της πιθανότητας ενός ενδεχομένου, οδηγεί σε κάποιες ενδιαφέρουσες ιδιότητες της συνάρτησης $P(A)$:

1.  Για οποιοδήποτε ενδεχόμενο $Α$ του δειγματικού χώρου $\Omega$, ισχύει ότι:

    - {math}`P(\emptyset) = 0`
    - {math}`P(\Omega) = 1`
    - {math}`0 \leq P(A) \leq 1`

1.  Αν {math}`A \subset B` τότε {math}`P(A) \leq P(B)`

1.  Αν τα ενδεχόμενα $Α_1, Α_2, \ldots$ είναι μία οποιαδήποτε (πεπερασμένη ή όχι) ακολουθία, ξένων μεταξύ τους, ενδεχομένων ({math}`A_i \cap A_j = \emptyset, \forall i \neq j`), τότε
    
    ```{math}
    P(A_1 \cup A_2 \cup \ldots) = P(A_1) + P(A_2) + \ldots
    ```

1. Για κάθε ενδεχόμενο $Α$ του δειγματικού χώρου $\Omega$ ισχύει ότι:

   ```{math}
    P(A') = 1 - P(Α)
    ```

1. Εφόσον όλα τα στοιχειώδη ενδεχόμενα έχουν την ίδια πιθανότητα εμφάνισης, τότε {math}`\forall A`:

   ```{math}
    P(A) = \frac{\text{πλήθος στοιχείων}\,Α}{\text{πλήθος στοιχείων}\,\Omega}
    ```

### Στατιστικός (εμπειρικός) ορισμός Πιθανότητας

Ο κλασσικός ορισμός της πιθανότητας προϋποθέτει ότι όλα τα ενδεχόμενα του δ.χ. $\Omega$ έχουν τις ίδιες πιθανότητες εμφάνισης (ισοπίθανα).
Αυτό όμως δεν ισχύει πάντα.
Σε ορισμένα στοχαστικά (αβέβαια) φαινόμενα ( ή αλλιώς πειράματα),  Όταν δε γνωρίζουμε αρκετά για το φαινόμενο που παρατηρούμε (πείραμα) ώστε να ξέρουμε με ακρίβεια όλα τα δυνατά αποτελέσματα που μπορεί να προκύψουν, βασιζόμαστε στην **εμπειρική πιθανότητα**.
Σε αυτή την περίπτωση παρατηρούμε όλες τις επαναλήψεις του πειράματος και καταγράφουμε τα αποτελέσματά τους.
Από τα καταγεγραμμένα αποτελέσματα υπολογίζουμε την πιθανότητα που μας ενδιαφέρει σαν μέρος της κατανομής συχνοτήτων από τα παρατηρούμενα αποτελέσματα.

Αν στις $Ν$ επαναλήψεις ενός πειράματος τύχης ένα ενδεχόμενο $Α$ εμφανίσθηκε $Ν_Α$ φορές τότε το πηλίκο $\frac{Ν_Α}{Ν}$ ονομάζεται σχετική συχνότητα του ενδεχομένου $Α$.
Όσο το $Ν$ μεγαλώνει τόσο η σχετική συχνότητα σταθεροποιείται γύρω από έναν αριθμό που ονομάζεται **πιθανότητα του ενδεχομένου $Α$** και συμβολίζεται με $P(A)$.

In [10]:
import itertools
from readline import append_history_file
athletes = ['A', 'B', 'C', 'D', 'E']
three_winners = list(for i in itertools.permutations(athletes,3): append(i)

SyntaxError: invalid syntax (1974499638.py, line 4)