<a href="https://colab.research.google.com/github/GustavoBD-Dev/StatisticalTechniquesAndDataMining/blob/main/02_Uniforme_discreta_lanzamiento_de_dados.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lanzamiento de dos dados


## Diccionarios en Python

$$\{key : values \}$$

In [None]:
d = {
      "Gustavo": ["Masha", "Mila", "Sneg"],
      "Blas": [11, 3, 99],
      "Duran":[0.8, 0.6, 0.24]
      }

In [None]:
d

{'Gustavo': ['Masha', 'Mila', 'Sneg'],
 'Blas': [11, 3, 99],
 'Duran': [0.8, 0.6, 0.24]}

In [None]:
d.keys()

dict_keys(['Gustavo', 'Blas', 'Duran'])

In [None]:
d.values()

dict_values([['Masha', 'Mila', 'Sneg'], [11, 3, 99], [0.8, 0.6, 0.24]])

In [None]:
d.items()

dict_items([('Gustavo', ['Masha', 'Mila', 'Sneg']), ('Blas', [11, 3, 99]), ('Duran', [0.8, 0.6, 0.24])])

## Se lanzan dos dados juntos:


- $\Omega = \{1,2,3,4,5,6\}\times \{1,2,3,4,5,6 \}$.
- $\ {F}=p(\Omega)$.
- Para $\omega=(i,j)$ donde $i, j=1,\dots, 6$
$$\mathbb{P}(\{\omega\})=\frac{1}{36}.$$

-----

## Vamos a definir a la siguiente variable aleatoria:
$S$ es la variable aleatoria que cuenta la suma de las caras de los dados.

$$S:\Omega \to R_{S}=\{2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 \}$$


Para entender a la ley de la variable aleatoria, basta con entender a los siguientes datos:
$$\{(k, \mathbb{P}(S=k)) \}_{k\in R_{S}}.$$


Veamos a $S$ como eventos. Sea $S_{n}$ el evento la suma de las caras es $n$.

In [27]:
from itertools import product
from fractions import Fraction

# Definimos la funcion de probabilidad
def P(A, Omega):
  P = Fraction(len(A), len(Omega))
  return P

$$S_{n}=\{(i,j)\in \Omega : i+j =n \}$$

In [12]:
'''
Obtenemos S_2: numero de eventos donde la suma de las caras es igual a 2.
- i: caras del dado 1
- j: caras del dado 2
- i+j=2: suma de las caras es igual a 2, con lo que si cumple la condicion se agrega a S_2.
'''
S_2 = {(i,j) for i in range(1,7) for j in range(1,7) if i+j == 2 }
S_2

{(1, 1)}

In [16]:
# Obtenemos L: lista de caras de un dado
L = [i for i in range(1,7)]
L

[1, 2, 3, 4, 5, 6]

In [17]:
# Omega: todos los posibles valores al lanzar dos dados.
Omega = set(product(L, repeat=2))
Omega

{(1, 1),
 (1, 2),
 (1, 3),
 (1, 4),
 (1, 5),
 (1, 6),
 (2, 1),
 (2, 2),
 (2, 3),
 (2, 4),
 (2, 5),
 (2, 6),
 (3, 1),
 (3, 2),
 (3, 3),
 (3, 4),
 (3, 5),
 (3, 6),
 (4, 1),
 (4, 2),
 (4, 3),
 (4, 4),
 (4, 5),
 (4, 6),
 (5, 1),
 (5, 2),
 (5, 3),
 (5, 4),
 (5, 5),
 (5, 6),
 (6, 1),
 (6, 2),
 (6, 3),
 (6, 4),
 (6, 5),
 (6, 6)}

In [18]:
# S (variable aleatorio): por cada evento, suma de las caras de los dados.
S = {(i,j): i+j for i,j in Omega}
S

{(3, 4): 7,
 (4, 3): 7,
 (3, 1): 4,
 (5, 4): 9,
 (4, 6): 10,
 (5, 1): 6,
 (2, 2): 4,
 (1, 6): 7,
 (2, 5): 7,
 (1, 3): 4,
 (6, 2): 8,
 (6, 5): 11,
 (4, 2): 6,
 (4, 5): 9,
 (3, 3): 6,
 (5, 6): 11,
 (3, 6): 9,
 (5, 3): 8,
 (2, 4): 6,
 (1, 2): 3,
 (2, 1): 3,
 (1, 5): 6,
 (6, 1): 7,
 (6, 4): 10,
 (3, 2): 5,
 (4, 1): 5,
 (3, 5): 8,
 (5, 2): 7,
 (4, 4): 8,
 (5, 5): 10,
 (1, 1): 2,
 (1, 4): 5,
 (2, 3): 5,
 (2, 6): 8,
 (6, 6): 12,
 (6, 3): 9}

In [20]:
len (S) # numero de eventos

36

In [24]:
from collections import defaultdict

dS = defaultdict(set) # devuelve un objeto similar a un diccionario
dS

defaultdict(set, {})

In [28]:
'''
Iteramos cada evento (elemento) en la variable aleatoria,
agrupamos los eventos en los que se cumple la condicion de la suma de las caras de los dados.
'''
for l, v in S.items():
  dS[v].add(l)

dS

defaultdict(set,
            {7: {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)},
             4: {(1, 3), (2, 2), (3, 1)},
             9: {(3, 6), (4, 5), (5, 4), (6, 3)},
             10: {(4, 6), (5, 5), (6, 4)},
             6: {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)},
             8: {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)},
             11: {(5, 6), (6, 5)},
             3: {(1, 2), (2, 1)},
             5: {(1, 4), (2, 3), (3, 2), (4, 1)},
             2: {(1, 1)},
             12: {(6, 6)}})

In [30]:
#Obtenemos la ley de la variable aleatoria S por medio de la funcion P.
leyS = {k : P(A,Omega) for k , A in dS.items() }
leyS

{7: Fraction(1, 6),
 4: Fraction(1, 12),
 9: Fraction(1, 9),
 10: Fraction(1, 12),
 6: Fraction(5, 36),
 8: Fraction(5, 36),
 11: Fraction(1, 18),
 3: Fraction(1, 18),
 5: Fraction(1, 9),
 2: Fraction(1, 36),
 12: Fraction(1, 36)}

## Introducción a pandas

In [33]:
import pandas as pd # importamos la libreria

leyS = pd.Series(leyS) # Transformamos el diccionario leyS en un DataFrame de pandas.
leyS = leyS.sort_index() # Ordenamos el DataFrame por la suma de las caras de los dados.

leyS #

2     1/36
3     1/18
4     1/12
5      1/9
6     5/36
7      1/6
8     5/36
9      1/9
10    1/12
11    1/18
12    1/36
dtype: object

### Ejercicios:
1.- Documenta tu colab.

2.- Calcula la ley de las siguientes variables aleatorias:

    2.1 La diferencia de las caras sea mayor que $1$.
    2.2 La suma de las caras sea par.

3.- Verifica, en cada caso, que $$\sum_{k\in R_{X}}\mathbb{P}(X=x)=1.$$

4.- Sube tu notebook a tu GitHub.

---
* Para 2.1: la diferencia de las caras sea mayor que 1


$$S_{n}=\{(i,j)\in \Omega : i-j > 1 \}$$

In [36]:
'''
Obtenemos S_2: numero de eventos donde la diferencia de las caras es mayor que 1.
- i: caras del dado 1
- j: caras del dado 2
- i-j > 1: diferencia de las caras es mayor que 1, con lo que si cumple la condicion se agrega a S_2.
'''
S_3 = {(i,j) for i in range(1,7) for j in range(1,7) if i-j > 1 }
S_3

{(3, 1),
 (4, 1),
 (4, 2),
 (5, 1),
 (5, 2),
 (5, 3),
 (6, 1),
 (6, 2),
 (6, 3),
 (6, 4)}

In [38]:
S = {(i,j): i-j for i,j in Omega}
S

{(3, 4): -1,
 (4, 3): 1,
 (3, 1): 2,
 (5, 4): 1,
 (4, 6): -2,
 (5, 1): 4,
 (2, 2): 0,
 (1, 6): -5,
 (2, 5): -3,
 (1, 3): -2,
 (6, 2): 4,
 (6, 5): 1,
 (4, 2): 2,
 (4, 5): -1,
 (3, 3): 0,
 (5, 6): -1,
 (3, 6): -3,
 (5, 3): 2,
 (2, 4): -2,
 (1, 2): -1,
 (2, 1): 1,
 (1, 5): -4,
 (6, 1): 5,
 (6, 4): 2,
 (3, 2): 1,
 (4, 1): 3,
 (3, 5): -2,
 (5, 2): 3,
 (4, 4): 0,
 (5, 5): 0,
 (1, 1): 0,
 (1, 4): -3,
 (2, 3): -1,
 (2, 6): -4,
 (6, 6): 0,
 (6, 3): 3}

In [39]:
len (S) # numero de eventos

36

In [45]:
del dS # eliminamos el diccionario dS

dS = defaultdict(set) # devuelve un objeto similar a un diccionario

'''
Iteramos cada evento (elemento) en la variable aleatoria,
agrupamos los eventos en los que se cumple la condicion de la suma de las caras de los dados.
'''

for l, v in S.items():
  dS[v].add(l)

#Obtenemos la ley de la variable aleatoria S por medio de la funcion P.
leyS = {k : P(A,Omega) for k , A in dS.items() }

leyS = pd.Series(leyS) # Transformamos el diccionario leyS en un DataFrame de pandas.
leyS = leyS.sort_index() # Ordenamos el DataFrame por la suma de las caras de los dados.

leyS #

-5    1/36
-4    1/18
-3    1/12
-2     1/9
-1    5/36
 0     1/6
 1    5/36
 2     1/9
 3    1/12
 4    1/18
 5    1/36
dtype: object

---
* Para 2.1: la suma de las caras sea par


$$S_{n}=\{(i,j)\in \Omega : \mod((i+j), 2) = 0 \}$$

In [50]:
'''
Obtenemos S_4: numero de eventos donde la suma de las caras es par.
- i: caras del dado 1
- j: caras del dado 2
- (i+j)%2==0: suma de las caras es par, con lo que si cumple la condicion se agrega a S_4.
'''
S_4 = {(i,j) for i in range(1,7) for j in range(1,7) if (i+j)%2==0 }
S_4

{(1, 1),
 (1, 3),
 (1, 5),
 (2, 2),
 (2, 4),
 (2, 6),
 (3, 1),
 (3, 3),
 (3, 5),
 (4, 2),
 (4, 4),
 (4, 6),
 (5, 1),
 (5, 3),
 (5, 5),
 (6, 2),
 (6, 4),
 (6, 6)}

In [52]:
S = {(i,j): (i+j)%2 for i,j in Omega}
S

{(3, 4): 1,
 (4, 3): 1,
 (3, 1): 0,
 (5, 4): 1,
 (4, 6): 0,
 (5, 1): 0,
 (2, 2): 0,
 (1, 6): 1,
 (2, 5): 1,
 (1, 3): 0,
 (6, 2): 0,
 (6, 5): 1,
 (4, 2): 0,
 (4, 5): 1,
 (3, 3): 0,
 (5, 6): 1,
 (3, 6): 1,
 (5, 3): 0,
 (2, 4): 0,
 (1, 2): 1,
 (2, 1): 1,
 (1, 5): 0,
 (6, 1): 1,
 (6, 4): 0,
 (3, 2): 1,
 (4, 1): 1,
 (3, 5): 0,
 (5, 2): 1,
 (4, 4): 0,
 (5, 5): 0,
 (1, 1): 0,
 (1, 4): 1,
 (2, 3): 1,
 (2, 6): 0,
 (6, 6): 0,
 (6, 3): 1}

In [53]:
len (S) # numero de eventos

36

In [54]:
del dS # eliminamos el diccionario dS

dS = defaultdict(set) # devuelve un objeto similar a un diccionario

'''
Iteramos cada evento (elemento) en la variable aleatoria,
agrupamos los eventos en los que se cumple la condicion de la suma de las caras de los dados.
'''

for l, v in S.items():
  dS[v].add(l)

#Obtenemos la ley de la variable aleatoria S por medio de la funcion P.
leyS = {k : P(A,Omega) for k , A in dS.items() }

leyS = pd.Series(leyS) # Transformamos el diccionario leyS en un DataFrame de pandas.
leyS = leyS.sort_index() # Ordenamos el DataFrame por la suma de las caras de los dados.

leyS #

0    1/2
1    1/2
dtype: object