# Probabilidade

## Conjuntos em Python

### Definindo os conjuntos em Python

No Python existe uma variável especial que pode ser utilizado para definir os conjuntos. Este seria o <i>set</i>, que pode ser declarado colocando os elementos entre chaves ou usando a função set() como abaixo:

In [1]:
set1 = { 1, 2 }
print(set1)

set2 = set(["A", "B"])
print(set2)

{1, 2}
{'B', 'A'}


Perceba que em um conjunto em Python nem a ordem e nem a repetição importa.

In [2]:
set3 = { 10, 2, 2, 5, 2, 3 }
print(set3)

{3, 10, 2, 5}


Se, em um experimento, a ordem ou a repetição importa, você pode trabalhar com tuplas ou listas:

In [3]:
alist = [10, 2, 2, 5, 2, 3]
print(alist)
atuple = (10, 2, 2, 5, 2, 3)
print(atuple)
atuple2 = tuple(alist)
print(atuple2)

[10, 2, 2, 5, 2, 3]
(10, 2, 2, 5, 2, 3)
(10, 2, 2, 5, 2, 3)


#### Conjunto vazio
Para definir um conjunto vazio, utilize a função set() como abaixo. 

Observação: chaves vazios não gera um conjunto vazio, e sim um dicionário vazio.

In [4]:
empty1 = set()
print(empty1)

empty2 = set([])
print(empty2)

notAset = {}
print(type(notAset))

set()
set()
<class 'dict'>


### Relação de pertinência
Utilize os operadores lógicos <i>in</i> para verificar se um elemento pertence a um conjunto. 

In [5]:
sala = { "mesa", "cadeira", "sofa" }
print("mesa" in sala)
print("panela" in sala)
print("panela" not in sala)

True
False
True


### Testar se o conjunto é vazio
Você pode testar se o conjunto é vazio de duas formas, (1) usando o <i>not</i>, (2) verificando o tamanho do conjunto:

In [6]:
S = set()
print(not S)

True


In [7]:
S = set()
print(len(S) == 0)

True


### Intervalos de inteiros
Você pode obter um conjunto de inteiros em um intervalo utilizando a função range().

Por exemplo, se quisermos obter $ \{x \in \mathbb{Z}\ |\ 0 \leq x \leq n \}$:

In [8]:
n = 10
set(range(n+1))

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

Para $ \{x \in \mathbb{Z}\ |\ m \leq x \leq n \}$:

In [9]:
m = 2
n = 10
set(range(m,n+1))

{2, 3, 4, 5, 6, 7, 8, 9, 10}

Para um conjunto contendo elementos múltiplos de 2:

In [10]:
m = 2
n = 10
set(range(m,n+1,2))

{2, 4, 6, 8, 10}

### Visualização de conjuntos
A visualização dos conjuntos pode ser realizado através do diagrama de Venn. O matplotlib fornece uma biblioteca para gerar diagramas de Venn como segue abaixo:

In [11]:
import matplotlib.pyplot as plt
import matplotlib_venn as venn

A = set({0,1,2})
B = set({1,2,3})
venn.venn2([A, B], set_labels=("A","B"))
plt.show()

ModuleNotFoundError: No module named 'matplotlib_venn'

Pode ser que o matplotlib_venn não esteja instalado no seu computador. Para instalar, utilize os seguintes comandos no seu terminal:
```
conda config --add channels conda-forge
conda config --add channels defaults
conda config --add channels r
conda config --add channels bioconda

conda install matplotlib-venn
```

#### Exercício 1
Crie um conjunto A que contenha múltiplos de 3 e um conjunto B que contenha múltiplos de 5 em um intervalo de 0 a 100.

 

In [12]:
mult3 = set(range(3,101, 3))
mult5 = set(range(5,101, 5))

print(mult3)
print(mult5)

{3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 81, 84, 87, 90, 93, 96, 99}
{5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100}


### Relação entre dois conjuntos
Considere os seguintes conjuntos:


In [13]:
set1 = { 0, 1 }
set2 = { 1, 0, 1 }
set3 = { 4, 2 }
set4 = {0, 1, 2}


#### Igualdade (==)

In [14]:
print(set1 == set2)
print(set1 == set3)
print(set1 == set4)

True
False
False


#### Desigualdade (!=)

In [15]:
print(set1 != set2)
print(set1 != set3)
print(set1 != set4)

False
True
True


#### Conjuntos disjuntos (isdisjoint())
Ou mutuamente exclusivo.

In [16]:
print(set1.isdisjoint(set2))
print(set1.isdisjoint(set3))

False
True


#### Subconjunto (<=)

In [17]:
print(set1 <= set2)
print(set1 <= set3)
print(set1 <= set4)

True
False
True


#### Superconjunto (>=)

In [18]:
print(set1 >= set2)
print(set1 >= set3)
print(set1 >= set4)

True
False
False


#### Subconjunto estrito (<)

In [19]:
print(set1 < set2)
print(set1 < set3)
print(set1 < set4)

False
False
True


#### Superconjunto estrito (>)

In [20]:
print(set1 > set2)
print(set1 > set3)
print(set1 > set4)
print(set4 > set1)

False
False
False
True


### Operações aplicadas em um conjunto
Considere os seguintes conjuntos:

In [23]:
A = { 1, 2 }
B = { 2, 3 }

#### União (|)

In [24]:
print(A | B)

print(A.union(B))

{1, 2, 3}
{1, 2, 3}


#### Interseção (&)

In [25]:
print(A & B)

print(A.intersection(B))

{2}
{2}


#### Diferença (-)

In [26]:
print(A - B)

print(A.difference(B))

{1}
{1}


#### Subtração simétrica (^)

In [27]:
print(A ^ B)

print(A.symmetric_difference(B))

{1, 3}
{1, 3}


#### Exercício 2

Utilize os conjuntos gerados no exercício 1 e verifique quantos são múltiplos de 3 e 5.

In [28]:
mult3 & mult5

{15, 30, 45, 60, 75, 90}

#### Exercício 3

Considere os seguintes conjuntos:

In [29]:
# conjunto universo
O = set(range(100))

# conjunto A e B
setA = set({3,62,91,47,21,28,88,98,57,32,89,17,92})
setB = set({3,75,44,46,91,63,62,91,47,21,28,88,98,57,98,98,32,89,17,92,49,8,73,4,48,3,15,69,53,14,90,83,23,17,95,67,28,29,48,5})

Responda:

a) A é um subconjunto de B?

In [30]:
setA <= setB

True

b) Qual é o complemento de A?

In [32]:
print(O - setA)

{0, 1, 2, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 22, 23, 24, 25, 26, 27, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53, 54, 55, 56, 58, 59, 60, 61, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 90, 93, 94, 95, 96, 97, 99}


c) Verifique se a seguinte expressão está correta: se $A \subseteq B$, então $A^c \supseteq B^c$

In [33]:
Ac = O - setA
Bc = O - setB

Ac >= Bc

True

#### Exercício 4

Considere os seguintes conjuntos:

In [34]:
# conjunto universo
O = set(range(100))

# conjuntos A, B e C
A = set({35,62,8,65,86,40,11,90,48,41,23,23,5,50,50,19,2,81,91,80,14,93,25,85,19,8,44,95,32,10,22,98,51,12,77,53,49,5,58,49})
B = set({16,77,6,93,45,71,96,48,55,99,74,50,22,62,98,78,85,88,18,34,96,20,12,50,78})
C = set({20,66,17,58,90,44,71,31,19,56,86,28,61,82,91,26,43,44,49,82,31,15,5,89,77,52,47,65,18,84,39,42,29,9})

venn.venn3([A,B,C])
plt.plot()

NameError: name 'venn' is not defined

Determine:

a) $A \cup B \cup C$

In [37]:
print(A | B | C)

{2, 5, 6, 8, 9, 10, 11, 12, 14, 15, 16, 17, 18, 19, 20, 22, 23, 25, 26, 28, 29, 31, 32, 34, 35, 39, 40, 41, 42, 43, 44, 45, 47, 48, 49, 50, 51, 52, 53, 55, 56, 58, 61, 62, 65, 66, 71, 74, 77, 78, 80, 81, 82, 84, 85, 86, 88, 89, 90, 91, 93, 95, 96, 98, 99}


b) $A \cap B \cap C$

In [38]:
print(A & B & C)

{77}


c) $A^c \cap B^c \cap C^c$

In [41]:
print(O - A & O - B & O - C)
print( O - (A | B | C))

{0, 1, 3, 4, 7, 13, 21, 24, 27, 30, 33, 36, 37, 38, 46, 54, 57, 59, 60, 63, 64, 67, 68, 69, 70, 72, 73, 75, 76, 79, 83, 87, 92, 94, 97}
{0, 1, 3, 4, 7, 13, 21, 24, 27, 30, 33, 36, 37, 38, 46, 54, 57, 59, 60, 63, 64, 67, 68, 69, 70, 72, 73, 75, 76, 79, 83, 87, 92, 94, 97}


d) se existe algum par de conjuntos que sejam disjuntos

In [45]:
print(A.isdisjoint(B))
print(A.isdisjoint(C))
print(B.isdisjoint(C))

False
False
False


e) a subtração simétrica dos três conjuntos.

In [47]:
print(A ^ B ^ C)

{2, 6, 8, 9, 10, 11, 14, 15, 16, 17, 23, 25, 26, 28, 29, 31, 32, 34, 35, 39, 40, 41, 42, 43, 45, 47, 51, 52, 53, 55, 56, 61, 66, 74, 77, 78, 80, 81, 82, 84, 88, 89, 95, 96, 99}


#### Exercício 5

Considerando os mesmos conjuntos do exercício 3, determine os seguintes conjuntos:

a) $A \cap B$

In [48]:
A & B

{12, 22, 48, 50, 62, 77, 85, 93, 98}

b) $(A \cap B) \cap C$

In [50]:
C & B & A

{77}

c) $A \cap (B \cup C)$

In [51]:
(B | C) & A

{5, 12, 19, 22, 44, 48, 49, 50, 58, 62, 65, 77, 85, 86, 90, 91, 93, 98}

d) $(A \cap B)^c$

In [53]:
print(O - (A & B))

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16, 17, 18, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 49, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 78, 79, 80, 81, 82, 83, 84, 86, 87, 88, 89, 90, 91, 92, 94, 95, 96, 97, 99}


#### Exercício 5

Determine a quais conjuntos do exercício anterior correspondem aos seguintes conjuntos:

a) $A^c \cup B^c$

Resposta: d

b) $(B \cap C) \cap A$

Resposta: b

c) $B \cap A$

Resposta: a

d) $(A \cap B) \cup (A \cap C)$

Resposta: c

#### Exercício 6

Considere os dados populacionais presentes no arquivo <i>data.csv</i>:

In [54]:
import pandas as pd

data = pd.read_csv('data.csv', thousands = " ", skiprows = [1])
data.columns = ['country', 'popT', 'pop15', 'pop60', 'fert']
data.head()

Unnamed: 0,country,popT,pop15,pop60,fert
0,Afghanistan,34656,43.9,4.1,4.6
1,Albania,2926,17.7,1.6,1.7
2,Algeria,40606,29.0,10.7,2.8
3,Andorra,77,14.8,0.1,
4,Angola,28813,47.0,3.3,5.7


a) Se eu pegar um país aleatório desta lista, qual será a probabilidade de eu pegar um país que tenha uma população menor que 800 mil habitantes? Obs.: Os valores da coluna "popT" estão em milhares.

In [62]:
len(data[data["popT"] <= 800])/len(data)

0.19072164948453607

b) Se eu pegar um país aleatório desta lista, qual será a probabilidade de eu pegar um país que tenha uma porcentagem da população abaixo dos 15 anos menor 20%? Obs.: os valores da coluna "popT15" estão porcentagem.

In [63]:
len(data[data["pop15"] <= 20])/len(data)

0.29896907216494845

c) Se eu pegar um país aleatório desta lista, qual será a probabilidade de eu pegar um país que tenha uma população menor que 800 mil habitantes <b>ou</b> a porcentagem da população abaixo dos 15 anos menor 20%?

In [69]:
paises800 = set(data[data["popT"] <= 800]["country"])
paises1520 = set(data[data["pop15"] <= 20]["country"])

len(paises800 | paises1520)/len(data)

0.4484536082474227

d) Se eu pegar um país aleatório desta lista, qual será a probabilidade de eu pegar um país que tenha uma população menor que 800 mil habitantes <b>e</b> a porcentagem da população abaixo dos 15 anos menor 20%?

In [None]:
len(paises800 | paises1520)/len(data)