# Probabilidade Condicional

Abaixo está um código para criar alguns dados falsos sobre a quantidade de coisas que as pessoas compram de acordo com sua faixa etária.

Ele gera 100.000 "pessoas" aleatórias e as atribui aleatoriamente como tendo 20, 30, 40, 50, 60 ou 70 anos.

Digamos que essas pessoaqs sejam clientes de algum site de compras (Ex; Amazon, Aliexpress, Shopee etc)

Veremos a probabilidade de alguém comprar algo de acordo com a idade. Se for mais velho, maior a probabilidade de comprar algo,  e quanto menor a faixa estária, menor a probabilidade de comprar algo.

In [2]:
# Importa a biblioteca para geração de números aleatórios do numpy
from numpy import random

# Inicializa a semente do gerador de números aleatórios para garantir resultados consistentes
random.seed(0) 

# Dicionário para armazenar o total de pessoas em cada faixa etária
totais = {20: 0, 30: 0, 40: 0, 50: 0, 60: 0, 70: 0}

# Dicionário para armazenar a quantidade de compras feitas por pessoas em cada faixa etária
compras = {20: 0, 30: 0, 40: 0, 50: 0, 60: 0, 70: 0}

# Inicializa a variável para armazenar o total de compras
totalCompras = 0

# Simula o comportamento de 100.000 pessoas visitando um site
for _ in range(100000):
    # Escolhe aleatoriamente a idade de uma pessoa entre 20, 30, 40, 50, 60 ou 70 anos
    idade = random.choice([20, 30, 40, 50, 60, 70])
    
    # Calcula a probabilidade de uma pessoa comprar algo com base na sua idade
    comprasProbab = float(idade) / 100.0
    
    # Atualiza o total de pessoas em cada faixa etária
    totais[idade] += 1
    
    # Verifica se a pessoa realiza uma compra com base na probabilidade calculada
    if random.random() < comprasProbab:
        totalCompras += 1
        compras[idade] += 1


In [3]:
totais

{20: 16576, 30: 16619, 40: 16632, 50: 16805, 60: 16664, 70: 16704}

In [4]:
compras

{20: 3392, 30: 4974, 40: 6670, 50: 8319, 60: 9944, 70: 11713}

In [5]:
totalCompras

45012

Calculando a probabilidade de P(E|F), onde "E" são as compras e "F" é a faixa etária da pessoa (pessoa de 30 anos):

In [6]:
PEF = float(compras[30] / float(totais[30]))
print(f'P (compras) | 30 anos : {PEF}')

P (compras) | 30 anos : 0.29929598652145134


Calculando P(F) a probabilidade de serem pessoas de 30 anos:

In [7]:
PF = float(totais[30]/100000)
print(f'P(30 anos): {PF}')

P(30 anos): 0.16619


Calculando P(E) a probabilidade do total de compras independente da idade:

In [8]:
PE = float(totalCompras/100000)
print(f'P(compras): {PE}')

P(compras): 0.45012


Acima foi calculado probabilidades onde as compras P(F) tem dependência com a idade P(E)

Calculando o P(E, F). Diferentemente do P(E|F), o P(E, F) é a probabilidade de estar na casa dos 30 anos e comprar alguma coisa sem que haja alguma dependencia, Olhando pra probabilidade geral de estar com 30 anos e comprar algo, não restringindo apenas a faixa etária de 30 anos.

In [9]:
print(f'P(30, compras) {float(compras[30])/100000.0}')

P(30, compras) 0.04974


Probabilidade geral de comprar algo e estar na casa dos 30 anos, criando o produto de P(E) e P(F).

In [10]:
print(f'P(30)*P(compras): {PE*PF}')

P(30)*P(compras): 0.07480544280000001


### Calculando a probabilidade condicional, removendo a dependência entre a idade e a probabilidade de compra:

In [11]:
# Importa a biblioteca para geração de números aleatórios do numpy
from numpy import random

# Inicializa a semente do gerador de números aleatórios para garantir resultados consistentes
random.seed(0) 

# Dicionário para armazenar o total de pessoas em cada faixa etária
totais = {20: 0, 30: 0, 40: 0, 50: 0, 60: 0, 70: 0}

# Dicionário para armazenar a quantidade de compras feitas por pessoas em cada faixa etária
compras = {20: 0, 30: 0, 40: 0, 50: 0, 60: 0, 70: 0}

# Inicializa a variável para armazenar o total de compras
totalCompras = 0

# Simula o comportamento de 100.000 pessoas visitando um site
for _ in range(100000):
    # Escolhe aleatoriamente a idade de uma pessoa entre 20, 30, 40, 50, 60 ou 70 anos
    idade = random.choice([20, 30, 40, 50, 60, 70])
    
    # Alteração para não haver relação entre a idade e a probabilidade de comprar algo
    comprasProbab = 0.4
    
    # Atualiza o total de pessoas em cada faixa etária
    totais[idade] += 1
    
    # Verifica se a pessoa realiza uma compra com base na probabilidade calculada
    if random.random() < comprasProbab:
        totalCompras += 1
        compras[idade] += 1


In [12]:
PEF = float(compras[30] / float(totais[30]))
print(f'P (compras) | 30 anos : {PEF}')

P (compras) | 30 anos : 0.3987604549010169


In [13]:
PE = float(totalCompras/100000)
print(f'P(compras): {PE}')

P(compras): 0.4003
