
# üìò Caderno de Exerc√≠cios ‚Äì Probabilidade em Python para IA (com solu√ß√µes)
Autor: ChatGPT ‚Äî GPT-5 Thinking  
Descri√ß√£o: Notebook com **solu√ß√µes prontas** para 10 exerc√≠cios pr√°ticos de probabilidade aplicada √† IA, incluindo simula√ß√µes, distribui√ß√µes e Naive Bayes.

> Observa√ß√£o: Execute as c√©lulas na ordem. Gr√°ficos usam apenas `matplotlib`.


In [1]:

# Imports principais (execute primeiro)
import random
import math
from collections import Counter
import numpy as np
import matplotlib.pyplot as plt

# Bibliotecas de ci√™ncia de dados/IA
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB, GaussianNB
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_classification
from sklearn.metrics import roc_curve, auc

# Bibliotecas cient√≠ficas
from scipy import stats
from scipy import integrate

# Reprodutibilidade
random.seed(42)
np.random.seed(42)

print("Pacotes carregados com sucesso.")


Pacotes carregados com sucesso.



## Exerc√≠cio 1 ‚Äì Sorteio em urna (te√≥rico vs simula√ß√£o)

**Enunciado**: Uma urna cont√©m 3 bolas vermelhas e 2 bolas azuis.  
1) Probabilidade te√≥rica de sortear uma bola vermelha.  
2) Simule 10.000 sorteios e estime a probabilidade experimental.  
3) Compare os resultados.


In [4]:

# Solu√ß√£o
urna = ["vermelha"] * 3 + ["azul"] * 2

# 1) Te√≥rica
p_teorica = 3 / 5

# 2) Simula√ß√£o
n = 10_000
sorteios = [random.choice(urna) for _ in range(n)]
p_exp = sorteios.count("vermelha") / n

print(f"Probabilidade te√≥rica (vermelha): {p_teorica:.4f}")
print(f"Probabilidade experimental (vermelha): {p_exp:.4f}")
print(f"Erro absoluto: {abs(p_teorica - p_exp):.4f}")


Probabilidade te√≥rica (vermelha): 0.6000
Probabilidade experimental (vermelha): 0.5982
Erro absoluto: 0.0018



## Exerc√≠cio 2 ‚Äì Lan√ßamento de dado (par)

**Enunciado**: Um dado justo de 6 lados √© lan√ßado uma vez.  
1) Probabilidade de sair n√∫mero **par**.  
2) Simule 100.000 lan√ßamentos e estime a probabilidade experimental.


In [None]:

# Solu√ß√£o
lados = [1,2,3,4,5,6]
p_teorica = 3 / 6  # {2,4,6}

N = 100_000
rolagens = np.random.choice(lados, size=N, replace=True)
p_exp = np.isin(rolagens, [2,4,6]).mean()

print(f"Probabilidade te√≥rica (par): {p_teorica:.4f}")
print(f"Probabilidade experimental (par): {p_exp:.4f}")
print(f"Erro absoluto: {abs(p_teorica - p_exp):.4f}")



## Exerc√≠cio 3 ‚Äì Probabilidade condicional com baralho

**Enunciado**: Num baralho de 52 cartas, calcule a probabilidade de tirar uma carta **vermelha** dado que √© uma **figura** (J, Q, K).  
1) Resolva teoricamente.  
2) Valide via simula√ß√£o.


In [None]:

# Solu√ß√£o
naipes_vermelhos = {"‚ô•", "‚ô¶"}
naipes_pretos = {"‚ô£", "‚ô†"}
ranks = ['A'] + [str(i) for i in range(2,11)] + ['J','Q','K']
naipes = list(naipes_vermelhos | naipes_pretos)
baralho = [(r, n) for r in ranks for n in naipes]

# Te√≥rica: figuras s√£o J,Q,K (3 por naipe, 12 no total). Metade √© vermelha (6).
p_teorica = 6 / 12

# Simula√ß√£o: condicionar ao evento "√© figura"
N = 200_000
amostras = np.random.choice(len(baralho), size=N, replace=True)
figura = [(baralho[i][0] in {'J','Q','K'}) for i in amostras]
vermelha = [(baralho[i][1] in naipes_vermelhos) for i in amostras]

# P(vermelha | figura) = P(vermelha e figura)/P(figura)
fig_e_verm = np.mean([f and v for f, v in zip(figura, vermelha)])
p_fig = np.mean(figura)
p_exp = fig_e_verm / p_fig

print(f"P(vermelha | figura) te√≥rica: {p_teorica:.4f}")
print(f"P(vermelha | figura) experimental: {p_exp:.4f}")
print(f"Erro absoluto: {abs(p_teorica - p_exp):.4f}")



## Exerc√≠cio 4 ‚Äì Moeda viciada (Distribui√ß√£o Binomial)

**Enunciado**: Moeda com P(cara)=0,6.  
1) Simule 100 lan√ßamentos e conte caras.  
2) Repita 1000 vezes.  
3) Plote um histograma.


In [None]:

# Solu√ß√£o
n = 100      # lan√ßamentos por experimento
p = 0.6      # prob de cara
experimentos = 1000

resultados = np.random.binomial(n, p, size=experimentos)

print(f"M√©dia te√≥rica: {n*p:.2f} | Desvio te√≥rico: {math.sqrt(n*p*(1-p)):.2f}")
print(f"M√©dia simulada: {resultados.mean():.2f} | Desvio simulado: {resultados.std(ddof=1):.2f}")

plt.figure()
plt.hist(resultados, bins=20, density=True)
plt.title("Binomial: n¬∫ de caras em 100 lan√ßamentos (1000 repeti√ß√µes)")
plt.xlabel("N¬∫ de caras")
plt.ylabel("Densidade")
plt.show()



## Exerc√≠cio 5 ‚Äì Tempo at√© o primeiro sucesso (Geom√©trica)

**Enunciado**: Uma l√¢mpada tem 5% de chance de queimar a cada hora (independente).  
1) Modele com distribui√ß√£o **geom√©trica**.  
2) Simule 10.000 l√¢mpadas.  
3) Calcule a m√©dia esperada.


In [None]:

# Solu√ß√£o
p = 0.05  # probabilidade de "queimar" por hora
amostras = np.random.geometric(p, size=10_000)  # n¬∫ de horas at√© a 1¬™ queima (1-indexed)

media_teorica = 1 / p
media_empirica = amostras.mean()

print(f"M√©dia te√≥rica (horas): {media_teorica:.2f}")
print(f"M√©dia emp√≠rica (horas): {media_empirica:.2f}")

plt.figure()
plt.hist(amostras, bins=50, density=True)
plt.title("Distribui√ß√£o Geom√©trica (p=0.05) ‚Äì horas at√© a 1¬™ queima")
plt.xlabel("Horas")
plt.ylabel("Densidade")
plt.show()



## Exerc√≠cio 6 ‚Äì Alturas (Normal)

**Enunciado**: Alturas ~ Normal(Œº=1.70, œÉ=0.10).  
1) Gere 10.000 amostras.  
2) Plote histograma.  
3) Probabilidade de altura > 1.80 m?


In [None]:

# Solu√ß√£o
mu, sigma = 1.70, 0.10
amostras = np.random.normal(mu, sigma, size=10_000)

# Probabilidade te√≥rica: 1 - CDF_normal(1.80)
p_maior_180 = 1 - stats.norm.cdf(1.80, loc=mu, scale=sigma)
print(f"P(altura > 1.80) te√≥rica: {p_maior_180:.4f}")

plt.figure()
plt.hist(amostras, bins=30, density=True)
plt.title("Alturas ~ Normal(Œº=1.70, œÉ=0.10)")
plt.xlabel("Altura (m)")
plt.ylabel("Densidade")
plt.show()



## Exerc√≠cio 7 ‚Äì Classifica√ß√£o com Naive Bayes (texto)

**Enunciado**: Construa um classificador Multinomial Naive Bayes para os emails e classifique `"trabalho amanh√£ com promo√ß√£o"`.


In [None]:

# Solu√ß√£o
emails = [
    "ganhe dinheiro r√°pido",
    "promo√ß√£o imperd√≠vel",
    "encontro amanh√£ no trabalho",
    "relat√≥rio do projeto",
    "desconto exclusivo para voc√™"
]
rotulos = ["spam", "spam", "n√£o spam", "n√£o spam", "spam"]

vectorizer = CountVectorizer()
X = vectorizer.fit_transform(emails)

modelo = MultinomialNB()
modelo.fit(X, rotulos)

novo_email = ["trabalho amanh√£ com promo√ß√£o"]
X_novo = vectorizer.transform(novo_email)
pred = modelo.predict(X_novo)[0]
probas = modelo.predict_proba(X_novo)[0]

print("Vocabul√°rio:", sorted(vectorizer.vocabulary_.keys()))
print("Classifica√ß√£o:", pred)
print("Probabilidades por classe (na ordem modelo.classes_):")
print(modelo.classes_)
print(probas)



## Exerc√≠cio 8 ‚Äì Diagn√≥stico m√©dico (Bayes)

**Enunciado**: Preval√™ncia 1%. Sensibilidade 95%. Especificidade 90%.  
1) Calcule P(doen√ßa | teste positivo).  
2) Simule 100.000 pessoas e valide.


In [None]:

# Solu√ß√£o

preval = 0.01
sens = 0.95
espec = 0.90

# F√≥rmula de Bayes:
# P(D|+) = (sens * preval) / (sens*preval + (1-espec)*(1-preval))
p_dado_pos = (sens * preval) / (sens*preval + (1 - espec) * (1 - preval))
print(f"P(doen√ßa | positivo) (Bayes): {p_dado_pos:.4f}")

# Simula√ß√£o
N = 100_000
tem_doenca = np.random.rand(N) < preval
teste_positivo = np.empty(N, dtype=bool)
# Quem tem doen√ßa: positivo com prob sens
teste_positivo[tem_doenca] = np.random.rand(tem_doenca.sum()) < sens
# Quem n√£o tem: falso positivo com prob (1 - espec)
teste_positivo[~tem_doenca] = np.random.rand((~tem_doenca).sum()) < (1 - espec)

p_empirica = tem_doenca[teste_positivo].mean()
print(f"P(doen√ßa | positivo) (simula√ß√£o): {p_empirica:.4f}")
print(f"Erro absoluto: {abs(p_empirica - p_dado_pos):.4f}")



## Exerc√≠cio 9 ‚Äì Monte Carlo da √°rea sob a sigmoide

**Enunciado**: Estime a integral de `sigm(x)=1/(1+e^{-x})` em [-6, 6] por Monte Carlo e compare com valor num√©rico.


In [None]:

# Solu√ß√£o
def sigm(x):
    return 1.0 / (1.0 + np.exp(-x))

a, b = -6, 6
N = 200_000
xs = np.random.uniform(a, b, size=N)
mc_est = (b - a) * np.mean(sigm(xs))

# Valor "real" num√©rico via quadratura
real_val, err_est = integrate.quad(lambda x: 1.0 / (1.0 + np.exp(-x)), a, b)

print(f"Monte Carlo: {mc_est:.6f}")
print(f"Quadratura (scipy): {real_val:.6f} (erro estimado: {err_est:.2e})")
print(f"Erro absoluto: {abs(mc_est - real_val):.6f}")

# Visualiza√ß√£o da fun√ß√£o (opcional)
grid = np.linspace(a, b, 400)
plt.figure()
plt.plot(grid, sigm(grid))
plt.title("Fun√ß√£o Sigmoide em [-6, 6]")
plt.xlabel("x")
plt.ylabel("sigm(x)")
plt.show()



## Exerc√≠cio 10 ‚Äì Projeto: Classifica√ß√£o com Naive Bayes + ROC

**Enunciado**:  
1) Gere dataset sint√©tico.  
2) Treine **GaussianNB**.  
3) Probabilidades previstas.  
4) Plote curva ROC.


In [None]:

# Solu√ß√£o
X, y = make_classification(
    n_samples=2000, n_features=8, n_informative=5, n_redundant=1,
    n_classes=2, class_sep=1.2, random_state=42
)

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42, stratify=y
)

gnb = GaussianNB()
gnb.fit(X_train, y_train)

probas = gnb.predict_proba(X_test)[:, 1]
fpr, tpr, thr = roc_curve(y_test, probas)
roc_auc = auc(fpr, tpr)

print(f"AUC: {roc_auc:.4f}")
print("Exemplo de probabilidades previstas (10 primeiras):")
print(probas[:10])

plt.figure()
plt.plot(fpr, tpr, label=f"ROC (AUC = {roc_auc:.3f})")
plt.plot([0,1], [0,1], linestyle='--')
plt.title("Curva ROC ‚Äì GaussianNB")
plt.xlabel("Falso positivo (FPR)")
plt.ylabel("Verdadeiro positivo (TPR)")
plt.legend()
plt.show()
