# üìä Probabilidade e Estat√≠stica Aplicada √† Avalia√ß√£o de Desempenho

Este notebook foi constru√≠do a partir de exemplos pr√°ticos em Python, utilizando dados reais e simulados.

Software necess√°rio: [pandas, seaborn, numpy, matpotlib, scipy, scikit-learn, kaggle]

```bash
pip3 install [DEPEND√äNCIA] # para instalar depend√™ncias
```

Importando as bibliotecas...

In [None]:
import pandas as pd
import seaborn as sns
import numpy as np
import statistics
import matplotlib.pyplot as plt
from scipy.stats import poisson, norm, geom


**Agenda:**
- [Defini√ß√µes e Conceitos](#1-defini√ß√µes-e-conceitos)
- [Tipos de Estat√≠sticas](#2-tipos-de-estat√≠sticas)
- [Medidas Estat√≠sticas](#3-medidas-estat√≠sticas)
- [Visualiza√ß√µes: Histograma e Boxplot](#4-visualiza√ß√µes)
- [Vari√°vel Aleat√≥rias e Fun√ß√µes de Probabilidade](#5-vari√°veis-aleat√≥rias-e-fun√ß√µes-de-probabilidade)
- [Distribui√ß√µes de Probabilidade](#6-distribui√ß√µes-de-probabilidade)
- [Processo Estoc√°stico](#6-processo-estoc√°stico)
- [Aplica√ß√µes em Redes de Computadores](#7-aplica√ß√µes-em-redes-de-computadores)

## 1. Defini√ß√µes e Conceitos

* Estat√≠stica
	* √â uma ci√™ncia baseada na Teoria da Probabilidade, cujo o objetivo principal √© nos auxiliar a tomar decis√µes ou tirar conclus√µes em situa√ß√µes de incerteza, a partir dos dados.
	* O objetivo √© transformar dados brutos em conhecimento
* Popula√ß√£o
	* √â uma cole√ß√£o completa de todos os elementos a serem estudados e que possuem caracter√≠sticas gerais comuns. 
	* Observa√ß√£o: A popula√ß√£o deve ser bem definida. 
* Amostra
	* √â um subconjunto de membros selecionados de uma popula√ß√£o.
* Vari√°vel
	* Qualquer caracter√≠stica de interesse associada aos elementos de uma popula√ß√£o.
* Espa√ßo Amostral
	* O conjunto de todos os poss√≠veis resultados de um experimento.
* Evento
	* O resultado de um experimento (um subconjunto do espa√ßo amostral)
* Probabilidade
	* Uma medida que tem valor entre 0 e 1 para cada evento poss√≠vel. 
	* √â vista como uma quantifica√ß√£o para frequ√™ncia de ocorr√™ncia de um evento

In [None]:
# Exemplo com dataset real: pinguins (altura, peso, esp√©cie)
df = sns.load_dataset('penguins').dropna()
df.head()

## 2. Tipos de Estat√≠sticas

### Estat√≠stica Descritiva

* Fornece um **resumo dos dados** de forma num√©rica ou gr√°fica. 
* Exemplo
	* O gerente de um restaurante *fast-food* registrou os tempos de espera dos clientes no hor√°rio de almo√ßo durante uma semana e sumarizou os dados

In [None]:
espera = [3,5,7,4,6,8,10,2,5,6,7,4,8,9,3,4,6,7,5] # tempos de espera em minutos

print(f"Tempo m√©dio de espera: {statistics.mean(espera):.2f}")
print(f"Mediana: {statistics.median(espera)}")
print(f"Moda: {statistics.mode(espera)}")

### Estat√≠stica Inferencial

* Usa uma amostra aleat√≥ria dos dados coletados de uma popula√ß√£o para descrever e fazer infer√™ncias sobre a popula√ß√£o. 
* As estat√≠sticas inferenciais s√£o valiosas quando n√£o √© conveniente ou poss√≠vel examinar cada membro de uma popula√ß√£o inteira. 
* Exemplo: 
	* n√£o seria pr√°tico medir o di√¢metro de todos os pregos fabricados em uma f√°brica ...
	* mas √© poss√≠vel medir o di√¢metro de uma **amostra representativa** de pregos e usar essas informa√ß√µes para fazer generaliza√ß√µes sobre os di√¢metros dos pregos produzidos.

### Estat√≠stica Computacional

* A estat√≠stica computacional √© a interface entre estat√≠stica e ci√™ncia da computa√ß√£o. 
* Como nas estat√≠sticas tradicionais, o objetivo √© transformar dados brutos em conhecimento, mas o foco est√° em m√©todos estat√≠sticos intensivos usando **algoritmos eficientes em computadores**.
* Normalmente com tamanhos de amostra muito grandes e conjuntos de dados n√£o homog√™neos.

## 3. Medidas Estat√≠sticas

* Medidas de Posi√ß√£o
	* Moda, M√©dia, Mediana, Percentis, Quartis. 
	* Moda, M√©dia, Mediana:
		* Apontam um **valor central** e s√£o usadas para representar todo o conjunto
		* S√£o chamadas de medidas de Tend√™ncia Central
* Medidas de Dispers√£o
	* Amplitude, Dist√¢ncia Interquartil, Vari√¢ncia, Desvio Padr√£o, Coeficiente de Varia√ß√£o

### Medidas de Posi√ß√£o

#### Moda

* Valor que aparece com mais frequ√™ncia em um conjunto de dados
* Exemplo: qual √© a moda dos pesos dos pinguins

In [None]:
peso = df['body_mass_g']
print(f"Moda: {statistics.mode(peso)}")
peso.head()

#### M√©dia aritm√©trica simpes

* F√≥rmula

$$ \overline{x} = \dfrac{x_1 + x_2 + \dots + x_n}{n} = \dfrac{1}{n} \sum_{i=1}^{n} x_i $$

* Exemplo: m√©dia aritm√©trica do tamanho dos pinguins

In [None]:
nadadeiras = df['flipper_length_mm']
print(f"Comprimento m√©dio da nadadeira (em mm): {statistics.mean(nadadeiras):.2f}")
nadadeiras.head()

#### Mediana

* Valor que ocupa a posi√ß√£o central de um conjunto de N dados **ordenados**
    * Posi√ß√£o da mediana: $(n+1)/2$
* Se houver uma quantidade **√≠mpar**, a mediana ser√° o **valor central** do conjunto
* Se a quantidade de valores for um n√∫mero **par**, a mediana ser√° a m√©dia aritm√©tica dos dois n√∫meros centrais
* Exemplos:

$$ A=\{10, 12, 13, 14, 14, 15, 15, 18, 19, 20\} \rightarrow M_d(A) = \dfrac{15+15}{2} = 14.5 $$

$$ B=\{10, 12, 13, 14, 14, 15, 18, 19, 20\} \rightarrow M_d(B) = 14 $$

In [None]:
print(f"Mediana: {statistics.median(nadadeiras)}")

<img src="./figuras/mediana.png" width="60%" alt="Mediana">

Utilizando a biblioteca **numpy**

In [None]:
print(f"M√©dia: {np.mean(nadadeiras):.2f}")
print(f"Desvio Padr√£o: {np.std(nadadeiras):.2f}")
print(f"Vari√¢ncia: {np.var(nadadeiras):.2f}")

Medidas de Posi√ß√£o n√£o dizem tudo sobre os dados

<img src="./figuras/tabela-medidas-posicao.png" width="70%" alt="Tabela">

### Outras Medidas de Posi√ß√£o

#### Percentil, Quartil, Decil

* O 1¬∫ percentil determina os 1% menores valores
* O 98¬∫ percentil determina os 98% menores valores
* O 10¬∫ percentil √© o primeiro **decil**
* O 25¬∫ percentil √© o primeiro **quartil**
* O 50¬∫ percentil √© a **mediana** e segundo **quartil**
* O 75¬∫ percentil √© o terceiro **quartil** 
* O 90¬∫ percentil √© o nono **decil**

<img src="./figuras/percentil-quartil-decil.png" width="70%" alt="Percentil, Quartil, Decil">

#### Exemplo:

* Estudantes obtiveram as seguintes notas: $X=\{79, 80, 81, 81, 85, 86, 87, 88, 89, 90, 94\}$ 
* Abaixo de qual nota temos os **piores** 25%?
* Acima de qual nota temos os **melhores** 25%?
* Qual nota define os **top 10%**?


In [None]:
dados = np.array([79, 80, 81, 81, 85, 86, 87, 88, 89, 90, 94])

# Calcular o 75¬∫ percentil
percentis = np.percentile(dados, [25, 75, 90])
print(f"Os piores 25% s√£o aqueles com notas abaixo de: {percentis[0]}")
print(f"Os melhores 25% s√£o aqueles com notas acima de: {percentis[1]}")
print(f"Os top 10% s√£o aqueles com notas acima de: {percentis[2]}")

### Medidas de Disper√ß√£o

* Amplitude
    * Indica a diferen√ßa entre o **maior** e o **menor** valor observado.
* Dist√¢ncia Interquartil
    * A diferen√ßa entre o terceiro e o primeiro quartis: $DI(X) = Q3(X) - Q1(X)$
* Vari√¢ncia e desvio padr√£o
    * Medem a disper√ß√£o dos dados **em rela√ß√£o √† m√©dia**
    * F√≥rmula da vari√¢ncia: $\sigma^2 = \frac{\sum_{i=1}^{n} (y_{i}-\bar{y})^2}{n-1}$
    * Desvio padr√£o: $\sigma$
* Coeficiente de varia√ß√£o
    * Mostra a variabilidade da amostra **em rela√ß√£o √† m√©dia**, interpretado como um **percentual**
    * F√≥rmula do coeficiente de varia√ß√£o: $C_v = \dfrac{\sigma}{\mu} * 100$

Um pouco mais de informa√ß√£o...

<img src="./figuras/tabela-medidas-posicao2.png" width="80%" alt="Tabela2">

## 4. Visualiza√ß√µes

### Boxplot

Gr√°fico que resume a distribui√ß√£o de um conjunto de dados num√©ricos, mostrando o m√≠nimo, o primeiro quartil (Q1), a mediana (Q2), o terceiro quartil (Q3) e o m√°ximo, incluindo a identifica√ß√£o de valores discrepantes ou *outliers*.

In [None]:
# Gerar dados simulados (ex.: notas de uma turma)
np.random.seed(42)  # para reprodutibilidade
dados = np.random.normal(loc=70, scale=10, size=100)  # m√©dia=70, desvio=10, 100 alunos

# Criar boxplot
fig, ax = plt.subplots(figsize=(8, 5))
box = ax.boxplot(dados, vert=False, patch_artist=True,
                 boxprops=dict(facecolor="lightblue"),
                 medianprops=dict(color="red", linewidth=2),
                 showmeans=True, 
                 meanprops=dict(marker='o', markerfacecolor='green', markersize=8))

# ax.set_title("Boxplot com Anota√ß√µes")
ax.set_xlabel("Notas")

# Calcular estat√≠sticas principais
q1 = np.percentile(dados, 25)
q2 = np.median(dados)
q3 = np.percentile(dados, 75)
min_val = np.min(dados[dados > (q1 - 1.5*(q3-q1))])  # sem outliers
max_val = np.max(dados[dados < (q3 + 1.5*(q3-q1))])  # sem outliers
outliers = dados[(dados < min_val) | (dados > max_val)]

# Adicionar setas e textos
ax.annotate("M√≠nimo",
            xy=(min_val, 1.05), xytext=(min_val, 1.2),
            arrowprops=dict(facecolor='black', shrink=0.05),
            ha="center")

ax.annotate("Q1 (1¬∫ quartil)",
            xy=(q1, 1), xytext=(q1-10, 1.3),
            arrowprops=dict(facecolor='black', shrink=0.05),
            ha="center")

ax.annotate("Mediana (Q2)",
            xy=(q2, 1), xytext=(q2, 1.4),
            arrowprops=dict(facecolor='red', shrink=0.2),
            ha="center", color="red")

ax.annotate("Q3 (3¬∫ quartil)",
            xy=(q3, 1), xytext=(q3+10, 1.3),
            arrowprops=dict(facecolor='black', shrink=0.05),
            ha="center")

ax.annotate("M√°ximo",
            xy=(max_val, 1.05), xytext=(max_val, 1.2),
            arrowprops=dict(facecolor='black', shrink=0.01),
            ha="center")

ax.annotate("Outlier",
            xy=(outliers[0], 1), xytext=(outliers[0], 0.8),
            arrowprops=dict(facecolor='black', shrink=0.15),
            ha="center")

ax.annotate("M√©dia"
            , xy=(np.mean(dados), 1), xytext=(np.mean(dados)+10, 0.8),
            arrowprops=dict(facecolor='green', shrink=0.15),
            ha="center", color="green")

plt.show()

# Explica√ß√£o do boxplot:
print("Explica√ß√£o do Boxplot:")
print("- Cada caixa exibe a distribui√ß√£o das notas de uma turma.")
print("- O tamanho da caixa representa o intervalo entre o 1¬∫ quartil (Q1) e o 3¬∫ quartil (Q3).")
print("- A linha dentro da caixa mostra a mediana (Q2).")
print("- O ponto verde indica a m√©dia dos dados.")
print("- Os 'bigodes' se estendem at√© os valores m√≠nimos e m√°ximos que n√£o s√£o considerados outliers.")
print("- Os pontos fora dos bigodes (se existerem) indicam outliers (valores at√≠picos).")


In [None]:
# Gerar dados simulados para 3 turmas
np.random.seed(42)  # reprodutibilidade
turma_A = np.random.normal(loc=70, scale=10, size=100)  # m√©dia 70
turma_B = np.random.normal(loc=65, scale=12, size=100)  # m√©dia 65
turma_C = np.random.normal(loc=75, scale=8, size=100)   # m√©dia 75

# Criar lista com os dados
dados = [turma_A, turma_B, turma_C]

# Gerar o boxplot
plt.boxplot(dados, patch_artist=True, tick_labels=["Turma A", "Turma B", "Turma C"],
            boxprops=dict(facecolor="lightblue"),
            medianprops=dict(color="red", linewidth=2))

# Adicionar t√≠tulo e r√≥tulos
plt.title("Compara√ß√£o de Notas entre Turmas")
plt.ylabel("Turmas")
plt.xlabel("Notas")

# Mostrar gr√°fico
plt.show()

# Explica√ß√£o
print("""
Compara√ß√£o das notas entre as turmas

- Turma A
  ‚Ä¢ A maioria das notas ficou entre 63 e 74.
  ‚Ä¢ A mediana (linha vermelha) est√° em torno de 70.
  ‚Ä¢ H√° um aluno com nota muito fora do padr√£o, bem baixo (44) do limite inferior.

- Turma B
  ‚Ä¢ As notas variaram bastante, desde 42 at√© quase 95.
  ‚Ä¢ A mediana est√° um pouco abaixo da Turma A (‚âà66).
  ‚Ä¢ Isso mostra que alguns alunos foram muito bem, mas outros tiveram notas bem baixas, aumentando a diferen√ßa dentro da turma.

- Turma C
  ‚Ä¢ Foi a turma com melhor desempenho geral.
  ‚Ä¢ A mediana ficou em 75, mais alta que as outras turmas.
  ‚Ä¢ A maior parte dos alunos tirou notas entre 70 e 82, ou seja, pr√≥ximos uns dos outros.
  ‚Ä¢ Tamb√©m aparecem dois valores fora do padr√£o: um aluno com nota bem baixa (49) e outro com uma nota muito alta (106).

- Resumo geral
  ‚Ä¢ A Turma C foi a que se saiu melhor no conjunto.
  ‚Ä¢ A Turma B foi a mais desigual, com alunos indo muito bem e outros indo mal.
  ‚Ä¢ A Turma A ficou no meio do caminho: desempenho est√°vel, mas sem alcan√ßar a Turma C.
""")


### Histograma

Um gr√°fico de barras que mostra a contagem de dados, onde cada barra vertical √© um compartimento (**‚Äúbin‚Äù**)  que representa uma faixa de valores e a altura da barra conta a frequ√™ncia dos dados no **bin**.

In [None]:
sns.histplot(x=df["body_mass_g"], kde=True, bins=20)
plt.show()

Adicionando algumas medidas...

In [None]:
percentis = np.percentile(df["body_mass_g"], [25, 75, 90])
media = df['body_mass_g'].mean()
mediana = df['body_mass_g'].median()

sns.histplot(x=df["body_mass_g"], kde=True, bins=20)

# Adicionar linhas verticais para os valores
plt.axvline(percentis[2], color='red', linestyle='dashed', linewidth=1, label=f'90¬∫ Percentil ({percentis[2]:.2f})')
plt.axvline(percentis[1], color='green', linestyle='dashed', linewidth=1, label=f'3¬∫ Quartil ({percentis[1]:.2f})')
plt.axvline(percentis[0], color='orange', linestyle='dashed', linewidth=1, label=f'1¬∫ Quartil ({percentis[0]:.2f})')
plt.axvline(mediana, color='blue', linestyle='dashed', linewidth=1, label=f'Mediana ({mediana:.2f})')
plt.axvline(media, color='gray', linestyle='dashed', linewidth=1, label=f'M√©dia ({media:.2f})')

# Adicionar r√≥tulos para cada linha
plt.text(percentis[2] + 0.5, plt.ylim()[1]*0.96, f'{percentis[2]:.2f}', color='red', fontsize=9)
plt.text(percentis[1] + 0.5, plt.ylim()[1]*0.96, f'{percentis[1]:.2f}', color='green', fontsize=9)
plt.text(percentis[0] + 0.5, plt.ylim()[1]*0.96, f'{percentis[0]:.2f}', color='orange', fontsize=9)
plt.text(mediana + 0.5, plt.ylim()[1]*0.96, f'{mediana:.2f}', color='blue', fontsize=9)
plt.text(media + 0.5, plt.ylim()[1]*0.92, f'{media:.2f}', color='gray', fontsize=9)

# Adicionar t√≠tulos e r√≥tulos aos eixos
plt.title('Histograma com Percentil e Quartis')
plt.xlabel('Valores')
plt.ylabel('Frequ√™ncia')
plt.legend(loc=(0.55, 0.6)) # Mostra as legendas das linhas verticais
plt.grid(axis='y', alpha=0.75)
plt.show()

Exemplo interativo

In [None]:
# pip3 install ipywidgets
from ipywidgets import interact, IntSlider, FloatSlider

# Gerando dados de exemplo (distribui√ß√£o normal)
np.random.seed(42)
dados = np.random.randn(1000)

# Fun√ß√£o para plotar o histograma
def plot_hist(bins=10):
    plt.figure(figsize=(6, 4))
    plt.hist(dados, density=True, alpha=0.6, bins=bins, color='skyblue', edgecolor='black')
    plt.title(f"Histograma Interativo (bins = {bins})")
    plt.xlabel("Valores")
    plt.ylabel("Frequ√™ncia")
    plt.show()

# Widget interativo para controlar o n√∫mero de bins
interact(plot_hist, bins=IntSlider(min=5, max=50, step=1, value=10))


Outro exemplo interativo...

In [None]:
# Fun√ß√£o para plotar histograma + curva da Normal
def plot_hist(mu=170, sigma=10, bins=20):
    # Gerando dados simulados
    np.random.seed(42)
    dados = np.random.normal(loc=mu, scale=sigma, size=1000)

    # Criando histograma com densidade
    plt.figure(figsize=(8,5))
    plt.hist(dados, bins=bins, density=True, alpha=0.6, 
             color='skyblue', edgecolor='black', label="Histograma (densidade)")

    # Curva te√≥rica da normal
    x = np.linspace(mu - 4*sigma, mu + 4*sigma, 200)
    pdf = norm.pdf(x, loc=mu, scale=sigma)
    plt.plot(x, pdf, 'r-', lw=2, label="Distribui√ß√£o Normal (te√≥rica)")

    plt.title(f"Histograma de Densidade (Œº={mu}, œÉ={sigma}, bins={bins})")
    plt.xlabel("Valores")
    plt.ylabel("Densidade de probabilidade")
    plt.legend()
    plt.grid(True, linestyle="--", alpha=0.6)
    plt.show()

# Widgets interativos
interact(plot_hist, 
         mu=FloatSlider(min=150, max=190, step=1, value=170, description="M√©dia (Œº)"),
         sigma=FloatSlider(min=5, max=20, step=1, value=10, description="Desvio (œÉ)"),
         bins=IntSlider(min=5, max=50, step=1, value=20, description="Bins"))


Gr√°fico com v√°rias curvas normais, todas com a mesma m√©dia e variando o desvio padr√£o
* Todas as curvas est√£o centralizadas em 170 (mesma m√©dia).
* Quando o œÉ √© pequeno (ex.: 5), a curva √© mais estreita e alta.
* Quando o œÉ √© maior (ex.: 20), a curva fica mais larga e baixa, espalhando os valores.

In [None]:
# Par√¢metros
mu = 170                 # m√©dia fixa
sigmas = [5, 10, 15, 20] # diferentes desvios padr√µes
x = np.linspace(130, 210, 400)

# Plotando as curvas
plt.figure(figsize=(8,5))

for sigma in sigmas:
    pdf = norm.pdf(x, loc=mu, scale=sigma)
    plt.plot(x, pdf, lw=2, label=f"œÉ={sigma}")

plt.title("Distribui√ß√µes Normais com a mesma m√©dia (Œº=170) e diferentes œÉ")
plt.xlabel("Valores")
plt.ylabel("Densidade de Probabilidade")
plt.legend()
plt.grid(True, linestyle="--", alpha=0.6)
plt.show()


## 5. Vari√°veis Aleat√≥rias e Fun√ß√µes de Probabilidade

* Uma VA √© uma vari√°vel cujos valores dependem dos resultados de um experimento aleat√≥rio
    * Lembrando: **experimento aleat√≥rio = evento**
* Uma VA mapeia um evento em um n√∫mero
* Vari√°veis podem ser **discretas** ou **cont√≠nuas**

### Vari√°vel Aleat√≥ria Discreta

* √â uma vari√°vel cujos valores s√£o cont√°veis
* Exemplos de Vari√°veis Aleat√≥rias Discretas:
    * $H=\{0,1,2,3,4,5\}$, quantas ‚Äúcaras‚Äù em 5 lan√ßamentos de uma moeda
    * $X$ = estado do servidor: 1 se ativo, 0 se inativo
    * $Y$ = n√∫mero de pacotes IP por intervalo de tempo
    * $D$ = valor do lan√ßamento de um dado
    * $I = {0,1}$, Zero se o lan√ßamento do dado for par,  1 se for √≠mpar
    * $Z = {0,1}$, Zero se o lan√ßamento do dado <=3,  1 se for >3

### Vari√°vel Aleat√≥ria Cont√≠nua

* √â uma vari√°vel cujos dados podem assumir infinitos valores
* Exemplos de Vari√°veis Aleat√≥rias Cont√≠nuas:
    * $X$ = Tempo entre pacotes
    * $Y$ = Jitter de pacotes
    * $Z$ = Tempo de resposta do servidor
    * $H$ = Altura de pessoas 

### Exemplo de Vari√°vel Aleat√≥ria

* Um dado √© jogado repetidamente at√© que um 6 seja obtido
  * Espa√ßo amostral: $\{1,2,3,4,5,6\}$
  * Evento: "o valor do dado √© 6"
* Problema
  * Analisar a probabilidade do evento "$X=6$" quando fazemos 1, 2, 3, ... N lan√ßamentos
* Racionalidade
  * Seja $X$ a VA que representa **o n√∫mero de vezes que jogamos o dado at√© obter um 6**
  * Para conseguir um 6 no primeiro arremesso temos que $P(X=1) = 1/6$
  * Para conseguir um 6 no segundo arremesso temos que
    * N√£o obter um 6 no primeiro arremese **E** obter um 6 no segundo
    * $P(X=2) = (5/6)(1/6) ‚âà 0.138$
* Em geral, para conseguir um 6 em $x$ lan√ßamentos √©

$$ P(X=x) = (\dfrac{5}{6})^{x-1} (\dfrac{1}{6})^1 $$

In [None]:
# Definindo a fun√ß√£o de probabilidade P(X=x)
def prob(x):
    return (5/6)**(x-1) * (1/6)

# Valores de x (n√∫mero de lan√ßamentos at√© sair 6)
x = np.arange(1, 11)  # at√© 15 lan√ßamentos

# Calculando as probabilidades
p = [prob(i) for i in x]

# Exibindo valores
for i, val in zip(x, p):
    print(f"P(X={i}) = {val:.5f}")


### PDF (Probability Density / Mass Function)

* √â a fun√ß√£o de probabilidade de uma vari√°vel aleat√≥ria.
* Para vari√°veis discretas (como o lan√ßamento de um dado), usamos PMF (Probability Mass Function).
* Indica a probabilidade de o evento assumir um valor espec√≠fico.

In [None]:
# Par√¢metros
p = 1/6
N = 20
x = np.arange(1, N+1)
pdf = geom.pmf(x, p)

# Plot PDF
plt.figure(figsize=(8,5))
plt.stem(x, pdf, basefmt=" ")
plt.title("Fun√ß√£o de Probabilidade (PDF) - Distribui√ß√£o Geom√©trica")
plt.xlabel("N√∫mero de lan√ßamentos at√© sair 6 (X)")
plt.ylabel("P(X = x)")
plt.grid(True, linestyle="--", alpha=0.6)

# Valores a destacar
destacar = [1, 2, 5]

for d in destacar:
    plt.annotate(f"P(X={d})={pdf[d-1]:.3f}", 
                 xy=(d, pdf[d-1]), 
                 xytext=(d+1, pdf[d-1]),
                 arrowprops=dict(facecolor='red', arrowstyle="->"),
                 fontsize=10, color="red")

plt.show()


### CDF (Cumulative Distribution Function)

* √â a fun√ß√£o de distribui√ß√£o acumulada.
* Mostra a probabilidade de a vari√°vel assumir um valor menor ou igual a x.
* √â obtida pela soma (no caso discreto) ou integral (no caso cont√≠nuo) da PDF.
* Exemplo: $P(X ‚â§ 3) = P(X=1) + P(X=2) + P(X=3)$ ‚Üí probabilidade de sair o primeiro 6 at√© o 3¬∫ lan√ßamento.

In [None]:
# CDF
cdf = geom.cdf(x, p)

# Plot CDF
plt.figure(figsize=(8,5))
plt.step(x, cdf, where="post")
plt.title("Fun√ß√£o de Distribui√ß√£o Acumulada (CDF) - Distribui√ß√£o Geom√©trica")
plt.xlabel("N√∫mero de lan√ßamentos at√© sair 6 (X)")
plt.ylabel("P(X ‚â§ x)")
plt.ylim(0, 1.05)
plt.grid(True, linestyle="--", alpha=0.6)

# Valores a destacar
destacar = [3, 5, 10]

for d in destacar:
    plt.annotate(f"P(X‚â§{d})={cdf[d-1]:.3f}", 
                 xy=(d, cdf[d-1]), 
                 xytext=(d+1, cdf[d-1]-0.1),
                 arrowprops=dict(facecolor='blue', arrowstyle="->"),
                 fontsize=10, color="blue")

plt.show()


## 6. Distribui√ß√µes de Probabilidade

### Distribui√ß√£o de Poisson: 

Modela a probabilidade de ocorr√™ncia de um n√∫mero de eventos discretos (neste caso, conex√µes em um servidor) em um intervalo de tempo, assumindo uma taxa m√©dia de Œª = 4 conex√µes por hora. O gr√°fico de barras mostra as probabilidades para valores de 0 a 9 conex√µes.

In [None]:
# Distribui√ß√£o de Poisson: conex√µes em servidor (Œª=4 por hora)
x = range(0,10)
pmf = poisson.pmf(x, mu=4)
plt.bar(x, pmf)
plt.title('Distribui√ß√£o de Poisson (Œª=4)')
plt.show()

### Distribui√ß√£o Normal: 

Representa a varia√ß√£o cont√≠nua de uma caracter√≠stica (exemplo: alturas), com m√©dia Œº = 170 cm e desvio padr√£o œÉ = 10 cm. O gr√°fico resultante exibe a fun√ß√£o densidade de probabilidade, no formato de uma curva em sino.

In [None]:
# Fun√ß√£o para plotar a distribui√ß√£o normal com par√¢metros interativos
def plot_normal(mu=170, sigma=10):
    x = np.linspace(140, 200, 200)
    pdf = norm.pdf(x, loc=mu, scale=sigma)
    
    plt.figure(figsize=(8,5))
    plt.plot(x, pdf, color="blue", lw=2)
    plt.title(f"Distribui√ß√£o Normal (Œº={mu}, œÉ={sigma})")
    plt.xlabel("Altura (cm)")
    plt.ylabel("Densidade de Probabilidade")
    plt.grid(True, linestyle="--", alpha=0.6)
    plt.show()

# Widgets interativos: m√©dia e desvio padr√£o
interact(plot_normal, 
         mu=FloatSlider(min=150, max=190, step=1, value=170, description="M√©dia (Œº)"),
         sigma=FloatSlider(min=5, max=20, step=1, value=10, description="Desvio (œÉ)"))


In [None]:
# Distribui√ß√£o Normal: alturas (simula√ß√£o)
x = np.linspace(140, 200, 100)
pdf = norm.pdf(x, loc=170, scale=10)
plt.plot(x, pdf)
plt.title('Distribui√ß√£o Normal (Œº=170, œÉ=10)')
plt.show()

## 6. Processo Estoc√°stico

### Estoc√°stico vs Determin√≠stico

* Processo Determin√≠stico
    * Qualquer ponto do processo pode ser determinado a partir das condi√ß√µes iniciais
    * Comportamento √© previs√≠vel
    * Oposto de **rand√¥mico**
    * Exemplos
    * Posi√ß√£o de um carro em velocidade constante no tempo T
    * O saldo de um investimento com taxa pr√©-fixada.
    * A rela√ß√£o entre o raio de um c√≠rculo e sua √°rea

* Processo Estoc√°stico
    * Estoc√°stico = **aleat√≥rio**
    * Descreve o comportamento de uma cole√ß√£o de eventos rand√¥micos
    * As condi√ß√µes iniciais n√£o s√£o suficientes para determinar o estado no tempo $T$
    * Flutua√ß√µes aleat√≥rias tornam imposs√≠vel a previsibilidade
    * Podemos apenas dizer sobre o comportamento **prov√°vel** 
    * Informa√ß√µes s√£o obtidas atrav√©s de uma s√©rie de observa√ß√µes

* Exemplo: c√≥digo em Python que simula a evolu√ß√£o do tamanho de uma fila em um banco ao longo do tempo, utilizando um processo estoc√°stico
    * A fila come√ßa com 5 pessoas
    * A cada passo de tempo, o tamanho da fila varia de acordo com uma escolha aleat√≥ria entre $-2, -1, 0, 1, 2$ (representando sa√≠das ou entradas de clientes)
    * O tamanho nunca fica negativo, pois √© aplicado $max(0, ...)$
    * O resultado √© um gr√°fico de linha mostrando como a fila cresce ou diminui de forma aleat√≥ria no decorrer do tempo

üëâ Esse tipo de simula√ß√£o ajuda a visualizar fen√¥menos aleat√≥rios em processos de chegada e atendimento, comuns em teoria de filas e an√°lise de desempenho.

In [None]:
import random

fila = [5]
for i in range(1,50):
    fila.append(max(0, fila[-1] + random.choice([-2,-1,0,1,2])))

plt.plot(fila)
plt.title("Simula√ß√£o de Fila em Banco (Processo Estoc√°stico)")
plt.xlabel("Tempo")
plt.ylabel("Tamanho da fila")
plt.show()

Outra vers√£o que roda v√°rias simula√ß√µes da fila e mostra todas no mesmo gr√°fico para comparar diferentes cen√°rios.

* O que muda em rela√ß√£o ao anterior:
    * Uma fun√ß√£o *simular_fila* foi criada para facilitar a repeti√ß√£o
    * S√£o executadas 5 simula√ß√µes independentes, cada uma representando um cen√°rio poss√≠vel
    * O gr√°fico final mostra todas as curvas, permitindo comparar a evolu√ß√£o da fila em diferentes situa√ß√µes

In [None]:
# Fun√ß√£o para simular a evolu√ß√£o da fila
def simular_fila(tamanho_inicial=5, passos=50):
    fila = [tamanho_inicial]
    for i in range(1, passos):
        fila.append(max(0, fila[-1] + random.choice([-2, -1, 0, 1, 2])))
    return fila

# Rodar v√°rias simula√ß√µes
num_simulacoes = 5
for i in range(num_simulacoes):
    fila = simular_fila()
    plt.plot(fila, label=f"Simula√ß√£o {i+1}")

# Personalizar gr√°fico
plt.title("Simula√ß√£o de Fila em Banco (Processos Estoc√°sticos)")
plt.xlabel("Tempo")
plt.ylabel("Tamanho da Fila")
plt.legend()
plt.show()


Outra vers√£o com m√∫ltiplas simula√ß√µes e o resultado da m√©dia destacado.

* O que foi adicionado:
    * As simula√ß√µes s√£o armazenadas em uma lista simulacoes
    * A fun√ß√£o **np.mean(..., axis=0)** foi usada para calcular a m√©dia em cada instante de tempo
    * Foi utilizada uma linha preta mais grossa para a m√©dia, destacando a tend√™ncia geral da fila

In [None]:
# Fun√ß√£o para simular a evolu√ß√£o da fila
def simular_fila(tamanho_inicial=5, passos=50):
    fila = [tamanho_inicial]
    for i in range(1, passos):
        fila.append(max(0, fila[-1] + random.choice([-2, -1, 0, 1, 2])))
    return fila

# Rodar v√°rias simula√ß√µes
num_simulacoes = 10
simulacoes = []

for i in range(num_simulacoes):
    fila = simular_fila()
    simulacoes.append(fila)
    plt.plot(fila, alpha=0.6, label=f"Simula√ß√£o {i+1}")

# Calcular a m√©dia em cada instante de tempo
media = np.mean(simulacoes, axis=0)

# Adicionar linha da m√©dia em destaque
plt.plot(media, color="black", linewidth=3, label="M√©dia das Simula√ß√µes")

# Personalizar gr√°fico
plt.title("Simula√ß√£o de Fila em Banco (Processos Estoc√°sticos)")
plt.xlabel("Tempo")
plt.ylabel("Tamanho da Fila")
plt.legend()
plt.show()


## 7. Aplica√ß√µes em Redes de Computadores

O c√≥digo em Python a seguir gera e visualiza uma simula√ß√£o do jitter em pacotes de rede.

O jitter representa a varia√ß√£o do atraso entre pacotes sucessivos em uma transmiss√£o.

Ele √© simulado aqui por meio de uma distribui√ß√£o exponencial com par√¢metro scale=0.5, gerando 200 valores aleat√≥rios.

O histograma √© constru√≠do com a biblioteca Seaborn (sns.histplot), mostrando a frequ√™ncia dos valores de jitter.

A curva de densidade (KDE) √© sobreposta ao histograma, facilitando a interpreta√ß√£o da distribui√ß√£o.

O gr√°fico final exibe como esses atrasos variam, o que √© importante para avaliar a qualidade de servi√ßos de rede em tempo real, como voz e v√≠deo.

In [None]:
# Exemplo de jitter simulado entre pacotes
jitter = np.random.exponential(scale=0.5, size=200)
sns.histplot(jitter, bins=20, kde=True)
plt.title("Distribui√ß√£o de Jitter de Pacotes")
plt.show()

Aqui est√° uma vers√£o que compara dois cen√°rios de jitter em redes.

* O que esse c√≥digo mostra:
    * Rede est√°vel ‚Üí jitter menor, concentrado pr√≥ximo de zero
    * Rede congestionada ‚Üí jitter maior, mais disperso
    * O gr√°fico sobrep√µe as distribui√ß√µes, facilitando a compara√ß√£o entre os cen√°rios

In [None]:
# Simular jitter em dois cen√°rios
np.random.seed(42)
jitter_estavel = np.random.exponential(scale=0.3, size=200)     # rede mais est√°vel
jitter_congestionada = np.random.exponential(scale=1.0, size=200)  # rede congestionada

# Plotar comparativo
plt.figure(figsize=(8,5))
sns.histplot(jitter_estavel, bins=20, kde=True, color="blue", label="Rede Est√°vel", alpha=0.6)
sns.histplot(jitter_congestionada, bins=20, kde=True, color="red", label="Rede Congestionada", alpha=0.6)

# Personalizar gr√°fico
plt.title("Compara√ß√£o da Distribui√ß√£o de Jitter (Rede Est√°vel vs Congestionada)")
plt.xlabel("Jitter (s)")
plt.ylabel("Frequ√™ncia")
plt.legend()
plt.show()
