## **1.3 - Distribuições estatísticas importantes para o mercado financeiro**

Após compreendermos os momentos estatísticos que caracterizam variáveis aleatórias, precisamos entender as distribuições de probabilidade propriamente ditas. Uma distribuição de probabilidade é uma descrição matemática completa de como a probabilidade está distribuída entre os possíveis valores que uma variável aleatória pode assumir.

Imagine que você está modelando os retornos diários de uma ação. Não basta saber apenas a média (primeiro momento) e a variância (segundo momento) desses retornos. Você precisa de um modelo completo que descreva a probabilidade de cada possível retorno. As distribuições de probabilidade são exatamente isso: modelos matemáticos que especificam completamente o comportamento probabilístico de uma variável aleatória.

Por exemplo, se assumirmos que os retornos seguem uma distribuição normal, estamos dizendo que eventos extremos (grandes ganhos ou grandes perdas) são muito raros e que a distribuição é perfeitamente simétrica. Se, por outro lado, usarmos uma distribuição t de Student, estamos reconhecendo que eventos extremos ocorrem com mais frequência do que a normalidade prevê.

A escolha da distribuição correta é crucial em finanças quantitativas porque:

- **Afeta a estimação de risco:** Distribuições diferentes implicam diferentes probabilidades de perdas extremas.
- **Impacta a precificação de derivativos:** O preço de uma opção depende fortemente da distribuição assumida para o ativo subjacente.
- **Determina estratégias de gestão de risco:** Modelos de VaR, stress testing e alocação de capital dependem da distribuição escolhida.
- **Influencia decisões de investimento:** A distribuição dos retornos afeta diretamente a atratividade de diferentes estratégias.

Nesta seção, exploraremos algumas das distribuições mais importantes em finanças quantitativas, começando pelas mais básicas e progredindo para as mais sofisticadas e realistas.


### **Distribuição Uniforme**


A distribuição uniforme é a distribuição de probabilidade mais simples, atribuindo probabilidade igual a todos os valores em um intervalo. **Se sabemos apenas que uma variável está em um determinado intervalo, mas não temos razão para acreditar que qualquer valor seja mais provável que outro, a distribuição uniforme é a escolha natural.**

Imagine que você sabe que um evento acontecerá em algum momento entre 9h e 17h, mas não tem informação adicional sobre quando. A distribuição uniforme atribui a mesma probabilidade a cada momento dentro desse intervalo.

Embora pareça simples demais para finanças, a distribuição uniforme é fundamental em simulações de Monte Carlo, geração de números aleatórios, e como distribuição de referência em muitos contextos teóricos.

Por exemplo, se uma variável $X$ segue uma distribuição uniforme em $[0, 10]$:
- Probabilidade de $X \in [3, 5]$: $(5-3)/(10-0) = 0.2$ (20%)
- Probabilidade de $X < 4$: $4/10 = 0.4$ (40%)
- Todos os intervalos de mesmo comprimento têm a mesma probabilidade

#### *Definição Formal*

Uma variável aleatória $X$ segue uma **distribuição uniforme contínua** no intervalo $[a, b]$, denotada por $X \sim U(a, b)$, se sua função densidade de probabilidade é:

$$
f_X(x) = \begin{cases}
\frac{1}{b-a} & \text{se } a \leq x \leq b \\
0 & \text{caso contrário}
\end{cases}
$$

**Função de distribuição acumulada:**

$$
F_X(x) = \begin{cases}
0 & \text{se } x < a \\
\frac{x-a}{b-a} & \text{se } a \leq x \leq b \\
1 & \text{se } x > b
\end{cases}
$$

**Parâmetros:**
- $a \in \mathbb{R}$: limite inferior do intervalo
- $b > a$: limite superior do intervalo

**Uniforme padrão:** Quando $a = 0$ e $b = 1$, temos $U(0,1)$, a uniforme padrão, fundamental para geração de variáveis aleatórias.

#### *Momentos da Distribuição Uniforme*

**Média (valor esperado):**
$$
E[X] = \frac{a + b}{2}
$$

- A média é exatamente o ponto médio do intervalo, como esperado por simetria.

**Variância:**
$$
Var(X) = \frac{(b-a)^2}{12}
$$

**Desvio padrão:**
$$
\sigma = \frac{b-a}{2\sqrt{3}} \approx 0.289(b-a)
$$

**Skewness:**
$$
Skew(X) = 0
$$

- A distribuição é perfeitamente simétrica.

**Curtose:**
$$
Kurt(X) = \frac{9}{5} = 1.8 \quad \text{ou} \quad Kurt_{excess}(X) = -\frac{6}{5} = -1.2
$$

- A curtose em excesso negativa indica que a uniforme tem caudas mais leves que a normal (é platicúrtica).

**Mediana:**
$$
\text{Mediana}(X) = \frac{a+b}{2} = E[X]
$$

**Moda:** Todos os valores em $[a,b]$ são igualmente prováveis, então tecnicamente todos são modas.

#### *Distribuição Uniforme Discreta*

Para completude, mencionamos a **distribuição uniforme discreta**, que atribui probabilidade igual a um conjunto finito de valores:

$$
P(X = x_i) = \frac{1}{n}, \quad i = 1, 2, ..., n
$$

### **Distribuição Exponencial**


A distribuição exponencial é fundamental para modelar tempos entre eventos. Ela é a distribuição contínua mais simples com a propriedade de "falta de memória", tornando-a ideal para modelar chegadas aleatórias de eventos.

Imagine que você está monitorando quanto tempo leva até a próxima transação de uma ação, ou quanto tempo passa até o próximo salto de preço. Se esses eventos ocorrem aleatoriamente a uma taxa constante, o tempo entre eventos seguirá uma distribuição exponencial.

A propriedade de "falta de memória" significa que, se já esperamos um certo tempo sem que o evento ocorra, a distribuição do tempo adicional de espera é a mesma que no início. Em outras palavras, o processo não "envelhece", a probabilidade de ocorrer no próximo instante é sempre a mesma.

Por exemplo, se os trades de uma ação chegam em média a cada 5 segundos (taxa $\lambda = 0.2$ por segundo), então:

- Probabilidade de esperar menos de 2 segundos: $P(X < 2) = 1 - e^{-0.2 \cdot 2} \approx 0.33$ (33%)
- Probabilidade de esperar mais de 10 segundos: $P(X > 10) = e^{-0.2 \cdot 10} \approx 0.135$ (13.5%)
- Tempo mediano de espera: $\ln(2)/0.2 \approx 3.47$ segundos

#### *Definição Formal*

Uma variável aleatória $X$ segue uma **distribuição exponencial** com parâmetro de taxa $\lambda > 0$, denotada por $X \sim \text{Exp}(\lambda)$, se sua função densidade de probabilidade é:

$$
f_X(x) = \lambda e^{-\lambda x}, \quad x \geq 0
$$

**Função de distribuição acumulada:**
$$
F_X(x) = P(X \leq x) = 1 - e^{-\lambda x}, \quad x \geq 0
$$

**Parâmetro:**
- $\lambda > 0$: taxa de ocorrência (número esperado de eventos por unidade de tempo)

**Parametrização alternativa:** Às vezes usa-se $\beta = 1/\lambda$ (tempo médio entre eventos):
$$
f_X(x) = \frac{1}{\beta} e^{-x/\beta}
$$

#### *Momentos da Distribuição Exponencial*

**Média (valor esperado):**
$$
E[X] = \frac{1}{\lambda}
$$

- Esse é o tempo médio entre eventos. Se $\lambda = 0.2$ eventos por segundo, então o tempo médio entre eventos é $1/0.2 = 5$ segundos.

**Variância:**
$$
Var(X) = \frac{1}{\lambda^2}
$$

- Observe que o desvio padrão é igual à média: $\sigma = 1/\lambda = E[X]$.

**Skewness:**
$$
Skew(X) = 2
$$

- A distribuição exponencial sempre tem skewness positiva de valor 2, indicando forte assimetria à direita.

**Curtose:**
$$
Kurt(X) = 9 \quad \text{ou} \quad Kurt_{excess}(X) = 6
$$

- A curtose elevada indica caudas relativamente pesadas para uma distribuição tão simples.


**Mediana:**
$$
\text{Mediana}(X) = \frac{\ln(2)}{\lambda} \approx \frac{0.693}{\lambda}
$$

- A mediana é sempre menor que a média devido à assimetria positiva.

**Moda:**
$$
\text{Moda}(X) = 0
$$

- O valor mais provável é sempre zero, com probabilidade decrescendo monotonicamente.


### **Distribuição Normal (Gaussiana)**

A distribuição normal, também conhecida como distribuição gaussiana ou curva em sino, é provavelmente a distribuição de probabilidade mais importante em toda a estatística e, historicamente, tem sido a mais utilizada em finanças.

**A distribuição normal descreve fenômenos onde valores próximos à média são muito mais prováveis do que valores extremos, e a distribuição é perfeitamente simétrica.** Imagine medir a altura de pessoas adultas em uma população: a maioria estará próxima à média, com poucos indivíduos muito baixos ou muito altos, formando uma curva em formato de sino.

Em finanças, durante muito tempo assumiu-se que retornos de ativos seguiam distribuições normais. Embora saibamos hoje que isso é uma simplificação, a distribuição normal continua sendo fundamental por diversas razões: é matematicamente tratável, possui propriedades muito convenientes, e serve como ponto de partida para modelos mais sofisticados.

Por exemplo, suponha que os retornos diários de uma certa ação seguem uma distribuição normal com média $\mu = 0,05\%$ e desvio padrão $\sigma = 1,5\%$, então:

- Aproximadamente 68% dos retornos estarão entre $-1,45\%$ e $1,55\%$ (dentro de 1 desvio padrão)
- Aproximadamente 95% estarão entre $-2,95\%$ e $3,05\%$ (dentro de 2 desvios padrão)
- Retornos abaixo de $-4,45\%$ ou acima de $4,55\%$ (3 desvios padrão) ocorrerão em menos de 0,3% dos dias

*Observe quanta informação é possível obter ao saber a distribuição dos retornos (hipótese irrealista).*


#### *Definição Formal*



Uma variável aleatória $X$ segue uma **distribuição normal** com parâmetros $\mu$ (média) e $\sigma^2$ (variância), denotada por $X \sim N(\mu, \sigma^2)$, se sua função densidade de probabilidade é dada por:

$$
f_X(x) = \frac{1}{\sigma\sqrt{2\pi}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right), \quad x \in \mathbb{R}
$$

**Parâmetros:**
- $\mu \in \mathbb{R}$: parâmetro de localização (média da distribuição)
- $\sigma > 0$: parâmetro de escala (desvio padrão)
- $\sigma^2$: variância da distribuição

**Distribuição Normal Padrão:** Quando $\mu = 0$ e $\sigma = 1$, temos a distribuição normal padrão, denotada por $Z \sim N(0,1)$:

$$
\phi(z) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{z^2}{2}\right)
$$

Qualquer distribuição normal pode ser padronizada através da transformação:

$$
Z = \frac{X - \mu}{\sigma}
$$

#### *Propriedades da Distribuição Normal*



A distribuição normal possui propriedades matemáticas excepcionalmente convenientes:

1. **Simetria:** A distribuição é perfeitamente simétrica em torno de $\mu$, ou seja, $Skew(X) = 0$.

2. **Curtose:** $Kurt(X) = 3$ ou $Kurt_{excess}(X) = 0$. Eventos extremos seguem probabilidades específicas e bem definidas.

3. **Estabilidade por combinações lineares:** Se $X \sim N(\mu_X, \sigma_X^2)$ e $Y \sim N(\mu_Y, \sigma_Y^2)$ são independentes, então:
   $$
   aX + bY \sim N(a\mu_X + b\mu_Y, a^2\sigma_X^2 + b^2\sigma_Y^2)
   $$
   Esta propriedade é extremamente importante para análise de portfólios: se os retornos dos ativos individuais são normais e independentes, o retorno do portfólio também será normal.

4. **Transformações afins:** Se $X \sim N(\mu, \sigma^2)$, então para constantes $a \neq 0$ e $b$:
   $$
   aX + b \sim N(a\mu + b, a^2\sigma^2)
   $$

5. **Regra 68-95-99.7:** Aproximadamente:
   - 68.27% da probabilidade está dentro de $[\mu - \sigma, \mu + \sigma]$
   - 95.45% está dentro de $[\mu - 2\sigma, \mu + 2\sigma]$
   - 99.73% está dentro de $[\mu - 3\sigma, \mu + 3\sigma]$

6. **Teorema Central do Limite:** Sob condições gerais, a soma (ou média) de muitas variáveis aleatórias independentes converge para uma distribuição normal, independentemente das distribuições originais. Esta é uma das razões fundamentais para a ubiquidade da distribuição normal.

#### *Limitações em Finanças*


Apesar de sua importância teórica, a distribuição normal apresenta limitações sérias quando aplicada a retornos financeiros:

1. **Caudas leves demais:** A normal subestima drasticamente a probabilidade de eventos extremos. Crashes de mercado (quedas de 5+ desvios padrão) ocorrem muito mais frequentemente do que o previsto pela normalidade.

2. **Simetria irreal:** Retornos de ações frequentemente apresentam assimetria negativa (mais quedas bruscas que subidas bruscas), violando a simetria da normal.

3. **Suporte ilimitado:** A distribuição normal permite valores arbitrariamente negativos, o que é problemático para preços de ativos (que não podem ser negativos) ou para retornos simples (que não podem ser menores que -100%).

4. **Volatilidade constante:** A normal assume variância constante, mas sabemos que a volatilidade de mercados financeiros muda ao longo do tempo (clustering de volatilidade).

5. **Independência:** Modelos baseados na normal frequentemente assumem independência temporal, ignorando autocorrelações e dependências não-lineares presentes em dados reais.

Evidências empíricas mostram consistentemente que retornos financeiros têm caudas mais pesadas (curtose elevada) e frequentemente assimetria negativa, características que a distribuição normal não captura.

### **Distribuição Log-Normal**



A distribuição log-normal surge naturalmente em finanças quando modelamos preços de ativos que evoluem multiplicativamente ao longo do tempo. Se os log-retornos de um ativo seguem uma distribuição normal, então os preços seguem uma distribuição log-normal.

Imagine que o preço de uma ação muda a cada dia por um fator multiplicativo (cresce ou diminui por uma porcentagem). Se esses fatores são aproximadamente normalmente distribuídos, o preço acumulado após muitos períodos seguirá uma distribuição log-normal. Isso garante que os preços permaneçam sempre positivos, ao contrário da distribuição normal.

A distribuição log-normal é fundamental porque resolve um dos problemas da normal: preços de ativos nunca podem ser negativos, mas a distribuição normal permite valores negativos. A log-normal, por construção, só assume valores positivos.

Por exemplo, se uma ação tem preço inicial de $\$100$ e seus retornos logarítmicos diários seguem $N(0.0005, 0.02^2)$, então após um ano (252 dias úteis), o preço seguirá aproximadamente uma distribuição log-normal. O preço esperado será $E[S_T] = 100 \cdot e^{252 \cdot (0.0005 + 0.02^2/2)} \approx \$113.28$.

#### *Definição Formal*

Uma variável aleatória $X$ segue uma **distribuição log-normal** com parâmetros $\mu$ e $\sigma^2$, denotada por $X \sim LogN(\mu, \sigma^2)$, se $\ln(X) \sim N(\mu, \sigma^2)$.

Equivalentemente, se $Y \sim N(\mu, \sigma^2)$, então $X = e^Y$ segue uma distribuição log-normal.

**Função densidade de probabilidade:**
$$
f_X(x) = \frac{1}{x\sigma\sqrt{2\pi}} \exp\left(-\frac{(\ln x - \mu)^2}{2\sigma^2}\right), \quad x > 0
$$

**Observação crucial:** Os parâmetros $\mu$ e $\sigma^2$ **não** são a média e variância de $X$, mas sim do logaritmo de $X$.

#### *Momentos da Distribuição Log-Normal*

Se $$X \sim LogN(\mu, \sigma^2), \quad \text{então:}$$

**Média (valor esperado):**
$$
E[X] = e^{\mu + \sigma^2/2}
$$

**Variância:**
$$
Var(X) = e^{2\mu + \sigma^2}(e^{\sigma^2} - 1)
$$

**Mediana:**
$$
\text{Mediana}(X) = e^\mu
$$

**Moda:**
$$
\text{Moda}(X) = e^{\mu - \sigma^2}
$$

**Skewness:**
$$
Skew(X) = (e^{\sigma^2} + 2)\sqrt{e^{\sigma^2} - 1} > 0
$$

- *A distribuição log-normal sempre tem skewness positiva, sendo assimétrica à direita.*

**Curtose:**
$$
Kurt(X) = e^{4\sigma^2} + 2e^{3\sigma^2} + 3e^{2\sigma^2} - 6
$$

- *A curtose da log-normal é sempre maior que 3 (da normal), indicando caudas mais pesadas.*

#### *Propriedades da Distribuição Log-Normal*

1. **Positividade:** $X > 0$ sempre. Isso torna a log-normal apropriada para modelar preços de ativos, que nunca podem ser negativos.

2. **Assimetria positiva:** A distribuição é sempre assimétrica à direita, com uma cauda direita mais longa. Isso captura o fato de que preços de ativos podem crescer indefinidamente, mas só podem cair até zero.

3. **Não estabilidade por soma:** Se $X_1 \sim LogN(\mu_1, \sigma_1^2)$ e $X_2 \sim LogN(\mu_2, \sigma_2^2)$ são independentes, então $X_1 + X_2$ **não** segue uma distribuição log-normal. Esta é uma diferença importante em relação à normal.

4. **Estabilidade por produto:** Se $X_1$ e $X_2$ são independentes e log-normais, então $X_1 \cdot X_2$ também é log-normal:
   $$
   X_1 \cdot X_2 \sim LogN(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)
   $$

5. **Transformação inversa:** Se $X \sim LogN(\mu, \sigma^2)$, então $1/X \sim LogN(-\mu, \sigma^2)$.

6. **Relação com retornos:** Se o preço de um ativo no tempo $t$ é $S_t$ e $\ln(S_t/S_0) \sim N(\mu t, \sigma^2 t)$, então $S_t \sim LogN(\ln S_0 + \mu t, \sigma^2 t)$.

#### *Limitações em Finanças*

Apesar de sua ampla utilização, a distribuição log-normal também apresenta limitações:

1. **Skewness sempre positiva:** Retornos de ações frequentemente têm skewness negativa, especialmente em períodos de crise. A log-normal não captura isso.

2. **Curtose insuficiente:** Embora tenha caudas mais pesadas que a normal, a log-normal ainda subestima a frequência de eventos extremos em mercados reais.

3. **Volatilidade constante:** Como a normal, a log-normal assume volatilidade constante, o que contradiz a evidência de clustering de volatilidade.

4. **Não agregabilidade:** Ao contrário da normal, retornos log-normais de um portfólio não são simplesmente a soma dos retornos log-normais individuais.

5. **Assimetria limitada:** A skewness da log-normal depende apenas de $\sigma^2$ e pode não ser flexível o suficiente para capturar diferentes regimes de mercado.

### **Distribuição t de Student**


A distribuição t de Student é uma das distribuições mais importantes para modelar retornos financeiros que apresentam caudas pesadas. Ela foi originalmente desenvolvida por William Gosset (usando o pseudônimo "Student") para pequenas amostras, mas em finanças é usada principalmente por sua capacidade de capturar eventos extremos.

**Interpretação intuitiva:** Imagine que você está modelando retornos de ações. A distribuição normal diz que retornos de 5 desvios padrão são quase impossíveis. Mas sabemos que crashes e rallies extremos ocorrem com surpreendente frequência. A distribuição t de Student tem caudas mais "pesadas", atribuindo maior probabilidade a esses eventos extremos, tornando-a muito mais realista para finanças.

A grande vantagem da distribuição t é sua flexibilidade: através de um parâmetro chamado "graus de liberdade", podemos controlar o quão pesadas são as caudas. Poucos graus de liberdade significam caudas muito pesadas (eventos extremos frequentes), enquanto muitos graus de liberdade fazem a distribuição se aproximar da normal.

Por exemplo, considere dois modelos para retornos diários de uma ação com média 0 e desvio padrão de 2%:

- **Modelo Normal:** Probabilidade de queda >10% em um dia: praticamente zero ($\approx 10^{-7}$)
- **Modelo t com 5 graus de liberdade:** Probabilidade de queda >10%: aproximadamente 0.06% (600 vezes mais provável!)

Este exemplo ilustra por que a escolha da distribuição é crucial para gestão de risco.

#### *Definição Formal*

Uma variável aleatória $X$ segue uma **distribuição t de Student** com $\nu$ graus de liberdade, localização $\mu$ e escala $\sigma$, denotada por $X \sim t_\nu(\mu, \sigma^2)$, se sua função densidade de probabilidade é:

$$
f_X(x) = \frac{\Gamma\left(\frac{\nu+1}{2}\right)}{\Gamma\left(\frac{\nu}{2}\right)\sigma\sqrt{\nu\pi}} \left(1 + \frac{1}{\nu}\left(\frac{x-\mu}{\sigma}\right)^2\right)^{-\frac{\nu+1}{2}}, \quad x \in \mathbb{R}
$$

onde $\Gamma(\cdot)$ é a função Gamma *(é recomendado que você leia sobre a função Gamma. Mas, dando um spoiler, essa função generaliza para o contínuo a ideia de fatorial)*.

**Parâmetros:**
- $\nu > 0$: graus de liberdade (determina o peso das caudas)
- $\mu \in \mathbb{R}$: parâmetro de localização (centro da distribuição)
- $\sigma > 0$: parâmetro de escala (dispersão)

**Distribuição t de Student padrão:** Quando $\mu = 0$ e $\sigma = 1$, temos a distribuição t padrão com $\nu$ graus de liberdade.

**Observação crucial sobre os parâmetros:**
- Para $\nu > 1$: $\mu = E[X]$ (média)
- Para $\nu > 2$: $\sigma^2 = \frac{\nu}{\nu-2} Var(X)$ (não é exatamente a variância!)

#### *Momentos da Distribuição t de Student*

Os momentos da distribuição t dependem criticamente dos graus de liberdade:

**Média (valor esperado):**
$$
E[X] = \mu \quad \text{se } \nu > 1
$$
- Para $\nu \leq 1$, a média não existe.

**Variância:**
$$
Var(X) = \frac{\nu}{\nu-2}\sigma^2 \quad \text{se } \nu > 2
$$
- Para $\nu \leq 2$, a variância é infinita!

**Skewness:**
$$
Skew(X) = 0 \quad \text{se } \nu > 3
$$
- A distribuição t padrão é simétrica (assim como a normal). Para $\nu \leq 3$, a skewness não está definida.

**Curtose (em excesso):**
$$
Kurt_{excess}(X) = \frac{6}{\nu-4} \quad \text{se } \nu > 4
$$
- Para $\nu \leq 4$, a curtose é infinita!
- A curtose em excesso é sempre positiva (para $\nu > 4$), indicando caudas mais pesadas que a normal
- Quanto menor $\nu$, maior a curtose (caudas mais pesadas)
- Para $\nu \to \infty$, a curtose em excesso tende a 0 (aproximando-se da normal)

#### *Propriedades da Distribuição t de Student*

1. **Convergência para a Normal:** Quando $\nu \to \infty$, $t_\nu \to N(0,1)$. Na prática, para $\nu > 30$, a distribuição t é muito próxima da normal.

2. **Caudas pesadas:** Para $\nu$ pequeno, a distribuição tem caudas muito mais pesadas que a normal. A probabilidade de eventos extremos decai polinomialmente (como $x^{-(\nu+1)}$) em vez de exponencialmente (como na normal).

3. **Simetria:** A distribuição t padrão é simétrica em torno de zero, assim como a normal. No entanto, versões assimétricas (skewed t) também existem.

4. **Robustez:** A distribuição t é mais robusta a outliers que a normal, sendo menos influenciada por observações extremas em estimação de parâmetros.

5. **Representação como mistura:** A distribuição t pode ser interpretada como uma mistura de distribuições normais com variâncias aleatórias, o que fornece intuição para suas caudas pesadas.

6. **Não estabilidade por soma:** Ao contrário da normal, a soma de variáveis t independentes não segue uma distribuição t (exceto em casos especiais).

#### *Escolha dos Graus de Liberdade*

A escolha de $\nu$ é crucial e depende do contexto:

- **$\nu = 1$:** Distribuição de Cauchy (caudas extremamente pesadas, variância infinita)
- **$\nu = 2$ a $\nu = 5$:** Caudas muito pesadas, apropriadas para mercados com eventos extremos frequentes
- **$\nu = 5$ a $\nu = 10$:** Caudas moderadamente pesadas, comum em dados de alta frequência
- **$\nu = 10$ a $\nu = 30$:** Caudas levemente mais pesadas que a normal
- **$\nu > 30$:** Aproximadamente normal

Em aplicações financeiras práticas, valores entre 3 e 10 são comuns para retornos diários de ações.

#### *Limitações e Considerações*

Apesar de suas vantagens, a distribuição t também tem limitações:

1. **Graus de liberdade constantes:** Em dados reais, o peso das caudas pode variar ao longo do tempo. A t assume $\nu$ constante.

2. **Simetria:** A t padrão é simétrica, mas retornos financeiros frequentemente têm skewness negativa. Versões assimétricas resolvem isso, mas adicionam complexidade.

3. **Não captura toda a dinâmica:** A t é uma distribuição estática. Em séries temporais, precisamos combiná-la com modelos dinâmicos (como GARCH) para capturar clustering de volatilidade.

4. **Estimação de $\nu$:** Estimar os graus de liberdade com precisão requer muitos dados, e estimativas podem ser instáveis em amostras pequenas.

5. **Momentos indefinidos:** Para $\nu$ muito pequeno, momentos de ordem superior não existem, complicando algumas análises teóricas.

### **Exercícios**

#### *1) Distribuição **Uniforme** (contínua em $[a,b]$)*


Uma variável $X$ mede o atraso (em minutos) de um processo controlado e, por projeto, sabe-se que ele fica **uniformemente** distribuído entre $a=2$ e $b=8$.

(a) Escreva a **PDF** $f_X(x)$ e a **CDF** $F_X(x)$.  
(b) Calcule $\mathbb{P}(3 \le X \le 5)$ e $\mathbb{P}(X > 7)$.  
(c) Encontre $\mathbb{E}[X]$ e $\operatorname{Var}(X)$.  
(d) Seja $Y=10- X$. Determine a distribuição de $Y$ (suporte e parâmetros) e calcule $\mathbb{P}(Y<4)$.

> *Dica:* Para $X\sim\text{Unif}(a,b)$, $f(x)=\frac{1}{b-a}$ em $[a,b]$ e $F(x)=\frac{x-a}{b-a}$ em $[a,b]$.

#### *2) Distribuição **Exponencial** (taxa $\lambda$)*

O tempo, em horas, até a próxima falha de um componente segue $T\sim\text{Exp}(\lambda)$ com $\lambda=0{,}5$.

(a) Calcule $\mathbb{P}(T\le 1)$, $\mathbb{P}(T>3)$ e $\mathbb{P}(1<T\le 3)$.  
(b) Verifique a **propriedade sem-memória** calculando $\mathbb{P}(T>3\mid T>1)$ e comparando com $\mathbb{P}(T>2)$.  
(c) Encontre $\mathbb{E}[T]$ e $\operatorname{Var}(T)$.  

> *Lembre:* Para $T\sim\text{Exp}(\lambda)$, $\mathbb{P}(T>t)=e^{-\lambda t}$, $\mathbb{E}[T]=1/\lambda$.

#### *3) Distribuição **Normal** (padrão e geral)*

Os desvios de massa de um lote seguem aproximadamente $X\sim \mathcal{N}(\mu,\sigma^2)$ com $\mu=0$ g e $\sigma=4$ g.

(a) Padronize $X$ para $Z=\frac{X-\mu}{\sigma}$ e calcule $\mathbb{P}(-4\le X\le 4)$ usando a tabela/rotina da **Normal padrão**.  
(b) Calcule $\mathbb{P}(X>6)$ e $\mathbb{P}(|X|>8)$.  
(c) Encontre o **quantil** $x_{0{,}95}$ tal que $\mathbb{P}(X\le x_{0{,}95})=0{,}95$.  
(d) Se tomamos $n=25$ amostras independentes, qual é a distribuição aproximada da média $\bar X$? Use-a para calcular $\mathbb{P}(|\bar X| \le 1)$.

> *Use:* $\bar X \sim \mathcal{N}(\mu,\sigma^2/n)$ quando $\sigma$ é conhecida e a normalidade é assumida.

#### *4) Distribuição **Log-Normal** (quando $\ln X$ é Normal)*

O tempo de processamento $X$ em ms é **positivo** e acredita-se que $\ln X \sim \mathcal{N}(\mu=2,\ \sigma^2=0{,}25)$.

(a) Calcule a **mediana** de $X$.  
(b) Calcule a **média** de $X$.  
(c) Encontre $\mathbb{P}(X\le 10)$ e $\mathbb{P}(5\le X\le 20)$.  
(d) Considere a transformação $Y=cX$ com $c=1{,}5$. Mostre que $Y$ também é log-normal e forneça os novos parâmetros em termos de $\mu$ e $\sigma$.

> *Lembre:* Se $\ln X\sim\mathcal{N}(\mu,\sigma^2)$ então $\text{med}(X)=e^\mu$ e $\mathbb{E}[X]=e^{\mu+\sigma^2/2}$.

#### *5) **Comparando distribuições** (escolha e parametrização)*

Três situações foram observadas em contextos distintos:  
(i) tempos entre chegadas a um servidor parecem não ter memória;  
(ii) erros de medição oscilam em torno de zero com caudas leves;  
(iii) rendimentos diários positivos de um ativo exibem forte assimetria à direita e são estritamente positivos.

Para cada situação, indique **qual distribuição** entre as cinco (Uniforme, Exponencial, Normal, Log-Normal, $t$ de Student) você julgaria mais adequada e **justifique em 3–4 linhas** com base em suporte, forma (simetria/assimetria), caudas e propriedades (por exemplo, sem-memória). Em seguida, **proponha parâmetros plausíveis** com base em um resumo hipotético: para (i), média $=2$ minutos; para (ii), desvio-padrão típico $=0{,}8$ da unidade de medida; para (iii), mediana $\approx 1{,}2\%$ e fator de dispersão moderado. Quando necessário, mostre como obter os parâmetros a partir desses resumos (por exemplo, $\lambda=1/\text{média}$ na exponencial; $\mu=\ln(\text{mediana})$ na log-normal).

###

## **Considerações finais sobre esse tópico**

*Idealmente, outras coisas seriam abordadas aqui. Talvez fosse legal começar com um curso básico (e rápido) sobre teoria dos conjuntos. Além disso, seria importante que fosse falado sobre teste de hipóteses e intervalo de confiança, e , por fim, sobre métodos de estimação de parâmetros. Novamente, fica aqui o convite a contribuição, caso o leitor tenha interesse, fale com Gabriel Navarro (https://github.com/GB-Navarro) ou com Lorenzo Cavalcante (https://github.com/LorenzoC5).*