# Exercício de Estatística - Tabela de Distribuição de Frequências e Gráfico

## Passo 1: Definição das Fórmulas

### **1. Frequência Absoluta (FA)**

A **frequência absoluta (FA)** corresponde ao número de ocorrências de um determinado valor (categoria).

#### Fórmula:
$$
\text{FA}_i = n_i
$$
Onde \( n_i \) é a **frequência absoluta** de uma categoria \( i \).

---

### **2. Frequência Relativa (FR)**

A **frequência relativa (FR)** é a proporção de especialistas em uma categoria em relação ao total de especialistas.

#### Fórmula:
$$
\text{FR}_i = \frac{n_i}{N}
$$
Onde:
- \( n_i \) é a **frequência absoluta** da categoria \( i \),
- \( N \) é o **total de especialistas**.

---

### **3. Frequência Absoluta Acumulada (FAA)**

A **frequência absoluta acumulada (FAA)** de uma categoria é obtida somando a frequência absoluta dessa categoria com todas as anteriores.

#### Fórmula:
$$
\text{FAA}_i = \sum_{j=1}^{i} n_j
$$
Onde \( n_j \) é a **frequência absoluta** de cada categoria anterior.

---

### **4. Frequência Relativa Acumulada (FRA)**

A **frequência relativa acumulada (FRA)** é obtida somando sucessivamente as frequências relativas de cada categoria.

#### Fórmula:
$$
\text{FRA}_i = \sum_{j=1}^{i} \frac{n_j}{N}
$$
Onde:
- \( n_j \) é a **frequência absoluta** de cada categoria,
- \( N \) é o **total de especialistas**.

---

## Passo 2: Cálculo das Frequências

Agora, vamos calcular e exibir as frequências para cada categoria:

- **Frequência Absoluta (FA)**
- **Frequência Relativa (FR)**
- **Frequência Absoluta Acumulada (FAA)**
- **Frequência Relativa Acumulada (FRA)**

A tabela abaixo mostra os cálculos para cada categoria de opinião.

---

## Passo 2: Construção da Tabela de Distribuição de Frequência






In [None]:
import pandas as pd

# Dados fornecidos
categorias = ['Muito favorável', 'Favorável', 'Neutro', 'Desfavorável', 'Muito desfavorável']
especialistas = [22, 35, 18, 15, 10]

# Calcular o total de especialistas
total_especialistas = sum(especialistas)

# Calcular as frequências relativas e mostrar os cálculos
freq_relativa = [f"{x} / {total_especialistas} = {x / total_especialistas:.2f}" for x in especialistas]

# Calcular as frequências absolutas acumuladas e mostrar os cálculos
freq_absoluta_acumulada = [f"Soma({', '.join(map(str, especialistas[:i+1]))}) = {sum(especialistas[:i+1])}" for i in range(len(especialistas))]

# Calcular as frequências relativas acumuladas e mostrar os cálculos
freq_relativa_acumulada = [f"Soma({', '.join([f'{x / total_especialistas:.2f}' for x in especialistas[:i+1]])}) = {sum([x / total_especialistas for x in especialistas[:i+1]]):.2f}" for i in range(len(especialistas))]

# Criar o DataFrame com as informações calculadas
df = pd.DataFrame({
    'Opinião': categorias,
    'Frequência Absoluta': especialistas,
    'Frequência Relativa': freq_relativa,
    'Frequência Absoluta Acumulada': freq_absoluta_acumulada,
    'Frequência Relativa Acumulada': freq_relativa_acumulada
})

# Atribuir números de 1 a 5 como índice
df.index = range(1, len(df) + 1)

# Exibir a tabela com os cálculos visíveis
from IPython.display import display  # Importando o display para exibir a tabela no Colab
display(df)



Unnamed: 0,Opinião,Frequência Absoluta,Frequência Relativa,Frequência Absoluta Acumulada,Frequência Relativa Acumulada
1,Muito favorável,22,22 / 100 = 0.22,Soma(22) = 22,Soma(0.22) = 0.22
2,Favorável,35,35 / 100 = 0.35,"Soma(22, 35) = 57","Soma(0.22, 0.35) = 0.57"
3,Neutro,18,18 / 100 = 0.18,"Soma(22, 35, 18) = 75","Soma(0.22, 0.35, 0.18) = 0.75"
4,Desfavorável,15,15 / 100 = 0.15,"Soma(22, 35, 18, 15) = 90","Soma(0.22, 0.35, 0.18, 0.15) = 0.90"
5,Muito desfavorável,10,10 / 100 = 0.10,"Soma(22, 35, 18, 15, 10) = 100","Soma(0.22, 0.35, 0.18, 0.15, 0.10) = 1.00"


# Passo 3: Análise dos Resultados

## 1. **Maioria tem percepção positiva**:
Observa-se que **57% dos especialistas** consideram o acordo **favorável** ou **muito favorável**, o que indica uma visão predominantemente positiva.

Para calcular isso, podemos somar as frequências relativas das duas primeiras categorias da tabela, como segue:

- Frequência Relativa de "Muito favorável" = 0.22
- Frequência Relativa de "Favorável" = 0.35

Somando essas duas frequências relativas:

$$
\text{FRA}_{\text{positiva}} = 0.22 + 0.35 = 0.57
$$

Portanto, **57% dos especialistas** têm uma percepção positiva sobre o acordo.

---

## 2. **Menos de 25% são neutros**:
A **posição neutra** representa apenas **18% dos especialistas**, o que sugere que a maioria dos entrevistados tem uma opinião definida sobre o tema.

De acordo com a frequência relativa de "Neutro":

- Frequência Relativa de "Neutro" = 0.18

Isso indica que **menos de 25%** dos especialistas estão em uma posição neutra.

---

## 3. **Opinião negativa é minoritária**:
Apenas **25% dos especialistas** classificam o impacto do acordo como **desfavorável** ou **muito desfavorável**, indicando que a percepção negativa não é predominante.

Para calcular isso, podemos somar as frequências relativas das duas últimas categorias da tabela:

- Frequência Relativa de "Desfavorável" = 0.15
- Frequência Relativa de "Muito desfavorável" = 0.10

Somando essas duas frequências relativas:

$$
\text{FRA}_{\text{negativa}} = 0.15 + 0.10 = 0.25
$$

Portanto, apenas **25% dos especialistas** têm uma opinião negativa sobre o acordo.

---

## 4. **Distribuição equilibrada**:
Apesar do viés positivo (com a maioria tendo uma visão favorável ou muito favorável), há especialistas em todas as categorias, o que demonstra uma **diversidade de opiniões**.

A distribuição de opiniões não é completamente unânime, pois temos especialistas tanto com uma opinião positiva quanto negativa, e também aqueles que se mantêm neutros. Isso reflete a **diversidade de percepções** sobre o impacto do acordo.


# EXERCÍCIO 6 – Identificar outlier em dados de Gestão de Desempenho

Uma empresa de tecnologia acompanha mensalmente a produtividade de seus funcionários, medida pelo número de tarefas concluídas. Abaixo estão os números de tarefas concluídas por um grupo de 15 funcionários em um mês:

**Dados**: 12, 20, 25, 30, 45, 50, 55, 60, 65, 70, 72, 78, 80, 85, 150

**Tarefa**: Determine se há outliers neste conjunto de dados (funcionários com desempenho muito acima ou abaixo do esperado), utilizando a técnica da Amplitude (ou Intervalo) Interquartil (AIQ).

## Passos para resolver:

1. Ordene os dados e encontre a mediana Q2.
2. Determine o primeiro quartil Q1 (mediana dos valores à esquerda de Q2).
3. Determine o terceiro quartil Q3 (mediana dos valores à direita de Q2).
4. Calcule a Amplitude Interquartil (AIQ):  
   \[
   AIQ = Q3 - Q1
   \]
5. Defina os limites para outliers:  
   - Limite inferior: \( Q1 - 1.5 \times AIQ \)  
   - Limite superior: \( Q3 + 1.5 \times AIQ \)
6. Identifique os valores que estão fora desses limites (outliers).

## Passo 1: Ordenar os dados

Os dados organizados em ordem crescente são:

**Dados ordenados**: 12, 20, 25, 30, 45, 50, 55, 60, 65, 70, 72, 78, 80, 85, 150

## Passo 2: Encontrar a mediana Q2

Como há 15 valores, a mediana é o 8º valor da lista:  
**Q2** = 60

## Passo 3: Calcular Q1 e Q3

- **Q1** (mediana dos primeiros 7 valores): Q1 = 45
- **Q3** (mediana dos últimos 7 valores): Q3 = 78

## Passo 4: Calcular AIQ

\[
AIQ = Q3 - Q1 = 78 - 45 = 33
\]

## Passo 5: Determinar os limites para outliers

- Limite inferior:  
  \[
  Q1 - 1.5 \times AIQ = 45 - (1.5 \times 33) = 45 - 49.5 = -4.5
  \]
  Como não há valores menores que -4.5, não há outliers inferiores.
  
- Limite superior:  
  \[
  Q3 + 1.5 \times AIQ = 78 + (1.5 \times 33) = 78 + 49.5 = 127.5
  \]
  Qualquer valor acima de 127.5 é um outlier.

## Passo 6: Identificar os outliers

O único valor maior que 127.5 é 150, então este é um outlier.

## Conclusão

- **Outlier identificado**: 150 tarefas concluídas
- **Nenhum outlier inferior**

Esse funcionário pode ter tido um desempenho excepcionalmente alto ou pode ter ocorrido um erro nos registros. A empresa pode investigar a causa antes de tomar decisões sobre metas ou desempenho.

---

## Resultado dos Cálculos em Python:




In [None]:
import numpy as np
import pandas as pd

# Dados de tarefas concluídas
dados = [12, 20, 25, 30, 45, 50, 55, 60, 65, 70, 72, 78, 80, 85, 150]

# Ordenando os dados
dados.sort()

# Passo 1: Encontrar a mediana (Q2)
Q2 = np.median(dados)

# Passo 2: Calcular o primeiro quartil (Q1)
Q1 = np.percentile(dados, 25)

# Passo 3: Calcular o terceiro quartil (Q3)
Q3 = np.percentile(dados, 75)

# Passo 4: Calcular a Amplitude Interquartil (AIQ)
AIQ = Q3 - Q1

# Passo 5: Calcular os limites para outliers
limite_inferior = Q1 - 1.5 * AIQ
limite_superior = Q3 + 1.5 * AIQ

# Passo 6: Identificar os outliers
outliers = [valor for valor in dados if valor < limite_inferior or valor > limite_superior]

# Resultado
resultado = {
    "Passo": ["Dados ordenados", "Q1", "Q2 (Mediana)", "Q3", "AIQ", "Limite Inferior", "Limite Superior", "Outliers"],
    "Resultado": [
        dados,
        round(Q1, 2),
        round(Q2, 2),
        round(Q3, 2),
        round(AIQ, 2),
        round(limite_inferior, 2),
        round(limite_superior, 2),
        outliers
    ]
}

# Criando uma tabela para exibir os resultados
tabela_resultados = pd.DataFrame(resultado)

# Exibindo a tabela
tabela_resultados



Unnamed: 0,Passo,Resultado
0,Dados ordenados,"[12, 20, 25, 30, 45, 50, 55, 60, 65, 70, 72, 7..."
1,Q1,37.5
2,Q2 (Mediana),60.0
3,Q3,75.0
4,AIQ,37.5
5,Limite Inferior,-18.75
6,Limite Superior,131.25
7,Outliers,[150]


# EXERCÍCIO 8 – Cálculo da Média Ponderada para o índice de desenvolvimento de um país

Uma organização internacional está avaliando o desempenho de diferentes países em um índice de desenvolvimento sustentável. O índice é calculado com base em três critérios principais:

1. Crescimento econômico sustentável (peso 40%)
2. Preservação ambiental (peso 35%)
3. Bem-estar social (peso 25%)

Os especialistas atribuíram as seguintes pontuações (de 0 a 10) para um determinado país:

- **Crescimento econômico sustentável**: 8.5
- **Preservação ambiental**: 6.2
- **Bem-estar social**: 7.8

Com base nesses critérios e pesos, calcule a média ponderada para o índice de desenvolvimento sustentável desse país.

## Passo 1: Compreender a fórmula da média ponderada

A média ponderada é calculada usando a seguinte fórmula:

$$
\text{Média Ponderada} = \frac{(P1 \times W1) + (P2 \times W2) + (P3 \times W3)}{W1 + W2 + W3}
$$

Onde:
- **P1, P2, P3** são as pontuações atribuídas aos critérios (Crescimento econômico, Preservação ambiental, e Bem-estar social).
- **W1, W2, W3** são os pesos atribuídos a cada critério (40%, 35%, e 25%).

## Passo 2: Substituir os valores na fórmula

Substituindo as pontuações e os pesos na fórmula:

- **P1 = 8.5** (Crescimento econômico)
- **P2 = 6.2** (Preservação ambiental)
- **P3 = 7.8** (Bem-estar social)

- **W1 = 0.40** (peso para Crescimento econômico)
- **W2 = 0.35** (peso para Preservação ambiental)
- **W3 = 0.25** (peso para Bem-estar social)

Agora, substituímos os valores na fórmula da média ponderada:

$$
\text{Média Ponderada} = \frac{(8.5 \times 0.40) + (6.2 \times 0.35) + (7.8 \times 0.25)}{0.40 + 0.35 + 0.25}
$$

## Passo 3: Realizar as multiplicações

Vamos calcular os produtos para cada critério com seu respectivo peso:

- $8.5 \times 0.40 = 3.4$
- $6.2 \times 0.35 = 2.17$
- $7.8 \times 0.25 = 1.95$

Agora, substituímos esses valores na fórmula:

$$
\text{Média Ponderada} = \frac{3.4 + 2.17 + 1.95}{0.40 + 0.35 + 0.25}
$$

## Passo 4: Somar os valores no numerador e denominador

Somamos os resultados no numerador:

$$
3.4 + 2.17 + 1.95 = 7.52
$$

E somamos os pesos no denominador:

$$
0.40 + 0.35 + 0.25 = 1.0
$$

Agora temos:

$$
\text{Média Ponderada} = \frac{7.52}{1.0} = 7.52
$$

## Passo 5: Resultado

A média ponderada (índice de desenvolvimento sustentável) do país é **7.52**.

---

## Conclusão e Interpretação

- O **crescimento econômico sustentável** tem o maior peso (40%), o que impacta significativamente a nota final.
- A **preservação ambiental**, com a pontuação de 6.2, é o critério mais baixo e reduz a média geral.
- O **bem-estar social** tem uma boa pontuação (7.8) e ajuda a elevar a média final.

Embora o país tenha um bom desempenho geral, ele poderia melhorar sua pontuação na área ambiental para obter um índice mais equilibrado.

Este tipo de análise é importante em **Relações Internacionais**, pois permite comparar países e identificar pontos fortes e fracos em políticas sustentáveis.



In [None]:
# Dados de entrada
crescimento_economico = 8.5
preservacao_ambiental = 6.2
bem_estar_social = 7.8

# Pesos
peso_crescimento = 0.40
peso_preservacao = 0.35
peso_bem_estar = 0.25

# Cálculo da média ponderada
indice_desenvolvimento = (crescimento_economico * peso_crescimento +
                          preservacao_ambiental * peso_preservacao +
                          bem_estar_social * peso_bem_estar)

# Resultado
indice_desenvolvimento



7.5200000000000005