#### Semana de Ciência de Dados com Python/IA - SENAI-DF - Vespertino - 19/07/2024
##### Atividade Assíncrona - Estatística na Ciência de Dados - Marcelo Pereira Avelino

---

- O que é?
- Para que serve?
- Como fazer?

    - Média
    - Mediana
    - Moda
    - Quartis
    - Desvio Padrão

---

### **Media**

##### O que é?
* A média é a soma de todos os valores dividida pelo número total de valores. É um valor que representa a tendência central de um conjunto de dados.

##### Para que serve?
* A média é usada para obter uma visão geral de onde a maioria dos dados está localizada. Ajuda a resumir um conjunto de dados com um único valor representativo.

##### Como fazer?
* Para calcular a média, some todos os valores e divida pelo número total de valores.

```python
# Exemplo simples de cálculo da média
dados = [10, 20, 30, 40, 50]
media = sum(dados) / len(dados)  # Calculando a média
print("Média:", media)  # Saída: Média: 30.0

### **Mediana**

##### O que é?
* A mediana é o valor do meio em um conjunto de dados ordenado. Se houver um número par de valores, a mediana é a média dos dois valores do meio.

##### Para que serve?
* A mediana é útil para identificar a tendência central em um conjunto de dados, especialmente quando há valores extremos que podem distorcer a média.

##### Como fazer?
* Para calcular a mediana, ordene os valores e encontre o valor do meio. Se o número de valores for par, calcule a média dos dois valores centrais.

```python
# Exemplo simples de cálculo da mediana
dados = [10, 20, 30, 40, 50]
dados.sort()  # Ordenando os dados
n = len(dados)
if n % 2 == 0:
    mediana = (dados[n//2 - 1] + dados[n//2]) / 2  # Calculando a mediana para número par de valores
else:
    mediana = dados[n//2]  # Calculando a mediana para número ímpar de valores
print("Mediana:", mediana)  # Saída: Mediana: 30

### **Moda**

##### O que é?
* A moda é o valor que ocorre com mais frequência em um conjunto de dados.

##### Para que serve?
* A moda é útil para entender qual é o valor mais comum em um conjunto de dados. É particularmente útil para dados categóricos..

##### Como fazer?
* Para calcular a moda, encontre o valor que aparece com mais frequência.

```python
from statistics import mode

# Exemplo simples de cálculo da moda
dados = [10, 20, 30, 30, 40, 50]
moda = mode(dados)  # Calculando a moda
print("Moda:", moda)  # Saída: Moda: 30


### **Quartis**

##### O que é?
* Os quartis dividem um conjunto de dados ordenado em quatro partes iguais. O primeiro quartil (Q1) é o valor que separa os 25% menores dos dados, o segundo quartil (Q2) é a mediana, e o terceiro quartil (Q3) separa os 25% maiores dos dados.

##### Para que serve?
* Os quartis são usados para entender a dispersão e a distribuição dos dados. Eles ajudam a identificar a faixa em que a maioria dos dados está localizada.

##### Como fazer?
* Para calcular os quartis, ordene os dados e encontre os valores nos pontos de 25%, 50% e 75%.

```python
import numpy as np

# Exemplo simples de cálculo dos quartis
dados = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
q1 = np.percentile(dados, 25)  # Primeiro quartil (Q1)
q2 = np.percentile(dados, 50)  # Segundo quartil (Q2) - Mediana
q3 = np.percentile(dados, 75)  # Terceiro quartil (Q3)
print("Q1:", q1)  # Saída: Q1: 32.5
print("Q2 (Mediana):", q2)  # Saída: Q2 (Mediana): 55.0
print("Q3:", q3)  # Saída: Q3: 77.5

### **Desvio Padrão**

##### O que é?
* O desvio padrão mede a quantidade de variação ou dispersão em um conjunto de dados. Um desvio padrão baixo indica que os valores tendem a estar próximos da média, enquanto um desvio padrão alto indica que os valores estão espalhados por uma faixa mais ampla.

##### Para que serve?
* O desvio padrão é usado para entender a dispersão dos dados em relação à média. É uma medida crucial para a análise estatística e a ciência de dados.

##### Como fazer?
* Para calcular o desvio padrão, encontre a média dos dados, calcule a diferença de cada valor em relação à média, eleve ao quadrado essas diferenças, encontre a média dessas diferenças ao quadrado e, finalmente, tire a raiz quadrada dessa média.

```python
import numpy as np

# Exemplo simples de cálculo do desvio padrão
dados = [10, 20, 30, 40, 50]
desvio_padrao = np.std(dados)  # Calculando o desvio padrão
print("Desvio Padrão:", desvio_padrao)  # Saída: Desvio Padrão: 14.142135623730951

In [1]:
# MÉDIA
# Crie uma lista com as notas de um estudante em 5 provas diferentes. Calcule a média das notas e exiba o resultado.

# Lista de notas do estudante
notas = [85, 90, 78, 92, 88]

# Calculando a média das notas
media_notas = sum(notas) / len(notas)

# Exibindo a média
print("A média das notas é:", media_notas)  # Saída: A média das notas é: 86.6

A média das notas é: 86.6


In [None]:
# MEDIANA
# Crie uma lista com a idade de 7 pessoas. Calcule a mediana das idades e exiba o resultado.

# Lista de idades
idades = [23, 34, 45, 28, 30, 36, 40]

# Ordenando a lista de idades
idades.sort()

# Calculando a mediana
n = len(idades)
if n % 2 == 0:
    mediana_idades = (idades[n//2 - 1] + idades[n//2]) / 2
else:
    mediana_idades = idades[n//2]

# Exibindo a mediana
print("A mediana das idades é:", mediana_idades)  # Saída: A mediana das idades é: 34

In [2]:
# MODA
# Crie uma lista com os salários de 8 pessoas em uma empresa. Encontre a moda dos salários e exiba o resultado.

from statistics import mode

# Lista de salários
salarios = [3000, 4500, 3000, 5000, 4500, 6000, 3000, 7000]

# Calculando a moda dos salários
moda_salarios = mode(salarios)

# Exibindo a moda
print("A moda dos salários é:", moda_salarios)  # Saída: A moda dos salários é: 3000

A moda dos salários é: 3000


In [5]:
# QUARTIS
# Crie uma lista com a quantidade de vendas diárias de uma loja durante 10 dias. Calcule os quartis das vendas e exiba os resultados.

import numpy as np

# Lista de vendas diárias
vendas_diarias = [150, 200, 180, 250, 300, 220, 170, 190, 210, 260]

# Calculando os quartis
q1 = np.percentile(vendas_diarias, 25)
q2 = np.percentile(vendas_diarias, 50)
q3 = np.percentile(vendas_diarias, 75)

# Exibindo os quartis
print("Q1 (25%):", q1)  # Saída: Q1 (25%): 180.0
print("Q2 (Mediana, 50%):", q2)  # Saída: Q2 (Mediana, 50%): 205.0
print("Q3 (75%):", q3)  # Saída: Q3 (75%): 235.0

# A biblioteca NumPy é amplamente utilizada em ciência de dados e análise de dados devido à sua eficiência e ao grande número de funções úteis que ela oferece para operações matemáticas e estatísticas.

Q1 (25%): 182.5
Q2 (Mediana, 50%): 205.0
Q3 (75%): 242.5


In [6]:
# DESVIO PADRÃO
# Crie uma lista com as temperaturas registradas em uma cidade durante uma semana. Calcule o desvio padrão das temperaturas e exiba o resultado.

import numpy as np

# Lista de temperaturas
temperaturas = [22, 24, 21, 23, 25, 20, 22]

# Calculando o desvio padrão das temperaturas
desvio_padrao_temperaturas = np.std(temperaturas)

# Exibindo o desvio padrão
print("O desvio padrão das temperaturas é:", desvio_padrao_temperaturas)  # Saída: O desvio padrão das temperaturas é: 1.7320508075688772

# A biblioteca NumPy é amplamente utilizada em ciência de dados e análise de dados devido à sua eficiência e ao grande número de funções úteis que ela oferece para operações matemáticas e estatísticas.

O desvio padrão das temperaturas é: 1.5907898179514348
