<a href="https://colab.research.google.com/github/FabioCerqueiraGit/ProbabilidadeEstatistica/blob/main/ProbabiidadeEstatistica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Probabilidade e Estatística

Scripts para resolver questões de Probabilidade e Estatística. Aqui está uma lista inicial de tópicos que vamos cobrir com os scripts:

*   Distribuição de Frequências
*   Medidas de Tendência Central (Média, Mediana, Moda)
*   Medidas de Dispersão (Variância, Desvio Padrão, Amplitude)
*   Distribuições de Probabilidade (Binomial, Poisson, Normal)
*   Intervalo de Confiança
*   Testes de Hipóteses

Vou criar um exemplo de script para cada tópico mencionado. Após isso ireimos adicionar problemas reais e resolver cada um deles.

# 1. Distribuição de Frequências

In [1]:
import pandas as pd

# Exemplo de dados
data = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]

# Criando a distribuição de frequências
frequency_distribution = pd.Series(data).value_counts().sort_index()

print("Distribuição de Frequências:")
print(frequency_distribution)


Distribuição de Frequências:
1    1
2    3
3    2
4    4
5    2
6    2
7    1
Name: count, dtype: int64


# 2. Medidas de Tendência Central

# 3. Medidas de Dispersão

In [None]:
# Exemplo de dados
data = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]

# Calculando variância, desvio padrão e amplitude
variance = np.var(data, ddof=1)
std_deviation = np.std(data, ddof=1)
range_ = np.ptp(data)

print(f"Variância: {variance}")
print(f"Desvio Padrão: {std_deviation}")
print(f"Amplitude: {range_}")


# 4. Distribuições de Probabilidade

**Binomial**

In [None]:
from scipy.stats import binom

# Parâmetros da distribuição binomial
n = 10  # Número de experimentos
p = 0.5  # Probabilidade de sucesso

# Distribuição binomial
binom_distribution = binom.pmf(range(n+1), n, p)

print("Distribuição Binomial:")
print(binom_distribution)


**Poisson**

In [None]:
from scipy.stats import poisson

# Parâmetro da distribuição Poisson
lambda_ = 3

# Distribuição Poisson
poisson_distribution = poisson.pmf(range(10), lambda_)

print("Distribuição Poisson:")
print(poisson_distribution)


**Normal**

In [None]:
import matplotlib.pyplot as plt
from scipy.stats import norm

# Parâmetros da distribuição normal
mu = 0
sigma = 1

# Distribuição normal
x = np.linspace(mu - 3*sigma, mu + 3*sigma, 100)
normal_distribution = norm.pdf(x, mu, sigma)

plt.plot(x, normal_distribution)
plt.title("Distribuição Normal")
plt.xlabel("Valor")
plt.ylabel("Densidade de Probabilidade")
plt.show()


# 5. Intervalo de Confiança

In [None]:
import scipy.stats as st

# Exemplo de dados
data = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]

# Intervalo de confiança de 95% para a média
confidence_interval = st.t.interval(0.95, len(data)-1, loc=np.mean(data), scale=st.sem(data))

print(f"Intervalo de Confiança (95%): {confidence_interval}")


# 6. Testes de Hipóteses

**Teste T de uma amostra**

In [None]:
# Exemplo de dados
data = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]

# Teste t de uma amostra
t_statistic, p_value = st.ttest_1samp(data, 3)

print(f"Estatística t: {t_statistic}")
print(f"Valor p: {p_value}")


**Teste T para duas amostras independentes**

In [None]:
# Exemplo de dados
data1 = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]
data2 = [2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 7, 7, 8]

# Teste t para duas amostras independentes
t_statistic, p_value = st.ttest_ind(data1, data2)

print(f"Estatística t: {t_statistic}")
print(f"Valor p: {p_value}")


# Resolvendo problemas reais

**Segundo Castanheira (2008), a mediana de um conjunto de dados é o valor que ocupa a posição central desses dados.
Dado o conjunto de números na série 10, 20, 40, 50, 70, 80, qual será o valor da mediana?**

In [2]:
def calcular_mediana():
    # Solicitando a quantidade de números na série
    qtd_numeros = int(input("Digite a quantidade de números na série: "))

    # Solicitando os números da série separados por vírgula
    numeros_input = input("Digite os números da série separados por vírgula: ")

    # Convertendo a entrada para uma lista de inteiros
    numeros = list(map(int, numeros_input.split(',')))

    # Verificando se a quantidade de números fornecida é igual à quantidade informada
    if len(numeros) != qtd_numeros:
        print("A quantidade de números fornecida não corresponde à quantidade informada.")
        return

    # Ordenando a lista de números
    numeros.sort()

    # Calculando a mediana
    n = len(numeros)
    if n % 2 == 0:
        mediana = (numeros[n//2 - 1] + numeros[n//2]) / 2
    else:
        mediana = numeros[n//2]

    print(f"A mediana da série é: {mediana}")

# Executando a função
calcular_mediana()


Digite a quantidade de números na série: 6
Digite os números da série separados por vírgula: 10, 20, 40, 50, 70, 80
A mediana da série é: 45.0
