<a href="https://colab.research.google.com/github/FabioCerqueiraGit/AnaliseDadosPowerBI/blob/main/ProbabiidadeEstatistica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Probabilidade e Estatística

Scripts para resolver questões de Probabilidade e Estatística. Aqui está uma lista inicial de tópicos que vamos cobrir com os scripts:

*   Distribuição de Frequências
*   Medidas de Tendência Central (Média, Mediana, Moda)
*   Medidas de Dispersão (Variância, Desvio Padrão, Amplitude)
*   Distribuições de Probabilidade (Binomial, Poisson, Normal)
*   Intervalo de Confiança
*   Testes de Hipóteses

Vou criar um exemplo de script para cada tópico mencionado. Após isso ireimos adicionar problemas reais e resolver cada um deles.

# 1. Distribuição de Frequências

In [1]:
import pandas as pd

# Exemplo de dados
data = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]

# Criando a distribuição de frequências
frequency_distribution = pd.Series(data).value_counts().sort_index()

print("Distribuição de Frequências:")
print(frequency_distribution)


Distribuição de Frequências:
1    1
2    3
3    2
4    4
5    2
6    2
7    1
Name: count, dtype: int64


# 2. Medidas de Tendência Central

In [None]:
import numpy as np
from scipy import stats

# Exemplo de dados
data = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]

# Calculando média, mediana e moda
mean = np.mean(data)
median = np.median(data)
mode = stats.mode(data)

print(f"Média: {mean}")
print(f"Mediana: {median}")
print(f"Moda: {mode.mode[0]} com frequência {mode.count[0]}")


# 3. Medidas de Dispersão

In [None]:
# Exemplo de dados
data = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]

# Calculando variância, desvio padrão e amplitude
variance = np.var(data, ddof=1)
std_deviation = np.std(data, ddof=1)
range_ = np.ptp(data)

print(f"Variância: {variance}")
print(f"Desvio Padrão: {std_deviation}")
print(f"Amplitude: {range_}")


# 4. Distribuições de Probabilidade

**Binomial**

In [None]:
from scipy.stats import binom

# Parâmetros da distribuição binomial
n = 10  # Número de experimentos
p = 0.5  # Probabilidade de sucesso

# Distribuição binomial
binom_distribution = binom.pmf(range(n+1), n, p)

print("Distribuição Binomial:")
print(binom_distribution)


**Poisson**

In [None]:
from scipy.stats import poisson

# Parâmetro da distribuição Poisson
lambda_ = 3

# Distribuição Poisson
poisson_distribution = poisson.pmf(range(10), lambda_)

print("Distribuição Poisson:")
print(poisson_distribution)


**Normal**

In [None]:
import matplotlib.pyplot as plt
from scipy.stats import norm

# Parâmetros da distribuição normal
mu = 0
sigma = 1

# Distribuição normal
x = np.linspace(mu - 3*sigma, mu + 3*sigma, 100)
normal_distribution = norm.pdf(x, mu, sigma)

plt.plot(x, normal_distribution)
plt.title("Distribuição Normal")
plt.xlabel("Valor")
plt.ylabel("Densidade de Probabilidade")
plt.show()


# 5. Intervalo de Confiança

In [None]:
import scipy.stats as st

# Exemplo de dados
data = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]

# Intervalo de confiança de 95% para a média
confidence_interval = st.t.interval(0.95, len(data)-1, loc=np.mean(data), scale=st.sem(data))

print(f"Intervalo de Confiança (95%): {confidence_interval}")


# 6. Testes de Hipóteses

**Teste T de uma amostra**

In [None]:
# Exemplo de dados
data = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]

# Teste t de uma amostra
t_statistic, p_value = st.ttest_1samp(data, 3)

print(f"Estatística t: {t_statistic}")
print(f"Valor p: {p_value}")


**Teste T para duas amostras independentes**

In [None]:
# Exemplo de dados
data1 = [1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7]
data2 = [2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 7, 7, 8]

# Teste t para duas amostras independentes
t_statistic, p_value = st.ttest_ind(data1, data2)

print(f"Estatística t: {t_statistic}")
print(f"Valor p: {p_value}")


# Resolvendo problemas reais

**Segundo Castanheira (2008), a mediana de um conjunto de dados é o valor que ocupa a posição central desses dados.
Dado o conjunto de números na série 10, 20, 40, 50, 70, 80, qual será o valor da mediana?**

In [2]:
def calcular_mediana():
    # Solicitando a quantidade de números na série
    qtd_numeros = int(input("Digite a quantidade de números na série: "))

    # Solicitando os números da série separados por vírgula
    numeros_input = input("Digite os números da série separados por vírgula: ")

    # Convertendo a entrada para uma lista de inteiros
    numeros = list(map(int, numeros_input.split(',')))

    # Verificando se a quantidade de números fornecida é igual à quantidade informada
    if len(numeros) != qtd_numeros:
        print("A quantidade de números fornecida não corresponde à quantidade informada.")
        return

    # Ordenando a lista de números
    numeros.sort()

    # Calculando a mediana
    n = len(numeros)
    if n % 2 == 0:
        mediana = (numeros[n//2 - 1] + numeros[n//2]) / 2
    else:
        mediana = numeros[n//2]

    print(f"A mediana da série é: {mediana}")

# Executando a função
calcular_mediana()


Digite a quantidade de números na série: 6
Digite os números da série separados por vírgula: 10, 20, 40, 50, 70, 80
A mediana da série é: 45.0


Foi realizado um teste de Estatística em uma turma constituída por 40 alunos e se obteve os seguintes resultados
(dados brutos):
7 - 6 - 8 - 7 - 6 - 4 - 5 - 7 - 7 - 8 - 5 - 10 - 6 - 7 - 8 - 5 - 10 - 4 - 6 - 7 - 7 - 9 - 5 - 6 - 8 - 6 - 7 - 10 - 4 - 6 - 9 - 5 - 8 - 9 - 10 - 7 - 7 - 5 - 9 - 10

**Qual o resultado que apareceu com maior frequência?**

In [3]:
from collections import Counter

def resultado_mais_frequente():
    # Solicitando a quantidade de alunos na turma
    qtd_alunos = int(input("Digite a quantidade de alunos na turma: "))

    # Solicitando os resultados dos testes separados por vírgula
    resultados_input = input("Digite os resultados dos testes separados por vírgula: ")

    # Convertendo a entrada para uma lista de inteiros
    resultados = list(map(int, resultados_input.split(',')))

    # Verificando se a quantidade de resultados fornecida é igual à quantidade informada
    if len(resultados) != qtd_alunos:
        print("A quantidade de resultados fornecida não corresponde à quantidade informada.")
        return

    # Calculando a frequência dos resultados
    frequencia = Counter(resultados)

    # Encontrando o resultado com maior frequência
    resultado_mais_frequente = frequencia.most_common(1)[0]

    print(f"O resultado que apareceu com maior frequência é: {resultado_mais_frequente[0]} (frequência: {resultado_mais_frequente[1]})")

# Executando a função
resultado_mais_frequente()


Digite a quantidade de alunos na turma: 40
Digite os resultados dos testes separados por vírgula: 7 , 6 , 8 , 7 , 6 , 4 , 5 , 7 , 7 , 8 , 5 ,10 , 6 , 7 , 8 , 5 , 10 , 4 , 6 , 7 , 7 , 9 , 5,  6 , 8 , 6 , 7 , 10 , 4 , 6 , 9 , 5 , 8 , 9 , 10 , 7 , 7 , 5 ,9 ,10
O resultado que apareceu com maior frequência é: 7 (frequência: 10)


Ao estudar uma variável, o maior interesse do pesquisador é conhecer o comportamento dessa variável, analisando a ocorrência
de suas possíveis realizações.

**Dada a distribuição de frequências a seguir, qual o ponto médio da 5ª classe ou intervalo?**

Idades

0 |-- 2

2 |-- 4

4 |-- 6

6 |-- 8

8 |-- 10

Frequência (f)

2

5

18

10

5

In [4]:
def calcular_ponto_medio():
    # Solicitando o limite inferior do intervalo
    limite_inferior = float(input("Digite o limite inferior do intervalo: "))

    # Solicitando o limite superior do intervalo
    limite_superior = float(input("Digite o limite superior do intervalo: "))

    # Calculando o ponto médio
    ponto_medio = (limite_inferior + limite_superior) / 2

    print(f"O ponto médio da classe é: {ponto_medio}")

# Executando a função
calcular_ponto_medio()


Digite o limite inferior do intervalo: 8
Digite o limite superior do intervalo: 10
O ponto médio da classe é: 9.0


**Qual a moda do conjunto de valores a seguir?**

6 - 7 - 9 - 10 - 10 - 12

In [5]:
from collections import Counter

def calcular_moda():
    # Solicitando os valores do conjunto separados por vírgula
    valores_input = input("Digite os valores do conjunto separados por vírgula: ")

    # Convertendo a entrada para uma lista de inteiros
    valores = list(map(int, valores_input.split(',')))

    # Calculando a frequência dos valores
    frequencia = Counter(valores)

    # Encontrando o valor ou valores com maior frequência
    max_frequencia = max(frequencia.values())
    modas = [key for key, value in frequencia.items() if value == max_frequencia]

    if len(modas) == 1:
        print(f"A moda do conjunto de valores é: {modas[0]}")
    else:
        print(f"As modas do conjunto de valores são: {modas}")

# Executando a função
calcular_moda()


Digite os valores do conjunto separados por vírgula: 6 , 7 , 9 , 10 , 10 , 12
A moda do conjunto de valores é: 10


**Os dados a seguir representam uma amostra da variação de idade dos alunos da escola de futebol infantil. Com base
nos dados apresentados, determine a média da idade dos alunos por meio da média aritmética.**

9 - 6 - 5 - 4 - 8 - 9 - 10 - 4 - 7 - 8 - 5 - 6 - 10

In [6]:
def calcular_media():
    # Solicitando as idades dos alunos separadas por vírgula
    idades_input = input("Digite as idades dos alunos separadas por vírgula: ")

    # Convertendo a entrada para uma lista de inteiros
    idades = list(map(int, idades_input.split(',')))

    # Calculando a média aritmética
    media = sum(idades) / len(idades)

    print(f"A média da idade dos alunos é: {media:.2f}")

# Executando a função
calcular_media()


Digite as idades dos alunos separadas por vírgula: 9 , 6 , 5 , 4 , 8 , 9 , 10 , 4 , 7 , 8 , 5 , 6 , 10
A média da idade dos alunos é: 7.00


**Dada a distribuição de frequências a seguir, qual a frequência acumulada total?**

Idades

19 |-- 21

21 |-- 23

23 |-- 25

25 |-- 27

27 |-- 29

29 |-- 31


 Frequência (f)
 8

 12

 15

 13

 7

 5

In [7]:
def calcular_frequencia_acumulada():
    # Solicitando os intervalos de idades (não será utilizado diretamente no cálculo, apenas para consistência)
    intervalos_idades = input("Digite os intervalos de idades separados por vírgula (exemplo: 19-21,21-23,...): ")

    # Solicitando as frequências separadas por vírgula
    frequencias_input = input("Digite as frequências correspondentes aos intervalos separados por vírgula: ")

    # Convertendo a entrada para uma lista de inteiros
    frequencias = list(map(int, frequencias_input.split(',')))

    # Calculando a frequência acumulada total
    frequencia_acumulada_total = sum(frequencias)

    print(f"A frequência acumulada total é: {frequencia_acumulada_total}")

# Executando a função
calcular_frequencia_acumulada()


Digite os intervalos de idades separados por vírgula (exemplo: 19-21,21-23,...): 19-21,21-23,23-25,25-27,27-29,29-31
Digite as frequências correspondentes aos intervalos separados por vírgula: 8,12,15,13,7,5
A frequência acumulada total é: 60


Em uma disputa de torneio de tiro ao alvo, a probabilidade do atirador A acertar no alvo é 50%, e a do atirador B de atingir o
mesmo alvo é de 60%.

**Com isso, qual a probabilidade do alvo ser atingido, se ambos atirarem nele?**

In [8]:
def calcular_probabilidade_atingir_alvo():
    # Solicitando a probabilidade do atirador A acertar o alvo
    prob_a = float(input("Digite a probabilidade do atirador A acertar o alvo (em %): ")) / 100

    # Solicitando a probabilidade do atirador B acertar o alvo
    prob_b = float(input("Digite a probabilidade do atirador B acertar o alvo (em %): ")) / 100

    # Calculando a probabilidade do alvo ser atingido
    prob_alvo_nao_atingido = (1 - prob_a) * (1 - prob_b)
    prob_alvo_atingido = 1 - prob_alvo_nao_atingido

    print(f"A probabilidade do alvo ser atingido por pelo menos um dos atiradores é: {prob_alvo_atingido * 100:.2f}%")

# Executando a função
calcular_probabilidade_atingir_alvo()


Digite a probabilidade do atirador A acertar o alvo (em %): 50
Digite a probabilidade do atirador B acertar o alvo (em %): 60
A probabilidade do alvo ser atingido por pelo menos um dos atiradores é: 80.00%


Em uma distribuição de frequências, verificou-se que a moda é igual a 8,0, a média é igual a 7,8 e o desvio padrão é igual a 1,0.

**Com base na informação, determine o primeiro coeficiente de assimetria de Pearson.**

In [10]:
def calcular_coeficiente_assimetria_pearson():
    # Solicitando a moda
    moda = float(input("Digite a moda: "))

    # Solicitando a média
    media = float(input("Digite a média: "))

    # Solicitando o desvio padrão
    desvio_padrao = float(input("Digite o desvio padrão: "))

    # Calculando o coeficiente de assimetria de Pearson
    coeficiente_assimetria = 3 * (media - moda) / desvio_padrao

    print(f"O primeiro coeficiente de assimetria de Pearson é: {coeficiente_assimetria:.2f}")

# Executando a função
calcular_coeficiente_assimetria_pearson()


Digite a moda: 8
Digite a média: 7.8
Digite o desvio padrão: 1
O primeiro coeficiente de assimetria de Pearson é: -0.60


A probabilidade de que Pedro resolva um problema é de 1/3, e a de que Paulo resolva é de 1/4.

**Se ambos tentarem resolver
independentemente o problema, qual a probabilidade de que o problema seja resolvido?**

In [12]:
def calcular_probabilidade_problema_resolvido():
    # Solicitando a probabilidade de Pedro resolver o problema
    prob_pedro_input = input("Digite a probabilidade de Pedro resolver o problema (exemplo: 1/3): ")

    # Solicitando a probabilidade de Paulo resolver o problema
    prob_paulo_input = input("Digite a probabilidade de Paulo resolver o problema (exemplo: 1/4): ")

    # Convertendo as frações para decimais
    prob_pedro = eval(prob_pedro_input)
    prob_paulo = eval(prob_paulo_input)

    # Calculando a probabilidade de que pelo menos um dos dois resolva o problema
    prob_nao_resolvido_pedro = 1 - prob_pedro
    prob_nao_resolvido_paulo = 1 - prob_paulo
    prob_nao_resolvido_ambos = prob_nao_resolvido_pedro * prob_nao_resolvido_paulo
    prob_resolvido = 1 - prob_nao_resolvido_ambos

    print(f"A probabilidade de que o problema seja resolvido por pelo menos um deles é: {prob_resolvido:.2f}")

# Executando a função
calcular_probabilidade_problema_resolvido()


Digite a probabilidade de Pedro resolver o problema (exemplo: 1/3): 1/3
Digite a probabilidade de Paulo resolver o problema (exemplo: 1/4): 1/4
A probabilidade de que o problema seja resolvido por pelo menos um deles é: 0.50


Considerando o universo dos números inteiros, escolhemos ao acaso um número inteiro de 1 a 30.

**Qual a probabilidade desse
número ser divisível por 3?**

In [13]:
def calcular_probabilidade_divisivel_por_3():
    # Solicitando o intervalo de números inteiros
    limite_inferior = int(input("Digite o limite inferior do intervalo: "))
    limite_superior = int(input("Digite o limite superior do intervalo: "))

    # Contando o total de números no intervalo
    total_numeros = limite_superior - limite_inferior + 1

    # Contando quantos desses números são divisíveis por 3
    numeros_divisiveis_por_3 = [num for num in range(limite_inferior, limite_superior + 1) if num % 3 == 0]
    total_divisiveis_por_3 = len(numeros_divisiveis_por_3)

    # Calculando a probabilidade
    probabilidade = total_divisiveis_por_3 / total_numeros

    print(f"A probabilidade de um número escolhido ao acaso ser divisível por 3 é: {probabilidade:.2f}")

# Executando a função
calcular_probabilidade_divisivel_por_3()


Digite o limite inferior do intervalo: 1
Digite o limite superior do intervalo: 30
A probabilidade de um número escolhido ao acaso ser divisível por 3 é: 0.33


Uma pessoa tem dois automóveis velhos. Nas manhãs frias, há 20% de chance de um deles não pegar e 30% de chance de o
outro não pegar.

**Qual a probabilidade de, em uma manhã fria, apenas um pegar?**

In [14]:
def calcular_probabilidade_um_pegar():
    # Solicitando a probabilidade do primeiro automóvel não pegar
    prob_nao_pegar_1 = float(input("Digite a probabilidade do primeiro automóvel não pegar (em %): ")) / 100

    # Solicitando a probabilidade do segundo automóvel não pegar
    prob_nao_pegar_2 = float(input("Digite a probabilidade do segundo automóvel não pegar (em %): ")) / 100

    # Calculando a probabilidade de cada automóvel pegar
    prob_pegar_1 = 1 - prob_nao_pegar_1
    prob_pegar_2 = 1 - prob_nao_pegar_2

    # Calculando a probabilidade de apenas um automóvel pegar
    prob_apenas_um_pegar = (prob_pegar_1 * prob_nao_pegar_2) + (prob_nao_pegar_1 * prob_pegar_2)

    print(f"A probabilidade de que apenas um automóvel pegue é: {prob_apenas_um_pegar * 100:.2f}%")

# Executando a função
calcular_probabilidade_um_pegar()


Digite a probabilidade do primeiro automóvel não pegar (em %): 20
Digite a probabilidade do segundo automóvel não pegar (em %): 30
A probabilidade de que apenas um automóvel pegue é: 38.00%


Considerando o universo dos números inteiros, escolhemos ao acaso um número inteiro de 1 a 30.

**Qual a probabilidade desse
número ser divisível por 3 OU POR 5?**

In [15]:
def calcular_probabilidade_divisivel_por_3_ou_5():
    # Solicitando o intervalo de números inteiros
    limite_inferior = int(input("Digite o limite inferior do intervalo: "))
    limite_superior = int(input("Digite o limite superior do intervalo: "))

    # Contando o total de números no intervalo
    total_numeros = limite_superior - limite_inferior + 1

    # Contando quantos desses números são divisíveis por 3 ou por 5
    numeros_divisiveis_por_3_ou_5 = [num for num in range(limite_inferior, limite_superior + 1) if num % 3 == 0 or num % 5 == 0]
    total_divisiveis_por_3_ou_5 = len(numeros_divisiveis_por_3_ou_5)

    # Calculando a probabilidade
    probabilidade = total_divisiveis_por_3_ou_5 / total_numeros

    print(f"A probabilidade de um número escolhido ao acaso ser divisível por 3 ou por 5 é: {probabilidade:.2f}")

# Executando a função
calcular_probabilidade_divisivel_por_3_ou_5()


Digite o limite inferior do intervalo: 1
Digite o limite superior do intervalo: 30
A probabilidade de um número escolhido ao acaso ser divisível por 3 ou por 5 é: 0.47
