import scipy.stats
import matplotlib.pyplot as plt
import numpy as np

print("--- Questão 19 ---")

# Dados fornecidos
media_populacao = 190    # US$ (µ)
desvio_padrao_populacao = 48 # US$ (σ)
valor_alvo = 200       # US$ (x ou x-barra)
tamanho_amostra = 10     # n

# --- Parte 1: Probabilidade para um monitor individual ---
print("\n--- Para um monitor de LCD selecionado aleatoriamente ---")

# a. Obtenha o escore-z que corresponda a x.
z_individual = (valor_alvo - media_populacao) / desvio_padrao_populacao
print(f"a. O escore-z para um monitor individual de US$ {valor_alvo:.2f} é: {z_individual:.2f}")

# b. Use a tabela normal padrão para encontrar a probabilidade.
prob_individual_menor_que_200 = scipy.stats.norm.cdf(z_individual)
print(f"b. A probabilidade de um monitor individual custar menos de US$ {valor_alvo:.2f} é: {prob_individual_menor_que_200:.4f}")

# --- Parte 2: Probabilidade para a média de 10 monitores ---
print("\n--- Para a média de 10 monitores de LCD ---")

# a. Obtenha o escore-z que corresponda a x-barra.
media_distribuicao_amostral = media_populacao
desvio_padrao_distribuicao_amostral = desvio_padrao_populacao / np.sqrt(tamanho_amostra)

z_amostra = (valor_alvo - media_distribuicao_amostral) / desvio_padrao_distribuicao_amostral
print(f"a. Média da distribuição amostral (µ_x̄) = US$ {media_distribuicao_amostral:.2f}")
print(f"   Desvio padrão da distribuição amostral (σ_x̄) = US$ {desvio_padrao_distribuicao_amostral:.2f}")
print(f"   O escore-z para a média de 10 monitores de US$ {valor_alvo:.2f} é: {z_amostra:.2f}")

# b. Use a tabela normal padrão para encontrar a probabilidade.
prob_amostra_menor_que_200 = scipy.stats.norm.cdf(z_amostra)
print(f"b. A probabilidade da média de 10 monitores custar menos de US$ {valor_alvo:.2f} é: {prob_amostra_menor_que_200:.4f}")

# --- Parte 3: Comparação das Probabilidades e Gráfico ---
print("\nc. Comparação das probabilidades:")
print(f"Probabilidade para um monitor individual ( < US$ 200): {prob_individual_menor_que_200*100:.2f}%")
print(f"Probabilidade para a média de 10 monitores ( < US$ 200): {prob_amostra_menor_que_200*100:.2f}%")

print("\nInterpretação da Comparação:")
print("A probabilidade de um monitor individual custar menos de US$ 200 é menor do que a probabilidade da média de 10 monitores custar menos de US$ 200.")
print("Isso ocorre porque a distribuição amostral das médias (para n=10) é mais estreita (tem um desvio padrão menor) do que a distribuição da população original.")
print("Com uma distribuição mais concentrada em torno da média, é mais provável que a média de uma amostra esteja próxima da média populacional, e menos provável que ela se desvie para valores extremos.")
print("Como US$ 200 está acima da média (US$ 190), a distribuição amostral concentra mais de sua probabilidade nessa região, tornando a probabilidade acumulada até 200 maior para a média da amostra.")


# --- Visualização em Gráfico ---
# Gerar valores x para ambas as curvas
x_vals_individual = np.linspace(media_populacao - 3 * desvio_padrao_populacao, media_populacao + 3 * desvio_padrao_populacao, 500)
y_vals_individual = scipy.stats.norm.pdf(x_vals_individual, loc=media_populacao, scale=desvio_padrao_populacao)

x_vals_amostra = np.linspace(media_distribuicao_amostral - 3 * desvio_padrao_distribuicao_amostral, media_distribuicao_amostral + 3 * desvio_padrao_distribuicao_amostral, 500)
y_vals_amostra = scipy.stats.norm.pdf(x_vals_amostra, loc=media_distribuicao_amostral, scale=desvio_padrao_distribuicao_amostral)

plt.figure(figsize=(12, 7))
plt.plot(x_vals_individual, y_vals_individual, color='skyblue', label='Distribuição Individual (σ=48)', linestyle='--', alpha=0.7)
plt.plot(x_vals_amostra, y_vals_amostra, color='blue', label=f'Distribuição Amostral (n={tamanho_amostra}, σ_x̄={desvio_padrao_distribuicao_amostral:.2f})')

plt.axvline(media_populacao, color='gray', linestyle=':', linewidth=0.8, label=f'Média (µ) = US$ {media_populacao}')
plt.axvline(valor_alvo, color='red', linestyle='--', label=f'Valor Alvo = US$ {valor_alvo}')

# Sombrear área para o individual
x_fill_ind = np.linspace(x_vals_individual.min(), valor_alvo, 100)
y_fill_ind = scipy.stats.norm.pdf(x_fill_ind, loc=media_populacao, scale=desvio_padrao_populacao)
plt.fill_between(x_fill_ind, 0, y_fill_ind, color='lightblue', alpha=0.3, label=f'Prob. Individual < {valor_alvo} ({prob_individual_menor_que_200*100:.2f}%)')

# Sombrear área para a média da amostra
x_fill_amostra = np.linspace(x_vals_amostra.min(), valor_alvo, 100)
y_fill_amostra = scipy.stats.norm.pdf(x_fill_amostra, loc=media_distribuicao_amostral, scale=desvio_padrao_distribuicao_amostral)
plt.fill_between(x_fill_amostra, 0, y_fill_amostra, color='lightgreen', alpha=0.3, label=f'Prob. Média Amostra < {valor_alvo} ({prob_amostra_menor_que_200*100:.2f}%)')


plt.title('Comparação das Probabilidades de Custo de Monitores de LCD')
plt.xlabel('Custo (US$)')
plt.ylabel('Densidade de Probabilidade')
plt.legend()
plt.grid(True, linestyle=':', alpha=0.7)
plt.show()

In [None]:
import numpy as np

print("--- Questão 20 ---")

# Dados do problema
n = 100  # Número de tentativas (tamanho da amostra)
p = 0.34 # Probabilidade de sucesso (dizer "sim")

# a. Identifique n, p e q.
q = 1 - p
print(f"a. Identificação:")
print(f"   n (número de tentativas) = {n}")
print(f"   p (probabilidade de sucesso) = {p}")
print(f"   q (probabilidade de fracasso) = {q:.2f}")

# b. Encontre os produtos np e nq.
np_produto = n * p
nq_produto = n * q
print(f"\nb. Produtos np e nq:")
print(f"   np = {np_produto}")
print(f"   nq = {nq_produto:.2f}")

# c. Determine se você pode usar uma distribuição normal para aproximar a distribuição de x.
pode_aproximar = (np_produto >= 5) and (nq_produto >= 5)
print(f"\nc. É possível usar uma distribuição normal para aproximar a distribuição de x? {'Sim' if pode_aproximar else 'Não'}")
if not pode_aproximar:
    print("   Não é possível porque as condições np >= 5 e/ou nq >= 5 não foram satisfeitas.")

# d. Calcule a média µ e o desvio padrão σ, se for apropriado.
if pode_aproximar:
    media_normal = np_produto
    desvio_padrao_normal = np.sqrt(n * p * q)
    print(f"\nd. Média (µ) da distribuição normal aproximada: {media_normal:.2f}")
    print(f"   Desvio Padrão (σ) da distribuição normal aproximada: {desvio_padrao_normal:.2f}")
else:
    print("\nd. Não é apropriado calcular a média e o desvio padrão para a aproximação normal, pois as condições não foram atendidas.")

In [None]:
import scipy.stats
import matplotlib.pyplot as plt
import numpy as np

print("\n--- Questão 21 ---")

# Dados do problema (os mesmos da Questão 20)
n = 100
p = 0.34
q = 1 - p

# a. Determine se você pode usar uma distribuição normal para aproximar a variável binomial.
np_produto = n * p
nq_produto = n * q
pode_aproximar = (np_produto >= 5) and (nq_produto >= 5)

print(f"a. Verificação da aproximação normal:")
print(f"   np = {np_produto:.2f}, nq = {nq_produto:.2f}.")
print(f"   É possível usar uma distribuição normal para aproximar (ambos >= 5)? {'Sim' if pode_aproximar else 'Não'}")

if not pode_aproximar:
    print("   (Não é possível prosseguir com a aproximação normal. O restante da questão assume que sim.)")
    exit() # Interrompe a execução se a aproximação não for válida

# b. Determine a média µ e o desvio padrão σ para a distribuição normal.
media_normal = np_produto
desvio_padrao_normal = np.sqrt(n * p * q)
print(f"\nb. Média (µ) da distribuição normal: {media_normal:.2f}")
print(f"   Desvio Padrão (σ) da distribuição normal: {desvio_padrao_normal:.2f}")

# c. Aplique a correção de continuidade para reescrever P(x > 30) e esboce um gráfico.
# P(x > 30) na distribuição binomial discreta é P(x >= 31).
# Com correção de continuidade, para a distribuição normal, isso é P(X >= 30.5).
valor_corrigido = 30.5
print(f"\nc. Correção de continuidade: P(x > 30) se torna P(X >= {valor_corrigido}) na aproximação normal.")

# Esboço do gráfico
x_vals = np.linspace(media_normal - 4 * desvio_padrao_normal, media_normal + 4 * desvio_padrao_normal, 500)
y_vals = scipy.stats.norm.pdf(x_vals, loc=media_normal, scale=desvio_padrao_normal)

plt.figure(figsize=(10, 6))
plt.plot(x_vals, y_vals, color='blue', label='Distribuição Normal Aproximada')
plt.axvline(media_normal, color='gray', linestyle='--', linewidth=0.8, label=f'Média = {media_normal:.2f}')
plt.axvline(valor_corrigido, color='red', linestyle='--', label=f'x corrigido = {valor_corrigido}')

# Sombrear a área à direita do valor corrigido
x_fill = np.linspace(valor_corrigido, x_vals.max(), 100)
y_fill = scipy.stats.norm.pdf(x_fill, loc=media_normal, scale=desvio_padrao_normal)
plt.fill_between(x_fill, 0, y_fill, color='salmon', alpha=0.6, label=f'P(X > 30) = P(X >= {valor_corrigido})')

plt.title('Aproximação Normal da Distribuição Binomial (n=100, p=0.34)')
plt.xlabel('Número de Respostas "Sim"')
plt.ylabel('Densidade de Probabilidade')
plt.legend()
plt.grid(True, linestyle=':', alpha=0.7)
plt.show()

# d. Calcule o correspondente escore-z.
z_score = (valor_corrigido - media_normal) / desvio_padrao_normal
print(f"\nd. O escore-z correspondente é: {z_score:.2f}")

# e. Use a tabela normal padrão para encontrar a área à esquerda de z e calcule a probabilidade.
area_esquerda_z = scipy.stats.norm.cdf(z_score)
probabilidade = 1 - area_esquerda_z # Área à direita

print(f"\ne. Área à esquerda de z = {z_score:.2f} é: {area_esquerda_z:.4f}")
print(f"   A probabilidade de que mais de 30 respondam “sim” é: {probabilidade:.4f} ou {probabilidade*100:.2f}%")

print("\nInterpretação:")
print(f"A probabilidade de que mais de 30 dos 100 adultos americanos selecionados aleatoriamente tenham visto a situação é de aproximadamente {probabilidade*100:.2f}%.")

In [None]:
import scipy.stats
import matplotlib.pyplot as plt
import numpy as np

print("--- Questão 22 ---")

# Dados do problema
p = 0.58  # Probabilidade de sucesso (nunca usar capacete)
n = 150   # Tamanho da amostra (ASSUMIDO, pois não está explícito no enunciado, mas é necessário para o cálculo)
q = 1 - p

x_limite = 100 # No máximo 100 adultos

print(f"Assumindo um tamanho de amostra (n) = {n} adultos para o cálculo da probabilidade.")

# a. Determine se você pode usar uma distribuição normal para aproximar a variável binomial.
np_produto = n * p
nq_produto = n * q
pode_aproximar = (np_produto >= 5) and (nq_produto >= 5)

print(f"\na. Verificação da aproximação normal:")
print(f"   np = {np_produto:.2f}")
print(f"   nq = {nq_produto:.2f}")
print(f"   É possível usar uma distribuição normal para aproximar (ambos >= 5)? {'Sim' if pode_aproximar else 'Não'}")

if not pode_aproximar:
    print("   (Não é possível prosseguir com a aproximação normal. O restante da questão assume que sim.)")
    exit() # Interrompe a execução se a aproximação não for válida

# b. Calcule a média µ e o desvio padrão σ para a distribuição.
media_normal = np_produto
desvio_padrao_normal = np.sqrt(n * p * q)
print(f"\nb. Média (µ) da distribuição normal: {media_normal:.2f}")
print(f"   Desvio Padrão (σ) da distribuição normal: {desvio_padrao_normal:.2f}")

# c. Aplique a correção de continuidade para reescrever P(x <= 100) e esboce um gráfico.
# P(x <= 100) na distribuição binomial discreta, com correção de continuidade, é P(X <= 100.5).
valor_corrigido = x_limite + 0.5
print(f"\nc. Correção de continuidade: P(x <= {x_limite}) se torna P(X <= {valor_corrigido}) na aproximação normal.")

# Esboço do gráfico
x_vals = np.linspace(media_normal - 4 * desvio_padrao_normal, media_normal + 4 * desvio_padrao_normal, 500)
y_vals = scipy.stats.norm.pdf(x_vals, loc=media_normal, scale=desvio_padrao_normal)

plt.figure(figsize=(10, 6))
plt.plot(x_vals, y_vals, color='blue', label='Distribuição Normal Aproximada')
plt.axvline(media_normal, color='gray', linestyle='--', linewidth=0.8, label=f'Média = {media_normal:.2f}')
plt.axvline(valor_corrigido, color='red', linestyle='--', label=f'x corrigido = {valor_corrigido}')

# Sombrear a área à esquerda do valor corrigido
x_fill = np.linspace(x_vals.min(), valor_corrigido, 100)
y_fill = scipy.stats.norm.pdf(x_fill, loc=media_normal, scale=desvio_padrao_normal)
plt.fill_between(x_fill, 0, y_fill, color='lightblue', alpha=0.6, label=f'P(x <= {x_limite}) = P(X <= {valor_corrigido})')

plt.title('Aproximação Normal da Distribuição Binomial (n=150, p=0.58)')
plt.xlabel('Número de Adultos que Nunca Usam Capacete')
plt.ylabel('Densidade de Probabilidade')
plt.legend()
plt.grid(True, linestyle=':', alpha=0.7)
plt.show()

# d. Calcule o correspondente escore-z. (Já feito implicitamente no cálculo)
z_score = (valor_corrigido - media_normal) / desvio_padrao_normal
print(f"\nd. O escore-z correspondente é: {z_score:.2f}")

# e. Use a tabela normal padrão para encontrar a área à esquerda de z e calcule a probabilidade.
probabilidade = scipy.stats.norm.cdf(z_score) # Área à esquerda

print(f"\ne. Área à esquerda de z = {z_score:.2f} é: {probabilidade:.4f}")
print(f"   A probabilidade de que no máximo {x_limite} adultos digam que nunca usam capacete é: {probabilidade:.4f} ou {probabilidade*100:.2f}%")

print("\nInterpretação:")
print(f"A probabilidade de que no máximo 100 dos 150 adultos americanos selecionados aleatoriamente digam que nunca usam capacete ao andar de bicicleta é de aproximadamente {probabilidade*100:.2f}%.")

In [None]:
import scipy.stats
import matplotlib.pyplot as plt
import numpy as np

print("\n--- Questão 23 ---")

# Dados do problema
# Usamos p = 0.32 para a população geral de homens com 50+ nos EUA, não para aposentados da NFL.
p = 0.32  # Probabilidade de ter artrite para homens 50+ nos EUA
n = 75    # Tamanho da amostra
q = 1 - p

x_exato = 15 # Exatamente 15 homens

print(f"Probabilidade (p) utilizada para a população geral de homens 50+ = {p*100:.1f}%.")

# a. Determine se você pode usar uma distribuição normal para aproximar a variável binomial.
np_produto = n * p
nq_produto = n * q
pode_aproximar = (np_produto >= 5) and (nq_produto >= 5)

print(f"\na. Verificação da aproximação normal:")
print(f"   np = {np_produto:.2f}")
print(f"   nq = {nq_produto:.2f}")
print(f"   É possível usar uma distribuição normal para aproximar (ambos >= 5)? {'Sim' if pode_aproximar else 'Não'}")

if not pode_aproximar:
    print("   (Não é possível prosseguir com a aproximação normal. O restante da questão assume que sim.)")
    exit() # Interrompe a execução se a aproximação não for válida

# b. Calcule a média µ e o desvio padrão σ para a distribuição normal.
media_normal = np_produto
desvio_padrao_normal = np.sqrt(n * p * q)
print(f"\nb. Média (µ) da distribuição normal: {media_normal:.2f}")
print(f"   Desvio Padrão (σ) da distribuição normal: {desvio_padrao_normal:.2f}")

# c. Calcular os correspondentes escores-z.
# Para "exatamente x", usamos correção de continuidade de (x - 0.5) a (x + 0.5)
x_inferior_corrigido = x_exato - 0.5 # 14.5
x_superior_corrigido = x_exato + 0.5 # 15.5

z_inferior = (x_inferior_corrigido - media_normal) / desvio_padrao_normal
z_superior = (x_superior_corrigido - media_normal) / desvio_padrao_normal
print(f"\nc. Com correção de continuidade, para P(x = {x_exato}) usamos o intervalo [{x_inferior_corrigido}, {x_superior_corrigido}].")
print(f"   O escore-z para {x_inferior_corrigido} é: {z_inferior:.2f}")
print(f"   O escore-z para {x_superior_corrigido} é: {z_superior:.2f}")

# d. Use a tabela normal padrão para encontrar a área à esquerda de cada escore-z e calcule a probabilidade.
area_esquerda_z_inferior = scipy.stats.norm.cdf(z_inferior)
area_esquerda_z_superior = scipy.stats.norm.cdf(z_superior)

probabilidade_exatamente_15 = area_esquerda_z_superior - area_esquerda_z_inferior

print(f"\nd. Área à esquerda de z = {z_inferior:.2f} é: {area_esquerda_z_inferior:.4f}")
print(f"   Área à esquerda de z = {z_superior:.2f} é: {area_esquerda_z_superior:.4f}")
print(f"   A probabilidade de que exatamente {x_exato} digam que sim é: {probabilidade_exatamente_15:.4f} ou {probabilidade_exatamente_15*100:.2f}%")

# Esboço do gráfico (opcional, mas útil para visualização)
x_vals = np.linspace(media_normal - 4 * desvio_padrao_normal, media_normal + 4 * desvio_padrao_normal, 500)
y_vals = scipy.stats.norm.pdf(x_vals, loc=media_normal, scale=desvio_padrao_normal)

plt.figure(figsize=(10, 6))
plt.plot(x_vals, y_vals, color='blue', label='Distribuição Normal Aproximada')
plt.axvline(media_normal, color='gray', linestyle='--', linewidth=0.8, label=f'Média = {media_normal:.2f}')
plt.axvline(x_inferior_corrigido, color='red', linestyle=':', linewidth=0.8, label=f'Limite Inferior = {x_inferior_corrigido}')
plt.axvline(x_superior_corrigido, color='green', linestyle=':', linewidth=0.8, label=f'Limite Superior = {x_superior_corrigido}')

# Sombrear a área entre os limites corrigidos
x_fill = np.linspace(x_inferior_corrigido, x_superior_corrigido, 100)
y_fill = scipy.stats.norm.pdf(x_fill, loc=media_normal, scale=desvio_padrao_normal)
plt.fill_between(x_fill, 0, y_fill, color='lightcoral', alpha=0.6, label=f'P(x = {x_exato})')

plt.title(f'Aproximação Normal para P(x = {x_exato}) (n=75, p=0.32)')
plt.xlabel('Número de Homens com Artrite')
plt.ylabel('Densidade de Probabilidade')
plt.legend()
plt.grid(True, linestyle=':', alpha=0.7)
plt.show()

print("\nInterpretação:")
print(f"A probabilidade de que exatamente 15 dos 75 homens selecionados aleatoriamente (com pelo menos 50 anos nos EUA) tenham artrite é de aproximadamente {probabilidade_exatamente_15*100:.2f}%.")

In [None]:
import numpy as np

print("--- Questão 24 ---")

# Dados da amostra fornecidos na tabela
horas_trabalhadas = [
    26, 25, 32, 31, 28, 28,
    28, 22, 28, 25, 21, 40,
    32, 22, 25, 22, 26, 24,
    46, 20, 35, 22, 32, 48,
    32, 36, 38, 32, 22, 19
]

# a. Encontre a média amostral.
# Usando numpy.mean() para calcular a média
media_amostral = np.mean(horas_trabalhadas)

print(f"a. A média amostral (x̄) do número de horas semanais trabalhadas é: {media_amostral:.2f} horas")

# b. Estime a média populacional.
# A média amostral é a melhor estimativa pontual para a média populacional.
estimativa_media_populacional = media_amostral

print(f"\nb. A estimativa pontual para a média populacional (µ) é a média amostral:")
print(f"   Estimativa de µ = {estimativa_media_populacional:.2f} horas")

print("\nInterpretação:")
print(f"Com base na amostra de 30 funcionários, estimamos que a média de horas semanais trabalhadas por funcionários de mercearias no condado seja de aproximadamente {estimativa_media_populacional:.2f} horas.")

In [None]:
import numpy as np
import scipy.stats

print("--- Questão 25 ---")

# Dados da amostra do Exercício 24
horas_trabalhadas_amostra = [
    26, 25, 32, 31, 28, 28,
    28, 22, 28, 25, 21, 40,
    32, 22, 25, 22, 26, 24,
    46, 20, 35, 22, 32, 48,
    32, 36, 38, 32, 22, 19
]
n = len(horas_trabalhadas_amostra)
media_amostral = np.mean(horas_trabalhadas_amostra) # x_barra

# Dados fornecidos para a Questão 25
desvio_padrao_populacao = 7.9 # σ
nivel_confianca = 0.95

# a. Identifique zc, n e σ.
# Para um nível de confiança de 95%, a área nas duas caudas é 1 - 0.95 = 0.05.
# A área em cada cauda é 0.05 / 2 = 0.025.
# O valor zc corresponde à área acumulada de 1 - 0.025 = 0.975.
zc = scipy.stats.norm.ppf(1 - (1 - nivel_confianca) / 2)

print(f"a. Identificação:")
print(f"   z_c (valor crítico para {nivel_confianca*100:.0f}% de confiança) = {zc:.2f}")
print(f"   n (tamanho da amostra) = {n}")
print(f"   σ (desvio padrão da população) = {desvio_padrao_populacao} horas")

# b. Calcule E usando zc, σ e n.
E = zc * (desvio_padrao_populacao / np.sqrt(n))
print(f"\nb. Margem de Erro (E) = {E:.2f} horas")

# c. Interprete os resultados da Questão 25.
print("\nc. Interpretação dos resultados da Questão 25:")
print(f"A margem de erro para o número médio de horas trabalhadas por funcionários de mercearias é de {E:.2f} horas.")
print("Isso significa que a média da amostra (29.70 horas) pode variar em até 2.83 horas para cima ou para baixo para abranger a verdadeira média populacional com 95% de confiança.")

print("\n" + "="*30 + "\n") # Separador para a próxima questão

print("--- Questão 26 ---")

# a. Calcule x-barra e E. (Já calculados acima)
print(f"a. Média amostral (x̄) = {media_amostral:.2f} horas (do Exercício 24)")
print(f"   Margem de Erro (E) = {E:.2f} horas (da Questão 25)")

# b. Calcule os limites inferior e superior do intervalo de confiança.
limite_inferior = media_amostral - E
limite_superior = media_amostral + E

print(f"\nb. Intervalo de Confiança de {nivel_confianca*100:.0f}%:")
print(f"   Limite Inferior = {limite_inferior:.2f} horas")
print(f"   Limite Superior = {limite_superior:.2f} horas")
print(f"   O intervalo de confiança é: ({limite_inferior:.2f}, {limite_superior:.2f}) horas")

# c. Interprete os resultados da Questão 26.
print("\nc. Interpretação dos resultados da Questão 26:")
print(f"Estamos 95% confiantes de que o número médio real de horas semanais trabalhadas por todos os funcionários de mercearias no condado está entre {limite_inferior:.2f} e {limite_superior:.2f} horas.")

In [None]:
import numpy as np
import scipy.stats

print("--- Questão 26 (Nova) ---")

# Dados fornecidos
n = 30        # Tamanho da amostra
x_barra = 22.9  # Média amostral (anos)
sigma = 1.5   # Desvio padrão da população (anos)
nivel_confianca = 0.90 # Nível de confiança de 90%

# a. Identifique n, x-barra, σ e zc e encontre E.

# Encontre zc (valor crítico de z) para o nível de confiança de 90%
# A área nas duas caudas é 1 - 0.90 = 0.10.
# A área em cada cauda é 0.10 / 2 = 0.05.
# O valor zc corresponde à área acumulada de 1 - 0.05 = 0.95.
zc = scipy.stats.norm.ppf(1 - (1 - nivel_confianca) / 2)

print(f"a. Identificação:")
print(f"   n (tamanho da amostra) = {n}")
print(f"   x̄ (média amostral) = {x_barra} anos")
print(f"   σ (desvio padrão da população) = {sigma} anos")
print(f"   z_c (valor crítico para {nivel_confianca*100:.0f}% de confiança) = {zc:.2f}")

# Calcule E (Margem de Erro)
E = zc * (sigma / np.sqrt(n))
print(f"   Margem de Erro (E) = {E:.2f} anos")

# b. Calcule os limites inferior e superior do intervalo de confiança.
limite_inferior = x_barra - E
limite_superior = x_barra + E

print(f"\nb. Intervalo de Confiança de {nivel_confianca*100:.0f}%:")
print(f"   Limite Inferior = {limite_inferior:.2f} anos")
print(f"   Limite Superior = {limite_superior:.2f} anos")
print(f"   O intervalo de confiança é: ({limite_inferior:.2f}, {limite_superior:.2f}) anos")

# c. Interprete os resultados.
print("\nc. Interpretação dos resultados:")
print(f"Estamos {nivel_confianca*100:.0f}% confiantes de que a verdadeira idade média de todos os estudantes atualmente matriculados na faculdade está entre {limite_inferior:.2f} e {limite_superior:.2f} anos.")

In [None]:
import numpy as np
import scipy.stats

print("--- Questão 27 ---")

# Dados fornecidos
margem_erro = 2.0         # E
nivel_confianca = 0.95    # c
desvio_padrao_populacao = 7.9 # σ

# 1. Encontre zc para o nível de confiança de 95%.
# A área nas duas caudas é 1 - 0.95 = 0.05.
# A área em cada cauda é 0.05 / 2 = 0.025.
# O valor zc corresponde à área acumulada de 1 - 0.025 = 0.975.
zc = scipy.stats.norm.ppf(1 - (1 - nivel_confianca) / 2)

print(f"z_c (valor crítico para {nivel_confianca*100:.0f}% de confiança) = {zc:.2f}")
print(f"σ (desvio padrão da população) = {desvio_padrao_populacao} horas")
print(f"E (margem de erro máxima) = {margem_erro} horas")

# 2. Calcule n usando a fórmula.
tamanho_amostra_calculado = ((zc * desvio_padrao_populacao) / margem_erro)**2

# O tamanho da amostra deve ser um número inteiro, e sempre arredondamos para cima.
n_necessario = np.ceil(tamanho_amostra_calculado)

print(f"\nO tamanho da amostra calculado (n) é: {tamanho_amostra_calculado:.2f}")
print(f"Portanto, o número de funcionários que devem ser incluídos na amostra é: {int(n_necessario)}")

print("\nInterpretação:")
print(f"Para estar 95% confiante de que a média amostral não difere da média populacional em mais de 2.0 horas, o pesquisador deve incluir pelo menos {int(n_necessario)} funcionários na amostra.")

In [None]:
import scipy.stats

print("\n--- Questão 28 ---")

# Dados fornecidos
tamanho_amostra = 22      # n
nivel_confianca = 0.90    # c

# a. Identifique os graus de liberdade.
graus_liberdade = tamanho_amostra - 1
print(f"a. Graus de liberdade (df) = n - 1 = {tamanho_amostra} - 1 = {graus_liberdade}")

# b. Identifique o nível de confiança c.
print(f"b. Nível de confiança (c) = {nivel_confianca*100:.0f}%")

# c. Use a Tabela para encontrar tc.
# Para um nível de confiança de 90% (intervalo de duas caudas), a área em uma cauda é (1 - 0.90) / 2 = 0.05.
# O valor tc é tal que a área à sua esquerda é 1 - 0.05 = 0.95.
tc = scipy.stats.t.ppf(1 - (1 - nivel_confianca) / 2, df=graus_liberdade)
print(f"\nc. O valor crítico t_c para df={graus_liberdade} e confiança de {nivel_confianca*100:.0f}% é: {tc:.3f}")

# d. Interprete os resultados.
print("\nd. Interpretação dos resultados:")
print(f"O valor crítico t_c de {tc:.3f} significa que, em uma distribuição t de Student com {graus_liberdade} graus de liberdade, {90}% da área está entre -{tc:.3f} e +{tc:.3f}.")
print("Este valor é usado para construir intervalos de confiança ou realizar testes de hipóteses quando o desvio padrão populacional é desconhecido e o tamanho da amostra é pequeno (ou quando a distribuição t é mais apropriada).")

In [None]:
import numpy as np
import scipy.stats

print("--- Questão 29 ---")

# Dados fornecidos
n = 16          # Tamanho da amostra
x_barra = 162.0 # Média amostral (ºF)
s = 10.0        # Desvio padrão amostral (ºF)

niveis_confianca = [0.90, 0.99] # Níveis de confiança a serem calculados

# Graus de liberdade
df = n - 1
print(f"Graus de liberdade (df) = n - 1 = {df}")

for nivel_confianca in niveis_confianca:
    print(f"\n--- Intervalo de Confiança de {nivel_confianca*100:.0f}% ---")

    # Encontrar t_c (valor crítico de t)
    # A área em cada cauda é (1 - nível_confianca) / 2
    alpha_over_2 = (1 - nivel_confianca) / 2
    tc = scipy.stats.t.ppf(1 - alpha_over_2, df=df)

    print(f"t_c (valor crítico para {nivel_confianca*100:.0f}% de confiança, df={df}) = {tc:.3f}")

    # Calcular a Margem de Erro (E)
    E = tc * (s / np.sqrt(n))
    print(f"Margem de Erro (E) = {E:.2f} ºF")

    # Calcular os limites do Intervalo de Confiança
    limite_inferior = x_barra - E
    limite_superior = x_barra + E

    print(f"Intervalo de Confiança: ({limite_inferior:.2f}, {limite_superior:.2f}) ºF")

    # Interpretação
    print(f"Estamos {nivel_confianca*100:.0f}% confiantes de que a verdadeira temperatura média da população de cafés vendidos está entre {limite_inferior:.2f} ºF e {limite_superior:.2f} ºF.")

In [None]:
import numpy as np
import scipy.stats

print("\n--- Questão 30 ---")

# Dados fornecidos
n = 36          # Tamanho da amostra
x_barra = 9.75  # Média amostral (dias)
s = 2.39        # Desvio padrão amostral (dias)

niveis_confianca = [0.90, 0.95] # Níveis de confiança a serem calculados

# Graus de liberdade
df = n - 1
print(f"Graus de liberdade (df) = n - 1 = {df}")

margens_erro = {}
intervalos = {}

for nivel_confianca in niveis_confianca:
    print(f"\n--- Intervalo de Confiança de {nivel_confianca*100:.0f}% ---")

    # a. Encontre tc e calcule E para cada nível de confiança.
    alpha_over_2 = (1 - nivel_confianca) / 2
    tc = scipy.stats.t.ppf(1 - alpha_over_2, df=df)

    print(f"a. t_c (valor crítico para {nivel_confianca*100:.0f}% de confiança, df={df}) = {tc:.3f}")

    E = tc * (s / np.sqrt(n))
    margens_erro[nivel_confianca] = E
    print(f"   Margem de Erro (E) = {E:.2f} dias")

    # b. Use x-barra e E para encontrar os limites inferior e superior.
    limite_inferior = x_barra - E
    limite_superior = x_barra + E
    intervalos[nivel_confianca] = (limite_inferior, limite_superior)

    print(f"b. Intervalo de Confiança: ({limite_inferior:.2f}, {limite_superior:.2f}) dias")

# c. Interprete os resultados e compare as larguras dos intervalos de confiança.
print("\nc. Interpretação dos resultados e comparação das larguras:")

for nivel_confianca, (inf, sup) in intervalos.items():
    largura = sup - inf
    print(f"Para {nivel_confianca*100:.0f}% de confiança, estamos confiantes de que a verdadeira média populacional está entre {inf:.2f} e {sup:.2f} dias. Largura: {largura:.2f} dias.")

print("\nComparação:")
largura_90 = intervalos[0.90][1] - intervalos[0.90][0]
largura_95 = intervalos[0.95][1] - intervalos[0.95][0]

print(f"A largura do intervalo de 90% é {largura_90:.2f} dias.")
print(f"A largura do intervalo de 95% é {largura_95:.2f} dias.")
print("Como esperado, o intervalo de confiança de 95% é mais largo do que o intervalo de 90%.")
print("Isso ocorre porque, para ter uma confiança maior de que o intervalo captura a verdadeira média populacional, precisamos de um intervalo mais amplo.")

In [None]:
print("\n--- Questão 31 ---")

# Dados para análise
n_q31 = 18
s_q31 = 2.5 # Desvio padrão amostral
populacao_normal = True # Assumido no problema

print("Deveremos usar a distribuição normal padrão, a distribuição t ou nenhuma delas para construir um intervalo de confiança de 90% para a média da frequência cardíaca populacional?")
print("\nExplicação do Raciocínio:")

print("1. Desvio Padrão Populacional (σ): O desvio padrão da população não é conhecido. Foi fornecido apenas o desvio padrão AMOSTRAL (s = 2.5 batimentos por minuto).")
print(f"2. Tamanho da Amostra (n): O tamanho da amostra é {n_q31}, que é PEQUENO (menor que 30).")
print("3. Distribuição da População: O problema afirma que as frequências cardíacas são NORMALMENTE DISTRIBUÍDAS.")

print("\nRegras para Intervalos de Confiança para a Média:")
print(" - Se σ é conhecido: Usar a Distribuição Normal Padrão (Z-score).")
print(" - Se σ é desconhecido e n >= 30: Usar a Distribuição Normal Padrão (Z-score), usando s como estimativa de σ (pelo Teorema do Limite Central).")
print(" - Se σ é desconhecido e n < 30: Usar a Distribuição t de Student, DESDE QUE a população seja normalmente distribuída ou a amostra seja grande o suficiente para o Teorema do Limite Central (o que não é o caso aqui).")
print(" - Se σ é desconhecido e n < 30 e a população NÃO é normalmente distribuída: Não é possível usar métodos paramétricos (Z ou t) de forma confiável.")

print(f"\nConclusão para este problema:")
print(f"Como o desvio padrão da população (σ) é DESCONHECIDO, o tamanho da amostra (n = {n_q31}) é PEQUENO, e a população é NORMALMENTE DISTRIBUÍDA, a distribuição apropriada para construir o intervalo de confiança é a **DISTRIBUIÇÃO t de Student**.")

In [None]:
print("\n--- Questão 32 ---")

# Dados fornecidos
n_q32 = 2462 # Tamanho da amostra de professores
x_q32 = 123  # Número de professores que responderam "sim"

# a. Identifique x e n.
print(f"a. Identificação:")
print(f"   x (número de sucessos) = {x_q32}")
print(f"   n (tamanho da amostra) = {n_q32}")

# b. Use x e n para encontrar p-chapéu.
p_chapeu = x_q32 / n_q32
print(f"\nb. p-chapéu (proporção amostral) = {p_chapeu:.4f}")

print("\nInterpretação:")
print(f"A proporção amostral de professores que consideram as informações de busca confiáveis é de aproximadamente {p_chapeu*100:.2f}%.")

In [None]:
import numpy as np
import scipy.stats

print("\n--- Questão 33 ---")

# Dados do Exercício 32
n_q33 = 2462
x_q33 = 123
nivel_confianca_q33 = 0.90

# a. Encontre p-chapéu e q-chapéu.
p_chapeu = x_q33 / n_q33
q_chapeu = 1 - p_chapeu
print(f"a. p-chapéu (proporção amostral) = {p_chapeu:.4f}")
print(f"   q-chapéu = {q_chapeu:.4f}")

# b. Verifique se a distribuição amostral de p-chapéu pode ser aproximada por uma distribuição normal.
np_chapeu = n_q33 * p_chapeu
nq_chapeu = n_q33 * q_chapeu
pode_aproximar_normal = (np_chapeu >= 5) and (nq_chapeu >= 5)

print(f"\nb. Verificação da aproximação normal:")
print(f"   n * p-chapéu = {np_chapeu:.2f}")
print(f"   n * q-chapéu = {nq_chapeu:.2f}")
print(f"   É possível aproximar por uma distribuição normal? {'Sim' if pode_aproximar_normal else 'Não'}")

if not pode_aproximar_normal:
    print("   (Não é possível construir o intervalo de confiança usando a aproximação normal.)")
    exit() # Interrompe a execução se a aproximação não for válida

# c. Encontre zc e E.
# zc para 90% de confiança
zc_q33 = scipy.stats.norm.ppf(1 - (1 - nivel_confianca_q33) / 2)
print(f"\nc. z_c (valor crítico para {nivel_confianca_q33*100:.0f}% de confiança) = {zc_q33:.2f}")

# Calcule E (Margem de Erro) para proporções
E_q33 = zc_q33 * np.sqrt((p_chapeu * q_chapeu) / n_q33)
print(f"   Margem de Erro (E) = {E_q33:.4f}")

# d. Use p-chapéu e E para calcular os limites inferior e superior do intervalo de confiança.
limite_inferior_q33 = p_chapeu - E_q33
limite_superior_q33 = p_chapeu + E_q33

print(f"\nd. Intervalo de Confiança de {nivel_confianca_q33*100:.0f}%:")
print(f"   Limite Inferior = {limite_inferior_q33:.4f}")
print(f"   Limite Superior = {limite_superior_q33:.4f}")
print(f"   O intervalo de confiança é: ({limite_inferior_q33:.4f}, {limite_superior_q33:.4f})")

# e. Interprete os resultados.
print("\ne. Interpretação dos resultados:")
print(f"Estamos {nivel_confianca_q33*100:.0f}% confiantes de que a verdadeira proporção populacional de professores americanos que consideram as informações de busca on-line corretas/confiáveis está entre {limite_inferior_q33*100:.2f}% e {limite_superior_q33*100:.2f}%.")

In [None]:
import numpy as np
import scipy.stats

print("--- Questão 34 ---")

# Dados fornecidos
n = 498         # Tamanho da amostra de adultos
proporcao_amostral = 0.25 # 25% consideram pessoas acima de 65 anos perigosas
nivel_confianca = 0.99  # 99% de nível de confiança

# a. Encontre p-chapéu e q-chapéu.
p_chapeu = proporcao_amostral
q_chapeu = 1 - p_chapeu
print(f"a. p-chapéu (proporção amostral) = {p_chapeu:.2f}")
print(f"   q-chapéu = {q_chapeu:.2f}")

# b. Verifique se a distribuição amostral de p-chapéu pode ser aproximada por uma distribuição normal.
np_chapeu = n * p_chapeu
nq_chapeu = n * q_chapeu
pode_aproximar_normal = (np_chapeu >= 5) and (nq_chapeu >= 5)

print(f"\nb. Verificação da aproximação normal:")
print(f"   n * p-chapéu = {np_chapeu:.2f}")
print(f"   n * q-chapéu = {nq_chapeu:.2f}")
print(f"   É possível aproximar por uma distribuição normal? {'Sim' if pode_aproximar_normal else 'Não'}")

if not pode_aproximar_normal:
    print("   (Não é possível construir o intervalo de confiança usando a aproximação normal.)")
    # Para fins de demonstração, o código prosseguirá, mas em um cenário real, você pararia aqui.

# c. Encontre zc e E.
# zc para 99% de confiança
# A área em cada cauda é (1 - 0.99) / 2 = 0.005.
# O valor zc corresponde à área acumulada de 1 - 0.005 = 0.995.
zc = scipy.stats.norm.ppf(1 - (1 - nivel_confianca) / 2)
print(f"\nc. z_c (valor crítico para {nivel_confianca*100:.0f}% de confiança) = {zc:.2f}")

# Calcule E (Margem de Erro) para proporções
E = zc * np.sqrt((p_chapeu * q_chapeu) / n)
print(f"   Margem de Erro (E) = {E:.4f}")

# d. Use p-chapéu e E para calcular os limites inferior e superior do intervalo de confiança.
limite_inferior = p_chapeu - E
limite_superior = p_chapeu + E

print(f"\nd. Intervalo de Confiança de {nivel_confianca*100:.0f}%:")
print(f"   Limite Inferior = {limite_inferior:.4f}")
print(f"   Limite Superior = {limite_superior:.4f}")
print(f"   O intervalo de confiança é: ({limite_inferior:.4f}, {limite_superior:.4f})")

# e. Interprete os resultados.
print("\ne. Interpretação dos resultados:")
print(f"Estamos {nivel_confianca*100:.0f}% confiantes de que a verdadeira proporção populacional de adultos que consideram pessoas acima de 65 anos como os motoristas mais perigosos está entre {limite_inferior*100:.2f}% e {limite_superior*100:.2f}%.")

In [None]:
import numpy as np
import scipy.stats

print("--- Questão 35 ---")

# Dados comuns a ambos os cenários
margem_erro_q35 = 0.02 # E = 2%
nivel_confianca_q35 = 0.90

# zc para 90% de confiança
# Área nas caudas = 1 - 0.90 = 0.10. Área em cada cauda = 0.10 / 2 = 0.05.
# zc corresponde à área acumulada de 1 - 0.05 = 0.95.
zc_q35 = scipy.stats.norm.ppf(1 - (1 - nivel_confianca_q35) / 2)

print(f"a. Identificação dos parâmetros comuns:")
print(f"   Margem de Erro (E) = {margem_erro_q35*100:.0f}%")
print(f"   z_c (valor crítico para {nivel_confianca_q35*100:.0f}% de confiança) = {zc_q35:.2f}")

# Cenário 1: Não há estimativa preliminar disponível
print("\n--- Cenário 1: Sem estimativa preliminar de p-chapéu ---")
p_chapeu_cenario1 = 0.5 # Usamos 0.5 para maximizar o tamanho da amostra
q_chapeu_cenario1 = 1 - p_chapeu_cenario1

print(f"a. p-chapéu = {p_chapeu_cenario1:.1f}, q-chapéu = {q_chapeu_cenario1:.1f}")

# b. Calcule o tamanho mínimo da amostra n.
n_cenario1_calculado = (p_chapeu_cenario1 * q_chapeu_cenario1) * (zc_q35 / margem_erro_q35)**2
n_cenario1 = np.ceil(n_cenario1_calculado) # Arredondar para cima

print(f"b. Tamanho mínimo da amostra calculado (n) = {n_cenario1_calculado:.2f}")
print(f"c. Quantos adultos devem ser incluídos na amostra (arredondado para cima) = {int(n_cenario1)}")

# Cenário 2: Uma pesquisa anterior descobriu que 31%
print("\n--- Cenário 2: Com estimativa preliminar de p-chapéu = 0.31 ---")
p_chapeu_cenario2 = 0.31
q_chapeu_cenario2 = 1 - p_chapeu_cenario2

print(f"a. p-chapéu = {p_chapeu_cenario2:.2f}, q-chapéu = {q_chapeu_cenario2:.2f}")

# b. Calcule o tamanho mínimo da amostra n.
n_cenario2_calculado = (p_chapeu_cenario2 * q_chapeu_cenario2) * (zc_q35 / margem_erro_q35)**2
n_cenario2 = np.ceil(n_cenario2_calculado) # Arredondar para cima

print(f"b. Tamanho mínimo da amostra calculado (n) = {n_cenario2_calculado:.2f}")
print(f"c. Quantos adultos devem ser incluídos na amostra (arredondado para cima) = {int(n_cenario2)}")

print("\nInterpretação:")
print(f"No cenário 1 (sem estimativa preliminar), são necessários {int(n_cenario1)} adultos para a amostra.")
print(f"No cenário 2 (com estimativa preliminar de 31%), são necessários {int(n_cenario2)} adultos para a amostra.")
print("É necessário um tamanho de amostra maior quando não há estimativa preliminar, pois o valor de p-chapéu = 0.5 maximiza o produto p-chapéu * q-chapéu, garantindo que o tamanho da amostra seja grande o suficiente para qualquer proporção verdadeira.")

In [None]:
import scipy.stats

print("\n--- Questão 36 ---")

# Dados fornecidos
n_q36 = 30 # Tamanho da amostra
nivel_confianca_q36 = 0.90

# a. Identifique os graus de liberdade e o nível de confiança.
graus_liberdade_q36 = n_q36 - 1
print(f"a. Graus de liberdade (df) = n - 1 = {graus_liberdade_q36}")
print(f"   Nível de confiança (c) = {nivel_confianca_q36*100:.0f}%")

# b. Encontre as áreas à direita de χ²R e χ²L.
# Para um intervalo de confiança de 90%, (1 - 0.90) = 0.10 nas caudas.
# Cada cauda tem 0.10 / 2 = 0.05.
area_cauda_esquerda = 0.05
area_cauda_direita = 0.05

print(f"\nb. Áreas à direita:")
print(f"   Área à direita de χ²_R (cauda superior) = {area_cauda_direita:.2f}")
print(f"   Área à direita de χ²_L (cauda inferior) = {1 - area_cauda_esquerda:.2f} (ou seja, 0.95)")

# c. Use a Tabela para encontrar χ²_R e χ²_L.
# Lembre-se que chi2.ppf() recebe a área à esquerda.
chi2_L = scipy.stats.chi2.ppf(area_cauda_esquerda, df=graus_liberdade_q36)
chi2_R = scipy.stats.chi2.ppf(1 - area_cauda_direita, df=graus_liberdade_q36)

print(f"\nc. Valores críticos Qui-Quadrado:")
print(f"   χ²_L (valor crítico esquerdo) = {chi2_L:.3f}")
print(f"   χ²_R (valor crítico direito) = {chi2_R:.3f}")

# d. Interprete os resultados.
print("\nd. Interpretação dos resultados:")
print(f"Para uma distribuição Qui-Quadrado com {graus_liberdade_q36} graus de liberdade, {90}% da área está entre {chi2_L:.3f} e {chi2_R:.3f}.")
print("Esses valores são usados para construir intervalos de confiança para a variância ou desvio padrão populacional.")