<a href="https://colab.research.google.com/github/sebavassou/Estatistica_Inferencial/blob/main/Exerc%C3%ADcio03.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Exercício 03 de Estatística Inferencial

A seguir, apresento a resolução do Exercício 03 de Estatística Inferencial.

**Raciocínio e Metodologia**

O problema nos pede para determinar se um programa de capacitação profissional foi eficaz em aumentar a taxa de emprego de jovens adultos, que era de 45% antes da intervenção. Para isso, temos uma amostra de 200 participantes.


A resolução será dividida em duas partes principais, seguindo as tarefas propostas:


**Teste de Hipóteses:**

Para verificar se o programa aumentou significativamente a taxa de emprego, utilizarei um teste de hipóteses para a proporção populacional. Como a pergunta é sobre um aumento, trata-se de um teste unilateral à direita.



**Intervalo de Confiança:**

Para estimar a nova taxa de emprego real na população de jovens adultos que passaram pelo programa, calcularei um intervalo de confiança de 95% para a proporção. Isso nos dará uma faixa de valores plausíveis para a nova taxa de emprego.

In [16]:
# Importar as bibliotecas necessárias
import pandas as pd
from statsmodels.stats.proportion import proportions_ztest, proportion_confint
import numpy as np


In [17]:
# --- Carregamento do Dataset ---


df = pd.read_csv('programa_social_dataset.csv', sep=',')
print("Dataset 'programa_social_dataset.csv' carregado com sucesso!")
print("-" * 50)


# Limpando as colunas
df.columns = df.columns.str.strip()

# Mostrando as informações do dataframe para verificar o carregamento
print("Initial DataFrame Info:")
df.info()


Dataset 'programa_social_dataset.csv' carregado com sucesso!
--------------------------------------------------
Initial DataFrame Info:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 200 entries, 0 to 199
Data columns (total 8 columns):
 #   Column              Non-Null Count  Dtype 
---  ------              --------------  ----- 
 0   id                  200 non-null    int64 
 1   idade               200 non-null    int64 
 2   sexo                200 non-null    object
 3   escolaridade        200 non-null    object
 4   experiencia_previa  200 non-null    object
 5   regiao              200 non-null    object
 6   empregado_antes     200 non-null    int64 
 7   empregado_apos      200 non-null    int64 
dtypes: int64(4), object(4)
memory usage: 12.6+ KB


In [18]:
# --- Extração das Estatísticas da Amostra  ---
# A coluna que indica o status de emprego após o programa é 'empregado_apos'.
coluna_alvo = 'empregado_apos'

# Número de sucessos é a soma da coluna (assumindo 1 = empregado, 0 = não empregado)
x_sucessos = df[coluna_alvo].sum()

# Tamanho total da amostra
n_total = len(df)

# Proporção de empregados na amostra
p_amostral = x_sucessos / n_total

print("\nAnálise Descritiva da Amostra:")
print(f"  - Total de Participantes (n): {n_total}")
print(f"  - Participantes Empregados (x): {x_sucessos}")
print(f"  - Nova Taxa de Emprego na Amostra (p̂): {p_amostral:.2%}")
print("-" * 50)


# --- Tarefa 1: Teste de Hipótese para Proporção ---
# O objetivo é testar se a nova taxa de emprego é significativamente MAIOR que 45%.
p0_historico = 0.45  # Taxa de emprego antes do programa
alpha = 0.05         # Nível de significância padrão

# Definição das hipóteses
# H₀: p = 0.45 (A taxa de emprego não aumentou)
# H₁: p > 0.45 (A taxa de emprego aumentou)
print("\nTarefa 1: Teste de Hipótese (Unilateral à Direita)")
print(f"Hipótese Nula (H₀): p = {p0_historico}")
print(f"Hipótese Alternativa (H₁): p > {p0_historico}")

# Execução do teste de hipótese unilateral à direita ('larger')
estatistica_z, p_valor = proportions_ztest(
    count=x_sucessos,
    nobs=n_total,
    value=p0_historico,
    alternative='larger'
)

print(f"\nResultados do Teste:")
print(f"  - Estatística de Teste (z-score): {estatistica_z:.4f}")
print(f"  - P-Valor: {p_valor:.4f}")

# Conclusão do teste baseada no p-valor
if p_valor < alpha:
    print(f"\nDecisão: Rejeitar a hipótese nula (H₀), pois o p-valor ({p_valor:.4f}) é menor que alfa ({alpha}).")
    print("Conclusão: ✅ Há evidência estatística suficiente para afirmar que o programa aumentou significativamente a taxa de emprego.")
else:
    print(f"\nDecisão: Não rejeitar a hipótese nula (H₀), pois o p-valor ({p_valor:.4f}) é maior ou igual a alfa ({alpha}).")
    print("Conclusão: ❌ Não há evidência estatística suficiente para afirmar que o programa aumentou a taxa de emprego.")

print("-" * 50)

# --- Tarefa 2: Intervalo de Confiança para a Nova Taxa de Emprego ---
# O objetivo é calcular o intervalo de confiança para a nova taxa de emprego.
print("\nTarefa 2: Intervalo de Confiança para a Nova Taxa de Emprego")

# Cálculo do intervalo de confiança de 95%
ic_inferior, ic_superior = proportion_confint(
    count=x_sucessos,
    nobs=n_total,
    alpha=0.05,  # Nível de significância (1 - 0.95)
    method='normal'
)

print(f"\nO Intervalo de Confiança de 95% para a nova taxa de emprego é: [{ic_inferior:.2%}, {ic_superior:.2%}]")
print(f"Interpretação: Temos 95% de confiança de que a verdadeira taxa de emprego para a população de participantes do programa está entre {ic_inferior:.2%} e {ic_superior:.2%}.")


Análise Descritiva da Amostra:
  - Total de Participantes (n): 200
  - Participantes Empregados (x): 108
  - Nova Taxa de Emprego na Amostra (p̂): 54.00%
--------------------------------------------------

Tarefa 1: Teste de Hipótese (Unilateral à Direita)
Hipótese Nula (H₀): p = 0.45
Hipótese Alternativa (H₁): p > 0.45

Resultados do Teste:
  - Estatística de Teste (z-score): 2.5538
  - P-Valor: 0.0053

Decisão: Rejeitar a hipótese nula (H₀), pois o p-valor (0.0053) é menor que alfa (0.05).
Conclusão: ✅ Há evidência estatística suficiente para afirmar que o programa aumentou significativamente a taxa de emprego.
--------------------------------------------------

Tarefa 2: Intervalo de Confiança para a Nova Taxa de Emprego

O Intervalo de Confiança de 95% para a nova taxa de emprego é: [47.09%, 60.91%]
Interpretação: Temos 95% de confiança de que a verdadeira taxa de emprego para a população de participantes do programa está entre 47.09% e 60.91%.
