<a href="https://colab.research.google.com/github/julianakaroline111/Julianasantos.Womakerscode/blob/main/Estat%C3%ADstica_Teste_de_Hip%C3%B3teses_Juliana_WMC_April.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Exercício 1: Avaliação da Taxa de Conversão entre Cenários

In [12]:
import pandas as pd

# Carregando dados do experimento A/B para análise
experimento_df = pd.read_csv('/experimento_teste_ab.csv')

# Calculando e exibindo a taxa de conversão por versão de página
conversion_rates = experimento_df.groupby('Versão_Página').apply(
    lambda x: x['Conversões'].sum() / x['Visualizações'].sum()
)
print("Análise de Taxa de Conversão por Página:\n", conversion_rates.to_string())

Análise de Taxa de Conversão por Página:
 Versão_Página
A    0.000696
B    0.000830


In [13]:
# Formatação dos resultados de taxa de conversão para exibição em porcentagem
conversion_rates_percent = conversion_rates.apply(lambda x: f"{x * 100:.2f}%")
print("Análise de Taxa de Conversão por Página (em porcentagem):\n", conversion_rates_percent.to_string())

Análise de Taxa de Conversão por Página (em porcentagem):
 Versão_Página
A    0.07%
B    0.08%


Exercício 2: Determinação do Tamanho da Amostra para Teste A/B






In [25]:
import pandas as pd
from statsmodels.stats.power import NormalIndPower
from statsmodels.stats.proportion import proportion_effectsize

# Carregando os dados do experimento para avaliação do cenário de conversão
dados_experimento = pd.read_csv('/experimento_teste_ab.csv')

# Calculando a taxa de conversão atual do cenário A, que é nosso controle
taxa_atual_cenario_A = dados_experimento[dados_experimento['Versão_Página'] == 'A']['Conversões'].sum() / dados_experimento[dados_experimento['Versão_Página'] == 'A']['Visualizações'].sum()

# Definindo a nova meta de taxa de conversão desejada para 10%
meta_taxa_conversao = 0.10

# Calculando o tamanho do efeito necessário para detectar a mudança desejada entre o cenário atual e a nova meta
tamanho_do_efeito = proportion_effectsize(taxa_atual_cenario_A, meta_taxa_conversao)

# Preparando a análise de poder estatístico para determinar o tamanho da amostra
analise_poder = NormalIndPower()

try:
    # Determinando o tamanho da amostra necessário para alcançar os objetivos do teste com 95% de confiança e 80% de poder
    tamanho_amostra_necessario = analise_poder.solve_power(effect_size=tamanho_do_efeito, alpha=0.05, power=0.80, ratio=1.0, alternative='two-sided')
    print(f"Taxa de conversão atual no cenário A: {taxa_atual_cenario_A:.4f}")
    print(f"Tamanho do efeito estimado: {tamanho_do_efeito:.4f}")
    print(f"Tamanho da amostra necessário por grupo para detectar a mudança desejada: {int(tamanho_amostra_necessario)}")
except Exception as erro:
    print(f"Ocorreu um erro ao calcular o tamanho da amostra: {erro}")


Taxa de conversão atual no cenário A: 0.0007
Tamanho do efeito estimado: -0.5907
Tamanho da amostra necessário por grupo para detectar a mudança desejada: 44


Exercício 3: Análise de Idade Média em Pacientes com Problemas Cardíacos


In [30]:
import pandas as pd
from scipy import stats

# Carregando a base de dados de pacientes para análise
dados_pacientes = pd.read_csv('/pacientes.csv')

# Definindo uma lista de índices representativos para estudar um grupo específico de pacientes
indices_selecionados = [909, 751, 402, 400, 726, 39, 184, 269, 255, 769, 209, 715, 677, 381, 793, 697,
                        89, 280, 232, 756, 358, 36, 439, 768, 967, 699, 473, 222, 89, 639, 883, 558, 757,
                        84, 907, 895, 217, 224, 311, 348, 146, 505, 273, 957, 362]

# Extrair as idades dos pacientes usando os índices especificados
amostra_idades = dados_pacientes.loc[indices_selecionados, 'Idade']

# Aplicar teste estatístico t para verificar se a idade média dos pacientes excede 50 anos
t_estatistica, valor_p = stats.ttest_1samp(amostra_idades, 50)

# Apresentar os resultados de uma forma clara e interpretativa
print(f"Análise da Idade dos Pacientes com Problemas Cardíacos:\nEstatística-t = {t_estatistica:.2f}, Valor-p = {valor_p:.4f}")

# Decisão baseada no valor-p e na significância estatística definida
if valor_p < 0.05:
    print("Conclusão: Há evidências estatísticas de que a idade média é significativamente maior que 50 anos.")
else:
    print("Conclusão: As evidências não são suficientes para afirmar que a idade média ultrapassa 50 anos.")


Análise da Idade dos Pacientes com Problemas Cardíacos:
Estatística-t = 0.05, Valor-p = 0.9585
Conclusão: As evidências não são suficientes para afirmar que a idade média ultrapassa 50 anos.


Exercício 4: Análise/Discussão sobre a Independência de Amostras

In [32]:
import pandas as pd

# Carregando a base de dados que representa pacientes de um hospital cardiológico
dados_pacientes = pd.read_csv('/pacientes.csv')

# Criando segmentações no conjunto de dados para análise de condições de saúde
grupo_com_condicoes_adicionais = dados_pacientes[dados_pacientes['Estado_Saude'] == 1]  # Pacientes com condições adicionais
grupo_sem_condicoes_adicionais = dados_pacientes[dados_pacientes['Estado_Saude'] == 0]  # Pacientes sem condições adicionais

# Apresentando a divisão dos dados para transparência na análise
print(f"Total de pacientes com condições adicionais: {len(grupo_com_condicoes_adicionais)}")
print(f"Total de pacientes sem condições adicionais(Saudáveis): {len(grupo_sem_condicoes_adicionais)}")

# Discussão sobre a natureza das amostras
conclusao = "As amostras são independentes, indicando que os indivíduos em um grupo não influenciam, e nem estão relacionados aos indivíduos do outro grupo."
print(conclusao)


Total de pacientes com condições adicionais: 510
Total de pacientes sem condições adicionais(Saudáveis): 490
As amostras são independentes, indicando que os indivíduos em um grupo não influenciam, e nem estão relacionados aos indivíduos do outro grupo.


Exercício 5: Comparação de Pressão Arterial por Condição de Saúde
