In [None]:
import pandas as pd
from sklearn.preprocessing import StandardScaler
import seaborn as sns
import matplotlib.pyplot as plt

# Importar os dados da planilha CSV
df = pd.read_csv('C:/Users/brubs/OneDrive/Área de Trabalho/projeto final reprograma/planilhadedados - Dados da Pesquisa.csv', encoding='utf-8')

# Verificando os dados importados
print("Dados importados:")
print(df.head())

# Verificando valores nulos
valores_nulos = df.isnull().sum()
print("Valores nulos antes do preenchimento:")
print(valores_nulos)

# Preenchendo valores nulos
df.fillna({'Idade': 'Desconhecida', 'Renda Familiar': 'Desconhecida'}, inplace=True)

# Verificando valores nulos após o preenchimento
valores_nulos = df.isnull().sum()
print("Valores nulos após o preenchimento:")
print(valores_nulos)

# Convertendo a coluna de Renda Familiar para um formato numérico
def parse_renda(renda):
    # Ignora valores que são 'Desconhecida'
    if renda == 'Desconhecida':
        return None  # ou você pode retornar um valor específico como 0
    renda = renda.replace('R$ ', '').replace('.', '').replace(',', '.').strip()
    if renda.startswith('+'):
        return float(renda[1:]) + 998.00  # Considera como "mais de"
    elif renda.startswith('-'):
        return float(renda[1:])  # Considera como "menos de"
    else:
        return float(renda)

# Aplicando a função de conversão
df['Renda Familiar'] = df['Renda Familiar'].apply(parse_renda)

# Verificando a conversão da renda
print("Dados após conversão da Renda Familiar:")
print(df[['Renda Familiar']].head())

# Analisando a prevalência de violência
prevalencia_violencia = df['Tipo de Violência'].value_counts()
print("Prevalência de Violência:")
print(prevalencia_violencia)

# Consequências para a saúde
consequencias_saude = df['Consequências para Saúde'].value_counts()
print("Consequências para Saúde:")
print(consequencias_saude)

# Buscando atendimento
busca_atendimento = df['Buscou atendimento?'].value_counts()
print("Buscando Atendimento:")
print(busca_atendimento)

# Visualização usando seaborn
plt.figure(figsize=(10, 6))
sns.countplot(data=df, x='Tipo de Violência', hue='Buscou atendimento?')
plt.title('Prevalência de Violência e Busca de Atendimento')
plt.xlabel('Tipo de Violência')
plt.ylabel('Contagem')
plt.legend(title='Buscou Atendimento?')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

# Salvando resultados em um novo CSV
resultado = {
    'Prevalência de Violência': prevalencia_violencia,
    'Consequências para Saúde': consequencias_saude,
    'Buscando Atendimento': busca_atendimento
}

resultado_df = pd.DataFrame(resultado)
resultado_df.to_csv('resultado_analisado.csv', index=False)

