In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import glob

# 1. Leitura e união dos arquivos CSV
file_paths = glob.glob("*.csv")  # Certifique-se de executar no diretório correto

dataframes = []
for file in file_paths:
    df = pd.read_csv(file, sep=';', encoding='utf-8')
    dataframes.append(df)

data = pd.concat(dataframes, ignore_index=True)

# 2. Pré-processamento básico
# Converter datas para o formato datetime
data['dataNotificacao'] = pd.to_datetime(data['dataNotificacao'], errors='coerce')

# 3. Análise descritiva
## Principais sintomas
sintomas_counts = data['sintomas'].str.get_dummies(sep=',').sum().sort_values(ascending=False)

## Incidências por município
municipios_counts = data['municipioNotificacao'].value_counts()

## Incidências por raça/cor
raca_counts = data['racaCor'].value_counts()

## Doses de vacina
vacina_counts = data['codigoDosesVacina'].value_counts()

## Incidências por mês
data['mes'] = data['dataNotificacao'].dt.to_period('M')
mes_counts = data['mes'].value_counts().sort_index()

# 4. Visualizações
plt.figure(figsize=(10, 6))
sintomas_counts.head(10).plot(kind='bar', color='skyblue')
plt.title('Top 10 Sintomas Registrados')
plt.xlabel('Sintomas')
plt.ylabel('Frequência')
plt.xticks(rotation=45)
plt.show()

plt.figure(figsize=(10, 6))
municipios_counts.head(10).plot(kind='bar', color='salmon')
plt.title('Top 10 Municípios com Mais Incidências')
plt.xlabel('Município')
plt.ylabel('Frequência')
plt.xticks(rotation=45)
plt.show()

plt.figure(figsize=(10, 6))
raca_counts.plot(kind='bar', color='green')
plt.title('Incidências por Raça/Cor')
plt.xlabel('Raça/Cor')
plt.ylabel('Frequência')
plt.xticks(rotation=45)
plt.show()

plt.figure(figsize=(10, 6))
mes_counts.plot(kind='bar', color='purple')
plt.title('Incidências por Mês')
plt.xlabel('Mês')
plt.ylabel('Frequência')
plt.xticks(rotation=45)
plt.show()

plt.figure(figsize=(10, 6))
vacina_counts.plot(kind='bar', color='orange')
plt.title('Doses de Vacina Administradas')
plt.xlabel('Doses')
plt.ylabel('Frequência')
plt.xticks(rotation=45)
plt.show()

# Salvar resultados principais para análise adicional
sintomas_counts.to_csv('sintomas_counts.csv', index=True)
municipios_counts.to_csv('municipios_counts.csv', index=True)
raca_counts.to_csv('raca_counts.csv', index=True)
vacina_counts.to_csv('vacina_counts.csv', index=True)
mes_counts.to_csv('mes_counts.csv', index=True)
