### Análise Exploratória de Dados (EDA)

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv("../data/processed/tweets_analise_final.csv")
df['criado_em'] = pd.to_datetime(df['criado_em'])

sns.set_theme(style="whitegrid")

# Gráfico da Distribuição de Sentimentos
plt.figure(figsize=(8, 5))
sns.countplot(
    data=df, 
    x='sentimento_final', 
    hue='sentimento_final', 
    order=['negativo', 'neutro', 'positivo'], 
    palette=['#e74c3c', '#95a5a6', '#2ecc71'],
    legend=False
)
plt.title('Distribuição de Sentimentos - Tite no Cruzeiro', fontsize=14)
plt.ylabel('Quantidade de Tweets')
plt.xlabel('Sentimento')
plt.show()

# Top 10 Perfis com Mais Seguidores
plt.figure(figsize=(10, 5))
df_top_users = df.sort_values(by='seguidores', ascending=False).drop_duplicates(subset=['usuario']).head(10)

sns.barplot(
    data=df_top_users, 
    x='seguidores', 
    y='usuario', 
    hue='usuario',
    palette='viridis', 
    legend=False
)

plt.title('Top 10 Perfis com Maior Alcance Falando Sobre o Tite', fontsize=14)
plt.xlabel('Número de Seguidores')
plt.ylabel('Usuário (@)')
plt.show()

# Gráfico da Distribuição de Confiança
plt.figure(figsize=(8, 5))
sns.histplot(df['confianca'], bins=20, kde=True, color='#8e44ad')
plt.title('Distribuição da Confiança do Modelo', fontsize=14)
plt.xlabel('Score de Confiança')
plt.show()