# üöÄ SISTEMA INTELIGENTE AEROSUL - Google Colab
## An√°lise de Sentimentos e Detec√ß√£o de Crises

**Status:** ‚úÖ Pronto para usar

Este notebook executa o sistema inteligente AeroSul no Google Colab.

### Como usar:
1. Clique em **Runtime** ‚Üí **Run all** (ou Ctrl+F9)
2. Se quiser analisar um arquivo pr√≥prio, fa√ßa upload quando solicitado
3. Se n√£o quiser, o sistema roda com dados de demonstra√ß√£o

## üì¶ Passo 1: Instalar Depend√™ncias

In [None]:
# Instalar depend√™ncias
!pip install -q pandas numpy scikit-learn matplotlib seaborn openpyxl requests schedule

print("‚úÖ Depend√™ncias instaladas com sucesso!")

## üîß Passo 2: Definir Classes do Sistema

In [None]:
import pandas as pd
import numpy as np
import re
from datetime import datetime
from typing import Dict, List, Tuple, Optional
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
from sklearn.metrics import classification_report, accuracy_score

class TextCleaner:
    """Respons√°vel pela limpeza e normaliza√ß√£o de textos."""
    
    @staticmethod
    def clean_english(text: str) -> str:
        """Limpa textos em ingl√™s."""
        text = str(text).lower()
        text = re.sub(r'@[A-Za-z0-9_]+', '', text)
        text = re.sub(r'http\S+', '', text)
        text = re.sub(r'[^a-z0-9\s]', '', text)
        return text.strip()
    
    @staticmethod
    def clean_portuguese(text: str) -> str:
        """Limpa textos em portugu√™s."""
        text = str(text).lower()
        text = re.sub(r'@[A-Za-z0-9_]+', '', text)
        text = re.sub(r'http\S+', '', text)
        text = re.sub(r'[^a-z√°√©√≠√≥√∫√¢√™√¥√£√µ√ß√±0-9\s]', '', text)
        return text.strip()


class SentimentModel:
    """Modelo especializado em classifica√ß√£o de sentimentos."""
    
    def __init__(self, language: str = 'english'):
        self.language = language
        self.pipeline = Pipeline([
            ('tfidf', TfidfVectorizer(max_features=3000, stop_words=language)),
            ('clf', LogisticRegression(solver='liblinear', max_iter=1000))
        ])
        self.is_trained = False
        self.classes_ = None
        self.metrics = {}
    
    def train(self, X_train, y_train, X_val=None, y_val=None):
        """Treina o modelo de sentimento."""
        print(f"[SentimentModel] Treinando com {len(X_train)} amostras...")
        self.pipeline.fit(X_train, y_train)
        self.is_trained = True
        self.classes_ = self.pipeline.named_steps['clf'].classes_
        
        if X_val is not None and y_val is not None:
            y_pred = self.pipeline.predict(X_val)
            self.metrics['accuracy'] = accuracy_score(y_val, y_pred)
            print(f"[SentimentModel] Accuracy na Valida√ß√£o: {self.metrics['accuracy']:.4f}")
        
        return self
    
    def predict(self, X) -> np.ndarray:
        """Prediz sentimentos."""
        if not self.is_trained:
            raise ValueError("Modelo n√£o foi treinado.")
        return self.pipeline.predict(X)
    
    def predict_proba(self, X) -> np.ndarray:
        """Retorna probabilidades."""
        if not self.is_trained:
            raise ValueError("Modelo n√£o foi treinado.")
        return self.pipeline.predict_proba(X)


class ReasonModel:
    """Modelo especializado em classifica√ß√£o de motivos."""
    
    def __init__(self, language: str = 'english'):
        self.language = language
        self.pipeline = Pipeline([
            ('tfidf', TfidfVectorizer(max_features=3000, stop_words=language)),
            ('clf', LogisticRegression(solver='liblinear', multi_class='ovr', max_iter=1000))
        ])
        self.is_trained = False
        self.classes_ = None
        self.metrics = {}
    
    def train(self, X_train, y_train, X_val=None, y_val=None):
        """Treina o modelo de motivos."""
        print(f"[ReasonModel] Treinando com {len(X_train)} amostras...")
        self.pipeline.fit(X_train, y_train)
        self.is_trained = True
        self.classes_ = self.pipeline.named_steps['clf'].classes_
        
        if X_val is not None and y_val is not None:
            y_pred = self.pipeline.predict(X_val)
            self.metrics['accuracy'] = accuracy_score(y_val, y_pred)
            print(f"[ReasonModel] Accuracy na Valida√ß√£o: {self.metrics['accuracy']:.4f}")
        
        return self
    
    def predict(self, X) -> np.ndarray:
        """Prediz motivos."""
        if not self.is_trained:
            raise ValueError("Modelo n√£o foi treinado.")
        return self.pipeline.predict(X)


class CrisisDetector:
    """Detecta padr√µes de crise."""
    
    def __init__(self, threshold_multiplier: float = 1.5):
        self.threshold_multiplier = threshold_multiplier
        self.mean_negative = None
        self.std_negative = None
        self.crisis_threshold = None
    
    def fit(self, daily_negative_counts: pd.Series):
        """Calibra os limiares."""
        self.mean_negative = daily_negative_counts.mean()
        self.std_negative = daily_negative_counts.std()
        self.crisis_threshold = self.mean_negative + (self.threshold_multiplier * self.std_negative)
        print(f"[CrisisDetector] Limiar de crise calibrado: {self.crisis_threshold:.2f}")
        return self
    
    def detect(self, daily_counts: pd.Series) -> Dict:
        """Detecta crises."""
        if self.crisis_threshold is None:
            raise ValueError("CrisisDetector n√£o foi calibrado.")
        
        crisis_days = daily_counts[daily_counts > self.crisis_threshold]
        
        return {
            'is_crisis': len(crisis_days) > 0,
            'crisis_dates': crisis_days.index.tolist(),
            'max_count': daily_counts.max(),
            'max_date': daily_counts.idxmax(),
            'normal_mean': self.mean_negative,
            'threshold': self.crisis_threshold,
            'severity_factor': daily_counts.max() / self.mean_negative if self.mean_negative > 0 else 0
        }


class FinancialAnalyzer:
    """Calcula impacto financeiro."""
    
    COST_TABLE = {
        "Lost Luggage": 3000,
        "Late Flight": 2500,
        "Cancelled Flight": 5000,
        "Customer Service Issue": 1500,
        "Bad Flight": 1000,
        "Flight Attendant Complaints": 1000,
        "longlines": 500,
        "Damaged Luggage": 800,
        "Flight Booking Problems": 600,
        "Neutral Interaction": 0,
        "Unclassified Negative": 200,
    }
    
    def __init__(self, exchange_rate: float = 6.00):
        self.exchange_rate = exchange_rate
    
    def get_cost(self, reason: str) -> float:
        """Retorna custo para um motivo."""
        return self.COST_TABLE.get(reason, 200)
    
    def calculate_impact(self, df: pd.DataFrame, reason_column: str = 'IA_Motivo') -> Dict:
        """Calcula impacto financeiro."""
        df_negative = df[df.get('IA_Sentimento', 'unknown') == 'negative'].copy()
        
        if len(df_negative) == 0:
            return {
                'total_incidents': 0,
                'total_usd': 0,
                'total_brl': 0,
                'by_reason': {}
            }
        
        df_negative['cost_usd'] = df_negative[reason_column].apply(self.get_cost)
        df_negative['cost_brl'] = df_negative['cost_usd'] * self.exchange_rate
        
        return {
            'total_incidents': len(df_negative),
            'total_usd': df_negative['cost_usd'].sum(),
            'total_brl': df_negative['cost_brl'].sum(),
            'by_reason': df_negative.groupby(reason_column)['cost_usd'].sum().to_dict()
        }


class ActionRecommender:
    """Recomenda a√ß√µes."""
    
    ACTION_MAP = {
        ('negative', 'Lost Luggage'): "üî¥ URGENTE: Rastrear bagagem, contatar cliente em 30 min",
        ('negative', 'Late Flight'): "üü† MODERADO: Oferecer voucher de hotel/refei√ß√£o",
        ('negative', 'Cancelled Flight'): "üî¥ URGENTE: Reacomodar em voo pr√≥ximo + compensa√ß√£o",
        ('negative', 'Customer Service Issue'): "üü† MODERADO: Escalar para supervisor, investigar falha",
        ('negative', 'Bad Flight'): "üü° BAIXO: Responder gentilmente, oferecer desconto pr√≥xima compra",
        ('neutral', None): "üëç ENGAJAMENTO: Responder positivamente, solicitar feedback",
        ('positive', None): "üíö FIDELIZA√á√ÉO: Like/Share, agradecer publicamente",
    }
    
    @staticmethod
    def recommend(sentiment: str, reason: Optional[str] = None) -> str:
        """Retorna a√ß√£o recomendada."""
        key = (sentiment, reason)
        if key in ActionRecommender.ACTION_MAP:
            return ActionRecommender.ACTION_MAP[key]
        
        if sentiment == 'negative':
            return f"üü† INVESTIGAR: {reason or 'Motivo desconhecido'}"
        return "‚û°Ô∏è SEM A√á√ÉO ESPEC√çFICA"


class AeroSulSystem:
    """Orquestrador principal do sistema."""
    
    def __init__(self, language: str = 'english'):
        self.language = language
        self.text_cleaner = TextCleaner()
        self.sentiment_model = SentimentModel(language=language)
        self.reason_model = ReasonModel(language=language)
        self.crisis_detector = CrisisDetector()
        self.financial_analyzer = FinancialAnalyzer()
        self.action_recommender = ActionRecommender()
        self.state = {
            'models_trained': False,
            'crisis_detector_calibrated': False,
            'last_execution': None
        }
    
    def train_from_data(self, df: pd.DataFrame, test_size: float = 0.2):
        """Treina os modelos a partir de um DataFrame."""
        print("\n" + "="*70)
        print("TREINANDO MODELOS")
        print("="*70)
        
        # Limpeza
        print(f"\n[Etapa 1] Limpando textos...")
        cleaner_func = self.text_cleaner.clean_english if self.language == 'english' else self.text_cleaner.clean_portuguese
        df['clean_text'] = df['text'].apply(cleaner_func)
        print(f"‚úì Textos normalizados")
        
        # Modelo de Sentimento
        print(f"\n[Etapa 2] Treinando Modelo de Sentimentos")
        df_sent = df[df['airline_sentiment'].isin(['negative', 'neutral', 'positive'])].copy()
        X_train_s, X_val_s, y_train_s, y_val_s = train_test_split(
            df_sent['clean_text'], df_sent['airline_sentiment'], 
            test_size=test_size, random_state=42
        )
        self.sentiment_model.train(X_train_s, y_train_s, X_val_s, y_val_s)
        print(f"‚úì Modelo de Sentimentos Treinado")
        
        # Modelo de Motivos
        print(f"\n[Etapa 3] Treinando Modelo de Motivos (Causas)")
        df_reason = df[(df['airline_sentiment'] == 'negative') & (df['negativereason'].notna())].copy()
        if len(df_reason) > 0:
            X_train_r, X_val_r, y_train_r, y_val_r = train_test_split(
                df_reason['clean_text'], df_reason['negativereason'],
                test_size=test_size, random_state=42
            )
            self.reason_model.train(X_train_r, y_train_r, X_val_r, y_val_r)
            print(f"‚úì Modelo de Motivos Treinado")
        else:
            print(f"‚ö† Sem dados negativos com motivos classificados")
        
        # Calibra detector de crise
        print(f"\n[Etapa 4] Calibrando Detector de Crises")
        if 'date' in df.columns or 'tweet_created' in df.columns:
            date_col = 'tweet_created' if 'tweet_created' in df.columns else 'date'
            df['date'] = pd.to_datetime(df[date_col])
            daily_negatives = df[df['airline_sentiment'] == 'negative'].groupby(df['date'].dt.date).size()
            self.crisis_detector.fit(daily_negatives)
        else:
            print(f"‚ö† Sem coluna de data para calibra√ß√£o de crises")
        
        self.state['models_trained'] = True
        self.state['crisis_detector_calibrated'] = True
        
        print("\n" + "="*70)
        print("‚úì TREINAMENTO CONCLU√çDO COM SUCESSO")
        print("="*70)
    
    def analyze_data(self, df: pd.DataFrame, text_column: str = 'text', language: str = None) -> pd.DataFrame:
        """Analisa um DataFrame com textos."""
        if not self.state['models_trained']:
            raise ValueError("Modelos n√£o foram treinados.")
        
        lang = language or self.language
        cleaner_func = self.text_cleaner.clean_english if lang == 'english' else self.text_cleaner.clean_portuguese
        df['clean_text'] = df[text_column].apply(cleaner_func)
        
        # Predi√ß√µes
        df['IA_Sentimento'] = self.sentiment_model.predict(df['clean_text'])
        
        # Motivos apenas para negativos
        df['IA_Motivo'] = 'N/A'
        mask_neg = df['IA_Sentimento'] == 'negative'
        if mask_neg.sum() > 0 and self.reason_model.is_trained:
            df.loc[mask_neg, 'IA_Motivo'] = self.reason_model.predict(df.loc[mask_neg, 'clean_text'])
        
        # Recomenda√ß√µes
        df['Acao_Recomendada'] = df.apply(
            lambda row: self.action_recommender.recommend(row['IA_Sentimento'], row['IA_Motivo']),
            axis=1
        )
        
        return df
    
    def detect_crisis(self, df: pd.DataFrame, date_column: str = 'tweet_created') -> Dict:
        """Detecta crises no per√≠odo."""
        if not self.state['crisis_detector_calibrated']:
            return {'is_crisis': False, 'message': 'Detector n√£o calibrado'}
        
        if date_column not in df.columns:
            return {'is_crisis': False, 'message': f'Coluna {date_column} n√£o encontrada'}
        
        df['date'] = pd.to_datetime(df[date_column]).dt.date
        daily_negatives = df[df['IA_Sentimento'] == 'negative'].groupby('date').size()
        
        return self.crisis_detector.detect(daily_negatives)
    
    def get_financial_impact(self, df: pd.DataFrame) -> Dict:
        """Retorna an√°lise financeira."""
        return self.financial_analyzer.calculate_impact(df)


print("‚úÖ Classes do sistema carregadas com sucesso!")

## üéØ Passo 3: Fun√ß√µes Utilit√°rias

In [None]:
from google.colab import files
import os

def criar_dados_treino_simulados(n_samples: int = 500) -> pd.DataFrame:
    """Cria dados simulados para treinamento."""
    np.random.seed(42)
    
    sentimentos = ['negative', 'positive', 'neutral']
    motivos = [
        'Lost Luggage', 'Late Flight', 'Cancelled Flight',
        'Customer Service Issue', 'Bad Flight'
    ]
    
    textos_negat = [
        "lost my luggage in miami",
        "flight delayed 4 hours very upset",
        "cancelled my flight with no explanation",
        "worst customer service ever",
        "flight was terrible very uncomfortable",
        "baggage was damaged",
        "long lines at check in",
        "booking problems with website",
        "flight attendant was rude",
        "terrible food on flight",
    ]
    
    textos_posit = [
        "amazing flight experience will fly again",
        "great service and friendly crew",
        "excellent cabin crew very professional",
        "love flying with this airline",
        "best flight ever so comfortable",
        "fantastic experience incredible crew",
        "wonderful service thank you",
        "beautiful aircraft very clean",
    ]
    
    textos_neut = [
        "flight was on time",
        "normal experience nothing special",
        "average service",
        "flight departed on schedule",
        "check in was quick",
        "boarding process smooth",
    ]
    
    data = []
    for i in range(n_samples):
        sentimento = np.random.choice(sentimentos, p=[0.45, 0.35, 0.20])
        
        if sentimento == 'negative':
            texto = np.random.choice(textos_negat)
            motivo = np.random.choice(motivos)
        elif sentimento == 'positive':
            texto = np.random.choice(textos_posit)
            motivo = np.nan
        else:
            texto = np.random.choice(textos_neut)
            motivo = np.nan
        
        data.append({
            'text': texto,
            'airline_sentiment': sentimento,
            'negativereason': motivo if sentimento == 'negative' else np.nan,
            'negativereason_gold': motivo if sentimento == 'negative' else np.nan,
        })
    
    return pd.DataFrame(data)


def upload_arquivo(pasta_destino='./dados'):
    """
    Permite upload de arquivo.
    Retorna (arquivo_path, True) se arquivo foi feito upload
    Retorna (None, False) se usu√°rio cancelou
    """
    os.makedirs(pasta_destino, exist_ok=True)
    
    print("\n" + "="*70)
    print("üìÇ UPLOAD DE ARQUIVO")
    print("="*70)
    print("\nVoc√™ pode fazer upload de um arquivo para an√°lise")
    print("Formatos aceitos: .xlsx, .xls, .csv")
    print("\nOu deixe em branco para usar dados de demonstra√ß√£o")
    
    try:
        print("\nüëá Clique em 'Selecionar arquivo' para fazer upload:")
        uploaded = files.upload()
        
        if len(uploaded) == 0:
            print("\n‚ö†Ô∏è  Nenhum arquivo foi selecionado")
            return None, False
        
        # Pegar primeiro arquivo
        nome_arquivo = list(uploaded.keys())[0]
        caminho_arquivo = os.path.join(pasta_destino, nome_arquivo)
        
        # Salvar arquivo
        with open(caminho_arquivo, 'wb') as f:
            f.write(uploaded[nome_arquivo])
        
        print(f"\n‚úÖ Arquivo '{nome_arquivo}' salvo com sucesso!")
        return caminho_arquivo, True
    
    except Exception as e:
        print(f"\n‚ùå Erro ao fazer upload: {e}")
        return None, False


print("‚úÖ Fun√ß√µes utilit√°rias carregadas!")

## üöÄ Passo 4: EXECU√á√ÉO PRINCIPAL

### Escolha uma op√ß√£o:
- **Op√ß√£o 1:** Usar dados de demonstra√ß√£o (r√°pido, ~2 min)
- **Op√ß√£o 2:** Fazer upload de arquivo pr√≥prio (Excel/CSV)

Execute a c√©lula abaixo:

In [None]:
# ============================================================================
# SELECIONAR MODO DE EXECU√á√ÉO
# ============================================================================

print("\n" + "="*70)
print("üöÄ SISTEMA INTELIGENTE AEROSUL - Google Colab")
print("="*70)

# Tentar fazer upload de arquivo
arquivo_uploaded, arquivo_feito = upload_arquivo()

# Decidir qual dataset usar
if arquivo_feito and arquivo_uploaded:
    print(f"\n‚úÖ Usando arquivo do upload: {arquivo_uploaded}")
    try:
        # Detectar formato
        if arquivo_uploaded.endswith('.xlsx') or arquivo_uploaded.endswith('.xls'):
            df_treino = pd.read_excel(arquivo_uploaded)
        else:
            df_treino = pd.read_csv(arquivo_uploaded)
        
        print(f"‚úì {len(df_treino)} registros carregados")
        print(f"Colunas: {list(df_treino.columns)}")
        idioma_deteccao = 'portuguese' if any('√£' in str(col).lower() for col in df_treino.columns) else 'english'
    except Exception as e:
        print(f"‚ùå Erro ao carregar arquivo: {e}")
        print(f"\n‚ö†Ô∏è  Usando dados de demonstra√ß√£o em vez disso...")
        df_treino = criar_dados_treino_simulados(300)
        idioma_deteccao = 'english'
else:
    print(f"\n‚ö†Ô∏è  Usando dados de demonstra√ß√£o (simulados)")
    df_treino = criar_dados_treino_simulados(300)
    idioma_deteccao = 'english'

print(f"\nIdioma detectado: {idioma_deteccao}")

# Criar e treinar sistema
system = AeroSulSystem(language=idioma_deteccao)
system.train_from_data(df_treino)

## üìä Passo 5: Teste de Sentimentos

In [None]:
# ============================================================================
# TESTE 1: Predi√ß√£o de Sentimentos
# ============================================================================

print("\n" + "="*70)
print("TESTE 1: PREDI√á√ÉO DE SENTIMENTOS")
print("="*70)

textos_teste = [
    "Flight was amazing great service",
    "Terrible experience lost my luggage",
    "Normal flight nothing special",
    "Best airline ever very happy",
    "Worst flight of my life delayed 5 hours",
]

print("\nüìù Textos de teste:")
predictions = system.sentiment_model.predict(textos_teste)

for texto, pred in zip(textos_teste, predictions):
    emoji = "üò¢" if pred == 'negative' else "üòä" if pred == 'positive' else "üòê"
    print(f"\n{emoji} Texto: {texto[:50]}...")
    print(f"   Sentimento: {pred.upper()}")

print("\n‚úÖ Teste de Sentimentos Conclu√≠do!")

## üìà Passo 6: An√°lise Completa

In [None]:
# ============================================================================
# TESTE 2: An√°lise Completa
# ============================================================================

print("\n" + "="*70)
print("TESTE 2: AN√ÅLISE COMPLETA")
print("="*70)

# Criar dados de teste
df_teste = pd.DataFrame({
    'text': [
        'lost my luggage terrible',
        'amazing experience love it',
        'flight delayed nothing special',
        'worst customer service ever',
        'great airline will book again',
    ],
    'date': pd.date_range('2024-01-01', periods=5, freq='D')
})

print("\n[1] Analisando 5 registros...")
df_resultado = system.analyze_data(df_teste.copy(), text_column='text')
print("‚úì An√°lise conclu√≠da")

# Exibir resultados
print("\n[2] Resultados da an√°lise:")
print("\n" + "-"*90)
for idx, row in df_resultado.iterrows():
    print(f"Texto: {row['text'][:30]}")
    print(f"  Sentimento: {row['IA_Sentimento']:10s} | A√ß√£o: {row['Acao_Recomendada'][:45]}")
    print()

# Distribui√ß√£o
print("\n[3] Distribui√ß√£o de Sentimentos:")
for sent, count in df_resultado['IA_Sentimento'].value_counts().items():
    barra = "‚ñà" * count
    print(f"  {sent:10s}: {barra} ({count})")

print("\n‚úÖ An√°lise Completa Conclu√≠da!")

## üí∞ Passo 7: An√°lise Financeira

In [None]:
# ============================================================================
# TESTE 3: Impacto Financeiro
# ============================================================================

print("\n" + "="*70)
print("TESTE 3: IMPACTO FINANCEIRO")
print("="*70)

# Criar dados com motivos
df_financeiro = pd.DataFrame({
    'text': ['sample'] * 20,
    'IA_Sentimento': ['negative'] * 20,
    'IA_Motivo': [
        'Lost Luggage', 'Late Flight', 'Cancelled Flight',
        'Customer Service Issue', 'Bad Flight'
    ] * 4
})

print("\n[1] Calculando impacto de 20 incidentes...")
impact = system.get_financial_impact(df_financeiro)

print("\n[2] Resultado Financeiro:")
print(f"  Total de Incidentes: {impact['total_incidents']}")
print(f"  Impacto Total (USD): US$ {impact['total_usd']:,.2f}")
print(f"  Impacto Total (BRL): R$ {impact['total_brl']:,.2f}")

print("\n[3] An√°lise por Motivo:")
for motivo, custo in sorted(impact['by_reason'].items(), key=lambda x: x[1], reverse=True):
    print(f"  {motivo:30s}: ${custo:>8,.0f}")

print("\n‚úÖ An√°lise Financeira Conclu√≠da!")

## üìä Passo 8: Visualiza√ß√µes (Gr√°ficos)

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# Configura√ß√£o visual
sns.set_style("whitegrid")
plt.rcParams['figure.figsize'] = (14, 10)

print("\n" + "="*70)
print("VISUALIZA√á√ïES")
print("="*70)

# Criar figura com subplots
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# 1. Distribui√ß√£o de Sentimentos (Pizza)
sentimentos_conta = df_resultado['IA_Sentimento'].value_counts()
cores = {'negative': '#ff6b6b', 'positive': '#51cf66', 'neutral': '#4ecdc4'}
cores_list = [cores.get(s, '#999') for s in sentimentos_conta.index]

axes[0, 0].pie(sentimentos_conta.values, labels=sentimentos_conta.index, autopct='%1.1f%%',
               colors=cores_list, startangle=90)
axes[0, 0].set_title('Distribui√ß√£o de Sentimentos', fontsize=12, fontweight='bold')

# 2. Distribui√ß√£o de Motivos (Barras)
if df_resultado['IA_Motivo'].notna().sum() > 0:
    motivos_conta = df_resultado[df_resultado['IA_Motivo'] != 'N/A']['IA_Motivo'].value_counts().head(5)
    axes[0, 1].barh(motivos_conta.index, motivos_conta.values, color='#ff6b6b')
    axes[0, 1].set_title('Top 5 Motivos de Reclama√ß√£o', fontsize=12, fontweight='bold')
    axes[0, 1].set_xlabel('Frequ√™ncia')

# 3. Impacto Financeiro
impact_motivos = sorted(impact['by_reason'].items(), key=lambda x: x[1], reverse=True)[:5]
if impact_motivos:
    motivos_fin = [m[0] for m in impact_motivos]
    valores_fin = [m[1] for m in impact_motivos]
    axes[1, 0].bar(range(len(motivos_fin)), valores_fin, color='#ffd93d')
    axes[1, 0].set_xticks(range(len(motivos_fin)))
    axes[1, 0].set_xticklabels(motivos_fin, rotation=45, ha='right')
    axes[1, 0].set_title('Top 5 Impacto Financeiro (USD)', fontsize=12, fontweight='bold')
    axes[1, 0].set_ylabel('Custo (USD)')
    axes[1, 0].yaxis.set_major_formatter(plt.FuncFormatter(lambda x, p: f'${x/1000:.0f}k'))

# 4. Resumo Geral (Texto)
axes[1, 1].axis('off')
resumo_text = f"""
üìä RESUMO GERAL

Total Analisado: {len(df_resultado)} registros

Sentimentos:
  ‚Ä¢ Negativos: {len(df_resultado[df_resultado['IA_Sentimento'] == 'negative'])} ({len(df_resultado[df_resultado['IA_Sentimento'] == 'negative'])/len(df_resultado)*100:.1f}%)
  ‚Ä¢ Positivos: {len(df_resultado[df_resultado['IA_Sentimento'] == 'positive'])} ({len(df_resultado[df_resultado['IA_Sentimento'] == 'positive'])/len(df_resultado)*100:.1f}%)
  ‚Ä¢ Neutros: {len(df_resultado[df_resultado['IA_Sentimento'] == 'neutral'])} ({len(df_resultado[df_resultado['IA_Sentimento'] == 'neutral'])/len(df_resultado)*100:.1f}%)

üí∞ Impacto Financeiro:
  ‚Ä¢ Total (USD): US$ {impact['total_usd']:,.2f}
  ‚Ä¢ Total (BRL): R$ {impact['total_brl']:,.2f}
  ‚Ä¢ Incidentes: {impact['total_incidents']}
"""

axes[1, 1].text(0.1, 0.5, resumo_text, fontsize=11, verticalalignment='center',
                fontfamily='monospace', bbox=dict(boxstyle='round', facecolor='wheat', alpha=0.3))

plt.tight_layout()
plt.show()

print("\n‚úÖ Visualiza√ß√µes geradas com sucesso!")

## ‚ö†Ô∏è Passo 9: Detec√ß√£o de Crises (Opcional)

In [None]:
# ============================================================================
# TESTE 4: Detec√ß√£o de Crises
# ============================================================================

print("\n" + "="*70)
print("TESTE 4: DETEC√á√ÉO DE CRISES")
print("="*70)

# Criar dados temporais com pico de crise
dates = pd.date_range('2024-01-01', periods=30, freq='D')
base_negatives = np.random.randint(5, 15, 30)
base_negatives[10:12] = 50  # Pico de crise

# Criar dados
textos = []
sentimentos = []
datas_list = []

for date, count in zip(dates, base_negatives):
    for _ in range(count):
        sentimentos.append('negative')
        datas_list.append(date)
    for _ in range(20 - count):
        sentimentos.append('positive')
        datas_list.append(date)
    textos.extend(['sample'] * 20)

df_temp = pd.DataFrame({
    'text': textos,
    'tweet_created': datas_list,
    'IA_Sentimento': sentimentos
})

print(f"\n[1] Analisando dados temporais (30 dias)...")
print(f"    Total de textos: {len(df_temp)}")

# Detectar crise
print(f"\n[2] Detectando crises...")
crisis = system.detect_crisis(df_temp, date_column='tweet_created')

print(f"\n[3] Resultado:")
if crisis.get('is_crisis'):
    print(f"    ‚ö†Ô∏è  CRISE DETECTADA!")
    print(f"    Data cr√≠tica: {crisis['max_date']}")
    print(f"    Reclama√ß√µes no pico: {crisis['max_count']}")
    print(f"    Limiar normal: {crisis['normal_mean']:.1f} reclama√ß√µes/dia")
    print(f"    Limiar de crise: {crisis['threshold']:.1f} reclama√ß√µes/dia")
    print(f"    Fator de severidade: {crisis['severity_factor']:.2f}x acima do normal")
else:
    print(f"    ‚úì Nenhuma crise detectada")
    print(f"    Limiar normal: {crisis.get('normal_mean', 'N/A')}")

print("\n‚úÖ An√°lise de Crise Conclu√≠da!")

## üì• Passo 10: Download de Resultados

In [None]:
# ============================================================================
# SALVAR RESULTADOS
# ============================================================================

print("\n" + "="*70)
print("üì• SALVANDO RESULTADOS")
print("="*70)

# Salvar resultado an√°lise
arquivo_resultado = '/content/resultado_analise.xlsx'
df_resultado.to_excel(arquivo_resultado, index=False)
print(f"\n‚úì Resultado da an√°lise: {arquivo_resultado}")

# Criar resumo JSON
resumo = {
    'timestamp': datetime.now().isoformat(),
    'total_analisados': len(df_resultado),
    'sentimentos': df_resultado['IA_Sentimento'].value_counts().to_dict(),
    'motivos': df_resultado['IA_Motivo'].value_counts().to_dict(),
    'impacto_financeiro': {
        'total_usd': float(impact['total_usd']),
        'total_brl': float(impact['total_brl']),
        'incidentes': impact['total_incidents']
    }
}

import json
arquivo_resumo = '/content/resumo.json'
with open(arquivo_resumo, 'w') as f:
    json.dump(resumo, f, indent=2)
print(f"‚úì Resumo dos resultados: {arquivo_resumo}")

print("\n" + "="*70)
print("üéâ SISTEMA EXECUTADO COM SUCESSO!")
print("="*70)

print("\nüìä Estat√≠sticas Finais:")
print(f"\n  Total de registros analisados: {len(df_resultado)}")
print(f"\n  Distribui√ß√£o de Sentimentos:")
for sent, count in df_resultado['IA_Sentimento'].value_counts().items():
    pct = count/len(df_resultado)*100
    print(f"    ‚Ä¢ {sent:10s}: {count:3d} ({pct:5.1f}%)")

print(f"\n  Impacto Financeiro:")
print(f"    ‚Ä¢ Total (USD): US$ {impact['total_usd']:,.2f}")
print(f"    ‚Ä¢ Total (BRL): R$ {impact['total_brl']:,.2f}")
print(f"    ‚Ä¢ Incidentes: {impact['total_incidents']}")

print(f"\n‚úÖ Arquivos salvos e prontos para download!")
print(f"   Use o menu √† esquerda para baixar os arquivos.")

## üìù Notas e Pr√≥ximos Passos

### ‚úÖ O que foi feito:
1. ‚úì Instalou depend√™ncias Python
2. ‚úì Carregou o sistema inteligente AeroSul
3. ‚úì Treinou modelos de ML
4. ‚úì Testou classifica√ß√£o de sentimentos
5. ‚úì Realizou an√°lise completa
6. ‚úì Calculou impacto financeiro
7. ‚úì Gerou visualiza√ß√µes
8. ‚úì Detectou crises (opcional)
9. ‚úì Salvou resultados

### üìä Dados Dispon√≠veis:
- **resultado_analise.xlsx** - Resultado detalhado da an√°lise
- **resumo.json** - Resumo em formato JSON

### üîÑ Pr√≥ximos Passos:
1. **Fazer upload de seu arquivo real** - Volte ao Passo 4 e fa√ßa upload de seu arquivo
2. **Analisar seus dados** - O sistema analisar√° seus dados pr√≥prios
3. **Exportar resultados** - Baixe os arquivos gerados
4. **Integrar em produ√ß√£o** - Use os c√≥digo nos ambientes de produ√ß√£o

### üìö Documenta√ß√£o Completa:
- Veja os arquivos .md no reposit√≥rio original para mais informa√ß√µes
- README.md - Documenta√ß√£o t√©cnica
- QUICKSTART.md - Guia r√°pido
- AMBIENTES_EXECUCAO.md - Onde rodar o sistema

### üí° Dicas:
- Para usar seu pr√≥prio arquivo, volte ao Passo 4 e fa√ßa upload
- O sistema detecta automaticamente se √© Excel ou CSV
- Maior dataset = melhor acur√°cia (m√≠nimo 500 registros recomendado)
- Execute **Runtime** ‚Üí **Run all** para re-executar tudo

---

**Status:** ‚úÖ Sistema Inteligente AeroSul pronto para uso!

**Vers√£o:** 1.0.0

**Data:** Dezembro 2024