# Notebook para análise de oportunidades perdidas

Este notebook realiza uma análise exploratória sobre as oportunidades perdidas registradas no arquivo `oportunidades_perdidas.csv`.

## Importação das Bibliotecas Necessárias

Importe pandas, numpy, matplotlib e seaborn para manipulação e visualização dos dados.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Configurações de visualização
plt.style.use('seaborn-v0_8')
sns.set_palette('pastel')
%matplotlib inline

## Carregamento e Visualização Inicial dos Dados

Carregue o arquivo `oportunidades_perdidas.csv` e exiba as primeiras linhas para inspeção inicial.

In [None]:
# Carregar o arquivo CSV com tratamento de exceções
try:
    df = pd.read_csv('oportunidades_perdidas.csv')
    print('Arquivo carregado com sucesso!')
except FileNotFoundError:
    print('Arquivo oportunidades_perdidas.csv não encontrado.')
    df = pd.DataFrame()
except Exception as e:
    print(f'Erro ao carregar o arquivo: {e}')
    df = pd.DataFrame()

# Exibir as primeiras linhas se o DataFrame não estiver vazio
if not df.empty:
    display(df.head())
else:
    print('DataFrame vazio.')

## Limpeza e Preparação dos Dados

Trate valores ausentes, ajuste tipos de dados e remova duplicatas se necessário.

In [None]:
# Verificar informações gerais e tratar dados apenas se o DataFrame não estiver vazio
if not df.empty:
    print(df.info())
    print(df.isnull().sum())
    # Ajustar tipos de dados se a coluna existir
    if 'timestamp' in df.columns:
        df['timestamp'] = pd.to_datetime(df['timestamp'], errors='coerce')
    # Remover duplicatas
    df = df.drop_duplicates()
    display(df.head())
else:
    print('DataFrame vazio. Não é possível limpar ou preparar os dados.')

## Análise Exploratória: Quantidade de Oportunidades Perdidas por Robô

Agrupe os dados pelo campo `robot_name` e conte o número de oportunidades perdidas por robô.

In [None]:
# Contar oportunidades perdidas por robô, se a coluna existir
if 'robot_name' in df.columns:
    oportunidades_por_robo = df['robot_name'].value_counts().sort_values(ascending=False)
    print(oportunidades_por_robo)
else:
    print('Coluna robot_name não encontrada.')

## Análise Exploratória: Oportunidades Perdidas por Par de Moedas

Agrupe os dados pelo campo `par` e conte as oportunidades perdidas por cada par de moedas.

In [None]:
# Contar oportunidades perdidas por par de moedas, se a coluna existir
if 'par' in df.columns:
    oportunidades_por_par = df['par'].value_counts().sort_values(ascending=False)
    print(oportunidades_por_par)
else:
    print('Coluna par não encontrada.')

## Análise Exploratória: Oportunidades Perdidas por Timeframe

Analise a distribuição das oportunidades perdidas por timeframe.

In [None]:
# Contar oportunidades perdidas por timeframe, se a coluna existir
if 'timeframe' in df.columns:
    oportunidades_por_timeframe = df['timeframe'].value_counts().sort_values(ascending=False)
    print(oportunidades_por_timeframe)
else:
    print('Coluna timeframe não encontrada.')

## Análise Exploratória: Principais Indicadores Contribuintes

Identifique e conte os indicadores mais frequentes na coluna `contributing_indicators`.

In [None]:
# Separar e contar indicadores, se a coluna existir
from collections import Counter
if 'contributing_indicators' in df.columns:
    indicadores = df['contributing_indicators'].dropna().str.split(';').explode()
    contagem_indicadores = Counter(indicadores)
    indicadores_mais_frequentes = pd.Series(contagem_indicadores).sort_values(ascending=False)
    print(indicadores_mais_frequentes)
else:
    print('Coluna contributing_indicators não encontrada.')

## Análise Exploratória: Principais Motivos das Oportunidades Perdidas

Liste e conte os principais motivos presentes na coluna `reason`.

In [None]:
# Contar motivos das oportunidades perdidas, se a coluna existir
if 'reason' in df.columns:
    motivos = df['reason'].value_counts().sort_values(ascending=False)
    print(motivos)
else:
    print('Coluna reason não encontrada.')

## Visualização Gráfica dos Resultados

Crie gráficos de barras e pizza para visualizar as análises realizadas.

In [None]:
# Visualizações gráficas condicionais para evitar erros
if 'robot_name' in df.columns and not df.empty:
    plt.figure(figsize=(10,5))
    sns.barplot(x=oportunidades_por_robo.index, y=oportunidades_por_robo.values)
    plt.title('Oportunidades Perdidas por Robô')
    plt.xlabel('Robô')
    plt.ylabel('Quantidade')
    plt.xticks(rotation=45, ha='right')
    plt.tight_layout()
    plt.show()
if 'par' in df.columns and not df.empty:
    plt.figure(figsize=(8,4))
    sns.barplot(x=oportunidades_por_par.index, y=oportunidades_por_par.values)
    plt.title('Oportunidades Perdidas por Par de Moedas')
    plt.xlabel('Par')
    plt.ylabel('Quantidade')
    plt.xticks(rotation=45, ha='right')
    plt.tight_layout()
    plt.show()
if 'timeframe' in df.columns and not df.empty:
    plt.figure(figsize=(6,4))
    sns.barplot(x=oportunidades_por_timeframe.index, y=oportunidades_por_timeframe.values)
    plt.title('Oportunidades Perdidas por Timeframe')
    plt.xlabel('Timeframe')
    plt.ylabel('Quantidade')
    plt.tight_layout()
    plt.show()
if 'contributing_indicators' in df.columns and not df.empty and 'indicadores_mais_frequentes' in locals():
    plt.figure(figsize=(6,6))
    indicadores_mais_frequentes.head(10).plot.pie(autopct='%1.1f%%')
    plt.title('Top 10 Indicadores Contribuintes')
    plt.ylabel('')
    plt.show()
if 'reason' in df.columns and not df.empty:
    plt.figure(figsize=(8,4))
    sns.barplot(x=motivos.index, y=motivos.values)
    plt.title('Principais Motivos das Oportunidades Perdidas')
    plt.xlabel('Motivo')
    plt.ylabel('Quantidade')
    plt.xticks(rotation=45, ha='right')
    plt.tight_layout()
    plt.show()