In [None]:
# @title #1. Importa as bibliotecas necessárias {display-mode: "form"}

# Importa as bibliotecas necessárias para manipulação de dados e criação de gráficos.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import matplotlib.ticker as mticker
import ipywidgets as widgets
from ipywidgets import interact
from IPython.display import display, clear_output
import os
from datetime import datetime

# Importa o módulo 'drive' do Google Colab, que permite interagir com o Google Drive.
from google.colab import drive

# Carrega a extensão do Colab para uma exibição dos DataFrames e habilita o formatador.
%load_ext google.colab.data_table
from google.colab import data_table
data_table.enable_dataframe_formatter()

# Clona o repositório do projeto Baoba do GitHub e navega até o diretório clonado.
!git clone https://oauth2:Insira_Seu_Token_Aqui@git.ibict.br/data_science/baoba.git
%cd /content/baoba/baoba/relatorios/radar

from dropdown_utils import cria_dropdown_filtrador

In [None]:
# @title #2. Conecta e monta o seu Google Drive {display-mode: "form"}

# Monta o Google Drive no diretório '/content/drive', facilitando o acesso aos arquivos armazenados.
drive.mount('/content/drive')


Mounted at /content/drive


Depois de autorizar, seus arquivos aparecem em
/content/drive/MyDrive/… (seu Drive particular) ou
/content/drive/Shared drives/… (Drives compartilhados).

In [None]:
# @title #3. Cria a estrutura de pastas e definir variáveis de caminho e nomes de arquivo {display-mode: "form"}

#Caminho dos arquivos contendo as bases a serem comparadas
caminho_arquivo = '/content/drive/MyDrive/baoba/abril_2025/quarto_periodo/' #adaptar endereço

# Nome dos arquivo
nome_arquivo_atual = 'base.csv'

#Caminho da pasta para salvar os gráficos
caminho_salvar_grafico = '/content/drive/MyDrive/baoba/abril_2025/quarto_periodo/graficos/' #adaptar endereço e criar a pasta graficos antes de rodar o script

In [None]:
# @title Cria o dataframe {display-mode: "form"}

#Cria os dataframes a partir dos arquivos CSV
df    = pd.read_csv(caminho_arquivo + nome_arquivo_atual)
output_folder = caminho_salvar_grafico

# Importa a classe MetricsProcessor do script auxiliar para análise de dados.
from baoba_processamento_dados_por_monitoramento import ProcessamentoMetricasPorMonitoramento

# Extração dos monitoramentos da coluna 'monitoramento_nome.keyword'
monitoramentos = df['monitoramento_nome.keyword'].unique().tolist()

#Instância passando os argumentos necessários
analisador = ProcessamentoMetricasPorMonitoramento(df, monitoramentos)

# Exibe um resumo do DataFrame, mostrando o número de registros, colunas, tipos de dados e uso de memória.
df.info()

In [None]:
# @title #4. Calcula as interações e ocorrências por serviço e monitoramento {display-mode: "form"}

# Atualizar o nome dos monitoramentos
df['monitoramento_nome.keyword'] = df['monitoramento_nome.keyword'].replace({
    'Igualdade Racial ': 'Igualdade Racial',
    'Acessibilidade e inclusão PCD': 'Acessibilidade e Inclusão PCD',
    'Patrimônio público e probidade administr': 'Patrimônio Público e Probidade Administrativa',
    'Proteção e Inclusão Vulneraveis: ': 'Proteção e Inclusão Vulneráveis',
    'Combate à violência contra a mulher': 'Combate à Violência Contra a Mulher',
    'Desinformação em Políticas Públicas': 'Políticas Públicas'
})

# Calcula Interações para cada serviço utilizando o nome padrão da coluna "servico.keyword"
df_face    = analisador.calcula_interacoes(
    df,
    'Facebook - Posts Públicos',
    ['reactions', 'shares', 'comments'],
    service_col='servico.keyword'  # Pode ser omitido se for "servico.keyword"
)

df_x       = analisador.calcula_interacoes(
    df,
    'X',
    ['favorites', 'replies', 'retweets'],
    service_col='servico.keyword'
)

df_insta   = analisador.calcula_interacoes(
    df,
    'Instagram - Posts Públicos',
    ['likes', 'comments'],
    service_col='servico.keyword'
)

df_youtube = analisador.calcula_interacoes(
    df,
    'YouTube - Vídeos',
    ['likes', 'comments', 'views'],
    service_col='servico.keyword'
)

#Unifica todos os dataframes em um
df_unificado = pd.concat([df_face, df_insta, df_x, df_youtube], ignore_index=True)

df_trabalho = df_unificado.copy()

# ------------------------------------------------------------------
# 1. ===== OCORRÊNCIAS =====
# ------------------------------------------------------------------
df_trabalho['data'] = (
    pd.to_datetime(df_trabalho['data'])
      .dt.strftime('%d-%m-%Y')
)

df_sumario_ocorrencias = (
    df_trabalho
      .groupby(['monitoramento_nome.keyword', 'data'])
      .agg(total_ocorrencias=('monitoramento_nome.keyword', 'count'))
      .reset_index()
)

# ------------------------------------------------------------------
# 2. ===== PICO DE OCORRÊNCIAS =====
# ------------------------------------------------------------------
ocorrencias_stats = (
    df_sumario_ocorrencias
      .groupby('monitoramento_nome.keyword')
      .agg(
          media_ocorrencias=('total_ocorrencias', 'mean'),
          desvio_ocorrencias=('total_ocorrencias', 'std')
      )
      .reset_index()
)

ocorrencias_stats['limite_ocorrencias'] = (
    ocorrencias_stats['media_ocorrencias'] + ocorrencias_stats['desvio_ocorrencias']
)

df_ocorrencias = df_sumario_ocorrencias.merge(
    ocorrencias_stats, on='monitoramento_nome.keyword', how='left'
)

df_ocorrencias['pico'] = np.where(
    df_ocorrencias['total_ocorrencias'] >= df_ocorrencias['limite_ocorrencias'],
    'PICO',
    ''
)

# ------------------------------------------------------------------
# 3. ===== INTERAÇÕES =====
# ------------------------------------------------------------------
df_sumario_interacoes = (
    df_trabalho
      .groupby(['monitoramento_nome.keyword', 'data'])
      .agg(total_interacoes=('interacoes', 'sum'))
      .reset_index()
)

# ------------------------------------------------------------------
# 4. ===== PICO DE INTERAÇÕES =====
# ------------------------------------------------------------------
interacoes_stats = (
    df_sumario_interacoes
      .groupby('monitoramento_nome.keyword')
      .agg(
          media_interacoes=('total_interacoes', 'mean'),
          desvio_interacoes=('total_interacoes', 'std')
      )
      .reset_index()
)

interacoes_stats['limite_interacoes'] = (
    interacoes_stats['media_interacoes'] + interacoes_stats['desvio_interacoes']
)

df_interacoes = df_sumario_interacoes.merge(
    interacoes_stats, on='monitoramento_nome.keyword', how='left'
)

df_interacoes['pico'] = np.where(
    df_interacoes['total_interacoes'] >= df_interacoes['limite_interacoes'],
    'PICO',
    ''
)

In [None]:
# @title Tabela dinâmica de picos de ocorrências {display-mode: "form"}

df_ocorrencias

In [None]:
# @title Tabela dinâmica de picos de interações {display-mode: "form"}

df_interacoes

#5. Cria uma tabela dinâmica com os top n posts com mais interações a partir da escolha do monitoramento por um dropdrown

A tabela exibe um máximo de 20 mil linhas. Você pode selecionar a quantidade de linhas da tabela  na variável quantidade_linhas



```
quantidade_linhas = 1000
```

#✍Preencha a quantidade de linhas desejadas na célula abaixo

In [None]:
#preencha a quantidade máxima de linhas que gostaria de visualizar aqui. Valores entre 1 e 20000
quantidade_linhas = 2

In [None]:
# @title Tabela Dinâmica - selecione o monitoramento no dropdrown{display-mode: "form"}

# Selecionando as colunas de índice 0 a 6, mais 9 e 14 - isso remove as colunas desnecessárias para a análise
colunas_escolhidas = ['data',
 'monitoramento_nome.keyword',
 'servico.keyword',
 'publicador_nome.keyword',
 'titulo',
 'conteudo.keyword',
 'link.keyword',
  'query',
 'interacoes',
]

df_unificado_resumido = df_unificado[colunas_escolhidas]

# Cria rótulos no formato dia-mês para exibição no eixo X
df_unificado_resumido.loc[:, 'data'] = pd.to_datetime(df_unificado_resumido['data']).dt.strftime('%d-%m-%Y')

# Cria o dropdown usando os valores únicos da coluna
options = df_unificado_resumido["monitoramento_nome.keyword"].unique().tolist()
dropdown_monitoramento = widgets.Dropdown(
    options=options,
    description="Monitoramento"
)

dropdown, out = cria_dropdown_filtrador(
    df_unificado_resumido,
    coluna_dropdown="monitoramento_nome.keyword",
    coluna_sort="interacoes",
    linhas=quantidade_linhas,
    descricao="Monitoramento",
    ordenar_dropdown=True
)

display(dropdown, out)

#6. Insira o monitoramento para geração dos gráficos específicos

# **COLOQUE O MONITORAMENTO AQUI**

Copie cole um dos monitoramentos para gerar o gráfico:
'Acessibilidade e Inclusão PCD',
 'Adicção Digital',
 'Combate à Violência Contra a Mulher',
 'Direitos das Crianças e Adolescentes',
 'Escala 6x1',
 'Igualdade Racial',
 'Igualdade de Gênero',
 'Patrimônio Público e Probidade Administrativa',
 'Pix',
 'Políticas Públicas',
 'Proteção e Inclusão Vulneráveis',
 'Trabalhadores em Plataformas Digitais'

 Exemplo:

` monitoramento_valor =  'Igualdade Racial'`

#✍ Insira o monitoramento na próxima célula

In [None]:
#cole aqui o nome do monitoramento entre ""
monitoramento_valor =  'Igualdade Racial'

#Instruções para gerar os gráficos de picos com anotações

Coloque a data no formato DD-MM e a descrição do pico entre aspas. Exemplo:



```
anotacoes = [
    {"date": "DATA AQUI", "text": "TEXTO AQUI", "xytext": (0, 30)},
    {"date": 28-03, "text": "insira o texto", "xytext": (0, 30)},
]
```

#✅Dica: utilizar as tabelas de pico geradas acima na seção 4 para selecionar os picos para os gráficos.



#✍ Insira as anotações para o gráfico de pico de ocorrências na próxima célula

In [None]:
# Dicionário de anotações para os picos de ocorrências
anotacoes_ocorrencias = [
    {"date": "08-04", "text": " Dia da Luta pela \n Eliminação da\n Discriminação Racial", "xytext": (80, 60)},
    {"date": "10-04", "text": "Repercussão do \n jogo BRA x ARG", "xytext": (0, 30)},
]

In [None]:
# @title Gráfico de pico de ocorrências com anotações {display-mode: "form"}
analisador.plota_grafico_ocorrencias_por_monitoramento(
    df,
    monitoramento=monitoramento_valor,
    annotations=anotacoes_ocorrencias,
    date_column='data',
    date_format='%d-%m',
    title='',
    line_color=None,  # Cor personalizada para a linha
    save_path=output_folder + 'grafico_pico_ocorrencias_'+ monitoramento_valor + '.png'
)

#✍ Insira as anotações para o gráfico de pico de interações na próxima célula

In [None]:
# Dicionário de anotações para os picos de interações
anotacoes_interacoes = [
    {"date": "05-04", "text": " Dia da Luta pela \n Eliminação da\n Discriminação Racial", "xytext": (80, 60)},
    {"date": "07-04", "text": "Repercussão do \n jogo BRA x ARG", "xytext": (0, 30)},
]

In [None]:
# @title Gráfico de pico de interações com anotações {display-mode: "form"}
analisador.plota_grafico_interacoes_por_monitoramento(
    df,
    monitoramento=monitoramento_valor,
    annotations=anotacoes_interacoes,
    date_column='data',
    date_format='%d-%m',
    title='',
    line_color=None,  # Cor personalizada para a linha
    save_path=output_folder + 'grafico_pico_interacoes_'+ monitoramento_valor + '.png'
)

In [None]:
# @title Gráfico de serviços {display-mode: "form"}
analisador.plota_grafico_interacoes_por_servico_por_monitoramento(
    df_unificado,
    monitoramento_valor,
    service_column="servico.keyword",
    title="",
    save_path=output_folder + 'grafico_servicos_'+ monitoramento_valor + '.png'
)