In [None]:
import pandas as pd

# Carregar os dataframes originais
# Certifique-se de que os arquivos CSV estão no mesmo diretório do script
# ou forneça o caminho completo para eles.
try:
    df_minamin_orig = pd.read_excel("minamin-02062025-clean.xlsx")
    df_espelho_orig = pd.read_excel("Espelho_clean.xlsx")
    print("Arquivos originais carregados com sucesso!")
except FileNotFoundError as e:
    print(f"ERRO CRÍTICO: Arquivo não encontrado - {e.filename}")
    print("Por favor, verifique o nome e o local dos arquivos CSV de entrada.")
    df_minamin_orig = None # Garante que não prossiga se houver erro
    df_espelho_orig = None

# Prosseguir somente se ambos os dataframes foram carregados
if df_minamin_orig is not None and df_espelho_orig is not None:

    # --- 1. Expandir df_minamin para segundos ---
    print("Expandindo df_minamin para segundos...")
    df_minamin = df_minamin_orig.copy() # Trabalhar com uma cópia
    df_minamin['HORA_base'] = pd.to_datetime(df_minamin['HORA'], format='%H:%M:%S', errors='coerce')
    df_minamin.dropna(subset=['HORA_base'], inplace=True)

    minamin_segundos_list = []
    for _, row in df_minamin.iterrows():
        minuto_base = row['HORA_base']
        # Criar 60 segundos para este minuto
        for segundo_offset in range(60):
            new_row_data = row.to_dict()
            # Adiciona a data base '1900-01-01' para consistência no datetime
            new_row_data['datetime_segundo_audiencia'] = pd.to_datetime('1900-01-01 ' + (minuto_base + pd.Timedelta(seconds=segundo_offset)).strftime('%H:%M:%S'))
            minamin_segundos_list.append(new_row_data)

    df_minamin_segundos = pd.DataFrame(minamin_segundos_list)
    df_minamin_segundos.drop(columns=['HORA_base'], inplace=True, errors='ignore')
    df_minamin_segundos.sort_values('datetime_segundo_audiencia', inplace=True)
    print(f"df_minamin expandido para {len(df_minamin_segundos)} linhas (segundos).")

    # --- 2. Expandir df_espelho para segundos ---
    print("\nExpandindo df_espelho para segundos...")
    df_espelho = df_espelho_orig.copy() # Trabalhar com uma cópia
    df_espelho.rename(columns={'Início (Lauda)': 'inicio_lauda', 'Fim (Lauda)': 'fim_lauda'}, inplace=True)

    # Converte para time e depois adiciona a data base '1900-01-01'
    df_espelho['inicio_lauda_dt_time'] = pd.to_datetime(df_espelho['inicio_lauda'], format='%H:%M:%S', errors='coerce').dt.time
    df_espelho['fim_lauda_dt_time'] = pd.to_datetime(df_espelho['fim_lauda'], format='%H:%M:%S', errors='coerce').dt.time

    df_espelho.dropna(subset=['inicio_lauda_dt_time', 'fim_lauda_dt_time'], inplace=True)

    df_espelho['datetime_inicio_espelho_seg'] = pd.to_datetime('1900-01-01 ' + df_espelho['inicio_lauda_dt_time'].astype(str))
    df_espelho['datetime_fim_espelho_seg'] = pd.to_datetime('1900-01-01 ' + df_espelho['fim_lauda_dt_time'].astype(str))

    # Garantir que fim >= inicio
    df_espelho = df_espelho[df_espelho['datetime_fim_espelho_seg'] >= df_espelho['datetime_inicio_espelho_seg']]

    espelho_segundos_list = []
    for _, row in df_espelho.iterrows():
        segundos_no_intervalo = pd.date_range(row['datetime_inicio_espelho_seg'], row['datetime_fim_espelho_seg'], freq='S')
        
        for segundo_ts in segundos_no_intervalo:
            new_row_data = row.to_dict()
            new_row_data['datetime_segundo_espelho'] = segundo_ts
            espelho_segundos_list.append(new_row_data)

    if espelho_segundos_list:
        df_espelho_segundos = pd.DataFrame(espelho_segundos_list)
        df_espelho_segundos.drop(columns=['inicio_lauda_dt_time', 'fim_lauda_dt_time', 
                                          'datetime_inicio_espelho_seg', 'datetime_fim_espelho_seg'], 
                                 inplace=True, errors='ignore')
        df_espelho_segundos.sort_values('datetime_segundo_espelho', inplace=True)
        df_espelho_segundos.drop_duplicates(subset=['datetime_segundo_espelho'], keep='first', inplace=True)
        print(f"df_espelho expandido para {len(df_espelho_segundos)} linhas (segundos).")
    else:
        print("Não foi possível expandir df_espelho. Verifique os dados de início/fim.")
        df_espelho_segundos = pd.DataFrame(columns=['datetime_segundo_espelho', 'Bloco', 'Tipo', 'Retranca', 'Ordem', 'inicio_lauda', 'fim_lauda'])


    # --- 3. Merge em Nível de Segundo ---
    print("\nRealizando merge em nível de segundo...")
    df_merged_segundos = pd.merge(
        df_minamin_segundos,
        df_espelho_segundos,
        left_on='datetime_segundo_audiencia',
        right_on='datetime_segundo_espelho',
        how='left'
    )
    df_merged_segundos.drop(columns=['datetime_segundo_espelho'], inplace=True, errors='ignore')
    print(f"Merge finalizado. Total de {len(df_merged_segundos)} linhas.")

    # --- 4. Salvar ---
    output_path_segundos = "audiencia_espelho_merged_segundos.csv"
    df_merged_segundos.to_csv(output_path_segundos, index=False, encoding='utf-8-sig')
    print(f"\nArquivo mergeado em segundos salvo em: {output_path_segundos}")

    print("\nInformações do df_merged_segundos:")
    df_merged_segundos.info(verbose=False) # verbose=False para um resumo mais curto
else:
    print("\nUm ou ambos os DataFrames de entrada não foram carregados. O script não pode continuar.")

In [14]:
import pandas as pd
import plotly.express as px
# import plotly.graph_objects as go # Não é estritamente necessário para este script específico

# Carregar o dataframe detalhado
file_path = "audiencia_espelho_merged_segundos.csv"
df = None

try:
    df = pd.read_csv(file_path)
    print(f"Arquivo {file_path} carregado com sucesso!")
except FileNotFoundError:
    print(f"ERRO CRÍTICO: Arquivo {file_path} não encontrado.")
    print("Por favor, verifique o nome e o local do arquivo.")

# Prosseguir somente se o dataframe foi carregado com sucesso
if df is not None:
    df['datetime_segundo_audiencia'] = pd.to_datetime(df['datetime_segundo_audiencia'])
    df = df.sort_values('datetime_segundo_audiencia')

    cols_for_hover = ['Bloco', 'Tipo', 'Retranca', 'inicio_lauda', 'fim_lauda']
    for col in cols_for_hover:
        if col in df.columns:
            df[col] = df[col].fillna("Não disponível")
        else:
            df[col] = "Não disponível"

    print("Preparando o gráfico interativo com Plotly...")

    fig = px.line(
        df,
        x='datetime_segundo_audiencia',
        y='GLOBO',
        labels={'datetime_segundo_audiencia': 'Horário', 'GLOBO': 'Audiência BDES'}, # Títulos dos eixos definidos aqui
        hover_data=['Bloco', 'Tipo', 'Retranca', 'inicio_lauda', 'fim_lauda']
    )

    # Atualização principal para título do gráfico e modo de hover
    fig.update_layout(
        title={
            'text': "<b>Audiência BDES com Detalhes do Espelho</b>",
            'y':0.95,
            'x':0.5,
            'xanchor': 'center',
            'yanchor': 'top',
            'font': {'size': 18}
        },
        hovermode='x unified'
    )

    # Atualização para estilizar fontes e forçar o eixo Y a começar em zero
    fig.update_layout(
        xaxis=dict(
            title_font=dict(size=14),
            tickfont=dict(size=12)
        ),
        yaxis=dict(
            title_font=dict(size=14),
            tickfont=dict(size=12),
            rangemode='tozero'  # <-- ✨ MÁGICA ACONTECENDO AQUI!
        )
    )

    output_html_path = "audiencia_globo_detalhada_plot.html"
    fig.write_html(output_html_path)

    print(f"\nGráfico interativo salvo como: {output_html_path}")
    print("Abra este arquivo HTML em um navegador para interagir com o gráfico.")
    # fig.show()
else:
    print("\nO DataFrame não foi carregado. A visualização não pode ser gerada.")

Arquivo audiencia_espelho_merged_segundos.csv carregado com sucesso!
Preparando o gráfico interativo com Plotly...

Gráfico interativo salvo como: audiencia_globo_detalhada_plot.html
Abra este arquivo HTML em um navegador para interagir com o gráfico.


In [7]:
import pandas as pd
import plotly.express as px

# 1. Carregar o dataframe detalhado
# Certifique-se de que este arquivo está no mesmo diretório do seu notebook,
# ou forneça o caminho completo para ele.
file_path = "audiencia_espelho_merged_segundos.csv"
df = None # Inicializa df como None para checagem posterior

try:
    df = pd.read_csv(file_path)
    print(f"Arquivo '{file_path}' carregado com sucesso!")
except FileNotFoundError:
    print(f"ERRO CRÍTICO: Arquivo '{file_path}' não encontrado.")
    print("Por favor, verifique o nome e o local do arquivo.")
    # Em um notebook, o fluxo continuará, mas df será None.
    # O código subsequente verificará se df é None.

# Prosseguir somente se o dataframe foi carregado com sucesso
if df is not None:
    # 2. Preparar dados para o ranking
    # Remover linhas onde 'Retranca' é 'Não disponível' ou NaN
    df_rank = df[df['Retranca'].notna() & (df['Retranca'] != "Não disponível")].copy()

    if df_rank.empty:
        print("Não há dados de 'Retranca' definidos para gerar o ranking (após remover 'Não disponível' ou NaNs).")
        print("Verifique a coluna 'Retranca' no arquivo CSV.")
    else:
        # Verificar se a coluna 'GLOBO' existe e é numérica
        if 'GLOBO' not in df_rank.columns:
            print("ERRO: Coluna 'GLOBO' não encontrada no DataFrame.")
        elif not pd.api.types.is_numeric_dtype(df_rank['GLOBO']):
            print("ERRO: Coluna 'GLOBO' não é numérica. Verifique os dados.")
        else:
            print("Calculando audiência média e duração por Retranca...")
            # 3. Agrupar e Calcular Métricas
            ranking_data = df_rank.groupby('Retranca').agg(
                audiencia_media_globo=('GLOBO', 'mean'),
                duracao_segundos=('GLOBO', 'count') # Conta segundos pela contagem de linhas
            ).reset_index()

            # 4. Filtrar por Duração Mínima (Opcional)
            min_duracao_segundos = 30  # Ajuste este valor conforme necessário
            ranking_data_filtrado = ranking_data[ranking_data['duracao_segundos'] >= min_duracao_segundos]
            
            # Se o filtro de duração zerar os dados, mas havia dados antes,
            # considerar usar todos os dados (ignorando o filtro de duração)
            if ranking_data_filtrado.empty and not ranking_data.empty:
                 print(f"Nenhuma retranca encontrada com duração de pelo menos {min_duracao_segundos} segundos.")
                 print("Considerando todas as retrancas que possuem nome para esta visualização (ignorando filtro de duração).")
                 ranking_data_filtrado = ranking_data
            elif ranking_data_filtrado.empty and ranking_data.empty:
                 print("Não há dados de retranca para exibir após filtros iniciais.")
                 # Garante que df_plot_all_retrancas será um DataFrame vazio com as colunas certas
                 ranking_data_filtrado = pd.DataFrame(columns=['Retranca', 'audiencia_media_globo', 'duracao_segundos'])


            if not ranking_data_filtrado.empty:
                # 5. Ordenar para o Gráfico
                # Para barras horizontais com a maior audiência no topo,
                # ordenamos o DataFrame de forma ascendente pela audiência média.
                df_plot_all_retrancas = ranking_data_filtrado.sort_values(by='audiencia_media_globo', ascending=True)
                
                num_retrancas = len(df_plot_all_retrancas)
                print(f"Preparando gráfico de barras para TODAS as {num_retrancas} Retrancas (que atendem à duração mínima de {min_duracao_segundos}s)...")
                
                # Ajustar altura do gráfico dinamicamente para melhor visualização no notebook/HTML
                chart_height = max(600, num_retrancas * 25) # Mínimo 600px, ou 25px por retranca

                # 6. Criar o Gráfico de Barras Horizontais
                fig = px.bar(
                    df_plot_all_retrancas,
                    x='audiencia_media_globo',
                    y='Retranca',
                    orientation='h',
                    title=f'Ranking de TODAS as Retrancas por Audiência Média do BDES',
                    labels={'audiencia_media_globo': 'Audiência Média BDES', 'Retranca': 'Matéria (Retranca)'},
                    hover_data=['duracao_segundos'], # Informação extra no tooltip
                    height=chart_height # Altura dinâmica
                )
                
                # Adicionar valor da audiência média nas barras
                fig.update_traces(texttemplate='%{x:.2f}', textposition='outside')

                # 7. Estilizar o Gráfico
                fig.update_layout(
                    xaxis_title='Audiência Média da BDES',
                    yaxis_title='Matéria (Retranca)',
                    title={
                        'text': f"<b>Ranking de TODAS ({num_retrancas}) as Matérias (Retrancas) por Audiência Média do BDES</b><br>(Duração mínima de {min_duracao_segundos}s consideradas)",
                        'y':0.98, # Ajustar 'y' para o título se o gráfico for muito alto
                        'x':0.5,
                        'xanchor': 'center',
                        'yanchor': 'top',
                        'font': {'size': 16}
                    },
                    # O yaxis já estará ordenado corretamente devido à ordenação do DataFrame
                    margin=dict(l=350, t=100, b=50) # Aumentar margem esquerda para nomes longos, topo para título, e base
                )

                # 8. Salvar em HTML e (opcionalmente) Mostrar no Jupyter
                output_html_path_ranking_all = "ranking_todas_retrancas_audiencia_globo.html"
                fig.write_html(output_html_path_ranking_all)
                print(f"\nGráfico de Ranking (TODAS AS RETRANCAS) salvo como: '{output_html_path_ranking_all}'")
                print("Abra este arquivo HTML em um navegador para interagir com o gráfico.")

                # Para exibir diretamente no Jupyter Notebook, descomente a linha abaixo:
                # fig.show()
            else:
                print("Não há retrancas suficientes (ou nenhuma) após a filtragem de duração para gerar o gráfico.")
else:
    print("\nO DataFrame não foi carregado. A visualização não pode ser gerada.")

Arquivo 'audiencia_espelho_merged_segundos.csv' carregado com sucesso!
Calculando audiência média e duração por Retranca...
Preparando gráfico de barras para TODAS as 36 Retrancas (que atendem à duração mínima de 30s)...

Gráfico de Ranking (TODAS AS RETRANCAS) salvo como: 'ranking_todas_retrancas_audiencia_globo.html'
Abra este arquivo HTML em um navegador para interagir com o gráfico.


In [6]:
import pandas as pd
import plotly.express as px

# 1. Carregar o dataframe detalhado
# Certifique-se de que este arquivo está no mesmo diretório do seu notebook,
# ou forneça o caminho completo para ele.
file_path = "audiencia_espelho_merged_segundos.csv"
df = None # Inicializa df como None para checagem posterior

try:
    df = pd.read_csv(file_path)
    print(f"Arquivo '{file_path}' carregado com sucesso!")
except FileNotFoundError:
    print(f"ERRO CRÍTICO: Arquivo '{file_path}' não encontrado.")
    print("Por favor, verifique o nome e o local do arquivo.")
    # Em um notebook, o fluxo continuará, mas df será None.

# Prosseguir somente se o dataframe foi carregado com sucesso
if df is not None:
    # 2. Pré-processamento inicial
    df['datetime_segundo_audiencia'] = pd.to_datetime(df['datetime_segundo_audiencia'], errors='coerce')
    df = df.sort_values('datetime_segundo_audiencia')

    # 3. Preparar dados focando em retrancas válidas
    df_retrancas_validas = df[df['Retranca'].notna() & (df['Retranca'] != "Não disponível")].copy()

    if df_retrancas_validas.empty:
        print("Não há dados de 'Retranca' definidos para esta análise.")
    elif 'GLOBO' not in df_retrancas_validas.columns or not pd.api.types.is_numeric_dtype(df_retrancas_validas['GLOBO']):
        print("ERRO: Coluna 'GLOBO' não encontrada ou não é numérica.")
    else:
        print("Identificando instâncias de Retrancas e calculando métricas...")
        
        # 4. Identificar instâncias (blocos) de Retrancas
        df_retrancas_validas['Retranca_Shifted'] = df_retrancas_validas['Retranca'].shift(1)
        df_retrancas_validas['novo_bloco_retranca'] = (df_retrancas_validas['Retranca'] != df_retrancas_validas['Retranca_Shifted'])
        # Usar um nome de coluna diferente para o id sequencial para evitar conflitos se 'bloco_id' já existir
        df_retrancas_validas['bloco_id_sequencial'] = df_retrancas_validas['novo_bloco_retranca'].cumsum()

        # 5. Calcular métricas por instância de Retranca
        inicio_blocos_retranca = df_retrancas_validas.groupby('bloco_id_sequencial').agg(
            Retranca=('Retranca', 'first'), # Pega o nome da retranca para este bloco
            horario_inicio_bloco=('datetime_segundo_audiencia', 'min') # Horário de início do bloco
        ).reset_index()

        audiencia_por_bloco = df_retrancas_validas.groupby('bloco_id_sequencial').agg(
            audiencia_media_bloco=('GLOBO', 'mean'),
            duracao_bloco_segundos=('GLOBO', 'count') # Conta segundos pela contagem de linhas
        ).reset_index()

        # Juntar as informações
        df_plot_temporal_barras = pd.merge(inicio_blocos_retranca, audiencia_por_bloco, on='bloco_id_sequencial')
        
        # 6. Filtrar por Duração Mínima da Instância (Opcional)
        min_duracao_bloco_segundos = 30  # Ajuste conforme necessário
        df_plot_temporal_barras = df_plot_temporal_barras[df_plot_temporal_barras['duracao_bloco_segundos'] >= min_duracao_bloco_segundos]
        
        # Ordenar pela ordem de aparição (já garantido pelo bloco_id_sequencial, mas podemos reconfirmar)
        df_plot_temporal_barras = df_plot_temporal_barras.sort_values(by='horario_inicio_bloco')

        # 7. Criar label para o eixo X (para melhor identificação das barras)
        # Assegurar que Retranca é string para concatenar sem erros
        df_plot_temporal_barras['Retranca'] = df_plot_temporal_barras['Retranca'].astype(str)
        df_plot_temporal_barras['label_eixo_x'] = df_plot_temporal_barras['bloco_id_sequencial'].astype(str) + ". " + df_plot_temporal_barras['Retranca']


        if df_plot_temporal_barras.empty:
            print(f"Nenhuma instância de retranca encontrada com duração de pelo menos {min_duracao_bloco_segundos} segundos.")
        else:
            num_instancias = len(df_plot_temporal_barras)
            print(f"Preparando gráfico de BARRAS para {num_instancias} instâncias de Retrancas em ordem de aparição...")

            # Ajustar largura do gráfico dinamicamente
            chart_width = max(800, num_instancias * 35) # Mínimo 800px, ou 35px por barra para dar mais espaço

            # 8. Criar o Gráfico de Barras Verticais
            fig = px.bar(
                df_plot_temporal_barras,
                x='label_eixo_x', # Usar o label combinado para o eixo X
                y='audiencia_media_bloco',
                title='Audiência Média das Matérias (Retrancas) em Ordem de Aparição',
                labels={'label_eixo_x': 'Matéria (Ordem de Aparição no Programa)', 
                        'audiencia_media_bloco': 'Audiência Média da Matéria (GLOBO)'},
                hover_data={ # Customizar hover data
                    'Retranca': True, # Mostrar nome da Retranca (já está no label_eixo_x, mas pode ser útil)
                    'horario_inicio_bloco': True, # Mostrar horário de início
                    'duracao_bloco_segundos': True, # Mostrar duração
                    'label_eixo_x': False # Ocultar o label_eixo_x do tooltip já que está no eixo
                },
                color='Retranca', # Opcional: Colorir por nome da Retranca
                width=chart_width
            )
            
            # Formatar o hovertemplate para melhor visualização
            fig.update_traces(
                hovertemplate="<b>Matéria:</b> %{customdata[0]}<br>" + # customdata[0] será 'Retranca'
                              "<b>Início:</b> %{customdata[1]|%H:%M:%S}<br>" + # customdata[1] será 'horario_inicio_bloco'
                              "<b>Audiência Média:</b> %{y:.2f}<br>" +
                              "<b>Duração:</b> %{customdata[2]}s<extra></extra>"
            )
            # Adicionar o valor da audiência média em cima/fora das barras
            fig.update_traces(texttemplate='%{y:.2f}', textposition='outside')

            # 9. Estilizar o Gráfico
            fig.update_layout(
                xaxis_title='Matéria em Ordem de Aparição no Programa',
                yaxis_title='Audiência Média da Matéria BDES',
                title={
                    'text': f"<b>Audiência Média de {num_instancias} Matérias (Retrancas) em Ordem de Aparição</b><br>(Duração mínima de {min_duracao_bloco_segundos}s por instância)",
                    'y':0.95,
                    'x':0.5,
                    'xanchor': 'center',
                    'yanchor': 'top',
                    'font': {'size': 16}
                },
                xaxis_tickangle=-60, # Rotacionar labels do eixo X para caberem melhor
                showlegend=False # Esconder legenda se 'color' for usado e houver muitas categorias distintas
            )
            
            # Garantir que o eixo X mostre as categorias na ordem do DataFrame (que já está ordenado por aparição)
            fig.update_xaxes(categoryorder='array', categoryarray=df_plot_temporal_barras['label_eixo_x'])

            # 10. Salvar em HTML e (opcionalmente) Mostrar no Jupyter
            output_html_path_temporal_barras = "audiencia_retrancas_ordem_aparicao_barras.html"
            fig.write_html(output_html_path_temporal_barras)

            print(f"\nGráfico de Barras de Audiência de Retrancas em Ordem de Aparição salvo como: '{output_html_path_temporal_barras}'")
            print("Abra este arquivo HTML em um navegador para interagir com o gráfico.")

            # Para exibir diretamente no Jupyter Notebook, descomente a linha abaixo:
            # fig.show()
else:
    print("\nO DataFrame não foi carregado. A visualização não pode ser gerada.")

Arquivo 'audiencia_espelho_merged_segundos.csv' carregado com sucesso!
Identificando instâncias de Retrancas e calculando métricas...
Preparando gráfico de BARRAS para 36 instâncias de Retrancas em ordem de aparição...

Gráfico de Barras de Audiência de Retrancas em Ordem de Aparição salvo como: 'audiencia_retrancas_ordem_aparicao_barras.html'
Abra este arquivo HTML em um navegador para interagir com o gráfico.


In [13]:
import pandas as pd
import plotly.express as px

# 1. Carregar o dataframe detalhado
file_path = "audiencia_espelho_merged_segundos.csv"
df = None

try:
    df = pd.read_csv(file_path)
    print(f"Arquivo '{file_path}' carregado com sucesso!")
except FileNotFoundError:
    print(f"ERRO CRÍTICO: Arquivo '{file_path}' não encontrado.")
    print("Por favor, verifique o nome e o local do arquivo.")

# Prosseguir somente se o dataframe foi carregado com sucesso
if df is not None:
    # 2. Pré-processamento inicial
    df['datetime_segundo_audiencia'] = pd.to_datetime(df['datetime_segundo_audiencia'], errors='coerce')
    df = df.sort_values('datetime_segundo_audiencia')

    # 3. Preparar dados focando em retrancas válidas
    df_retrancas_validas = df[df['Retranca'].notna() & (df['Retranca'] != "Não disponível")].copy()

    if df_retrancas_validas.empty:
        print("Não há dados de 'Retranca' definidos para esta análise.")
    elif 'GLOBO' not in df_retrancas_validas.columns or not pd.api.types.is_numeric_dtype(df_retrancas_validas['GLOBO']):
        print("ERRO: Coluna 'GLOBO' não encontrada ou não é numérica.")
    else:
        print("Identificando instâncias de Retrancas e calculando métricas...")
        
        # ... (cálculos de bloco, mesmos do código original)
        df_retrancas_validas['Retranca_Shifted'] = df_retrancas_validas['Retranca'].shift(1)
        df_retrancas_validas['novo_bloco_retranca'] = (df_retrancas_validas['Retranca'] != df_retrancas_validas['Retranca_Shifted'])
        df_retrancas_validas['bloco_id_sequencial'] = df_retrancas_validas['novo_bloco_retranca'].cumsum()

        inicio_blocos_retranca = df_retrancas_validas.groupby('bloco_id_sequencial').agg(
            Retranca=('Retranca', 'first'),
            horario_inicio_bloco=('datetime_segundo_audiencia', 'min')
        ).reset_index()

        audiencia_por_bloco = df_retrancas_validas.groupby('bloco_id_sequencial').agg(
            audiencia_media_bloco=('GLOBO', 'mean'),
            duracao_bloco_segundos=('GLOBO', 'count')
        ).reset_index()

        df_plot_temporal_barras = pd.merge(inicio_blocos_retranca, audiencia_por_bloco, on='bloco_id_sequencial')
        
        min_duracao_bloco_segundos = 30
        df_plot_temporal_barras = df_plot_temporal_barras[df_plot_temporal_barras['duracao_bloco_segundos'] >= min_duracao_bloco_segundos]
        
        df_plot_temporal_barras = df_plot_temporal_barras.sort_values(by='horario_inicio_bloco')
        
        # <<<<<<<<<< 1. RESTAURANDO O NOME DAS RETRANCAS NO EIXO >>>>>>>>>>
        # Criamos a etiqueta de cada barra com seu nome, como estava antes.
        df_plot_temporal_barras['label_eixo_x'] = df_plot_temporal_barras['bloco_id_sequencial'].astype(str) + ". " + df_plot_temporal_barras['Retranca']

        if df_plot_temporal_barras.empty:
            print(f"Nenhuma instância de retranca encontrada com duração de pelo menos {min_duracao_bloco_segundos} segundos.")
        else:
            num_instancias = len(df_plot_temporal_barras)
            print(f"Preparando gráfico com eixo de matérias e tempo ilustrativo para {num_instancias} instâncias...")

            chart_width = max(800, num_instancias * 40)

            # 8. Criar o Gráfico de Barras com o eixo X mostrando o nome de cada matéria
            fig = px.bar(
                df_plot_temporal_barras,
                x='label_eixo_x', # Usando a etiqueta com o nome da matéria
                y='audiencia_media_bloco',
                title='Audiência das Matérias em Sequência',
                hover_name='label_eixo_x',
                hover_data={
                    'horario_inicio_bloco': '|%H:%M:%S',
                    'audiencia_media_bloco': ':.2f',
                    'duracao_bloco_segundos': True
                },
                color='Retranca'
            )
            
            fig.update_traces(texttemplate='%{y:.2f}', textposition='outside')

            # 9. Estilizar o Gráfico
            fig.update_layout(
                xaxis_title='Matérias em Ordem de Aparição',
                yaxis_title='Audiência Média da Matéria',
                title={
                    'text': f"<b>Audiência de {num_instancias} Matérias em Sequência</b>",
                    'y':0.95, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'
                },
                xaxis_tickangle=-60, # Rotacionar os nomes das matérias para caberem
                showlegend=False,
                # <<<<<<<<<< 2. ABRINDO ESPAÇO PARA AS ANOTAÇÕES >>>>>>>>>>
                margin=dict(b=120) # Aumentar a margem inferior para o texto do tempo caber
            )
            
            # Garantir a ordem correta das matérias no eixo
            fig.update_xaxes(categoryorder='array', categoryarray=df_plot_temporal_barras['label_eixo_x'])

            # <<<<<<<<<< 3. ADICIONANDO O TEMPO ILUSTRATIVO COMO ANOTAÇÕES >>>>>>>>>>
            # Usamos xref='paper' para posicionar em relação à área total do gráfico (0=esquerda, 1=direita)
            # Isso é 100% independente dos dados das barras.

            # Anotação "06:00" na ponta esquerda
            fig.add_annotation(
                text="<b>06:00</b>",
                showarrow=False,
                xref="paper", yref="paper",
                x=0, y=-0.25, # x=0 (extrema esquerda), y negativo (abaixo do eixo)
                xanchor='left', yanchor='bottom',
                font=dict(size=14, color="black")
            )

            # Anotação "08:30" na ponta direita
            fig.add_annotation(
                text="<b>08:30</b>",
                showarrow=False,
                xref="paper", yref="paper",
                x=1, y=-0.25, # x=1 (extrema direita), y negativo (abaixo do eixo)
                xanchor='right', yanchor='bottom',
                font=dict(size=14, color="black")
            )

            # 10. Salvar em HTML
            output_html_path_final = "audiencia_materias_com_tempo_ilustrativo.html"
            fig.write_html(output_html_path_final)

            print(f"\nGráfico final salvo como: '{output_html_path_final}'")
            print("Abra este arquivo HTML em um navegador para interagir com o gráfico.")
            
            # fig.show()
else:
    print("\nO DataFrame não foi carregado. A visualização não pode ser gerada.")

Arquivo 'audiencia_espelho_merged_segundos.csv' carregado com sucesso!
Identificando instâncias de Retrancas e calculando métricas...
Preparando gráfico com eixo de matérias e tempo ilustrativo para 36 instâncias...

Gráfico final salvo como: 'audiencia_materias_com_tempo_ilustrativo.html'
Abra este arquivo HTML em um navegador para interagir com o gráfico.
