In [21]:
import pandas as pd
import numpy as np
from pandas.plotting import table
import matplotlib.pyplot as plt
import seaborn as sns
import calendar
import scipy.stats as stats
from matplotlib.colors import LinearSegmentedColormap
from datetime import datetime

In [22]:
df_geral = pd.read_csv("ride-data/dados_tratados.csv")

In [23]:
df_geral['data_hora'] = pd.to_datetime(df_geral['data_hora'])

df_geral['date'] = df_geral['data_hora'].dt.date

In [24]:
tabela_horarios = pd.read_excel("bcw-operation-calendar.xlsx")
tabela_horarios["date"] = pd.to_datetime(tabela_horarios["date"])

In [25]:
# Cálculo dos percentis
p5 = 0
p90 = 0
p95 = 0

# Função de mapeamento de cores
def custom_color_map(value):
    if value > p95:
        return 'black'
    else:
        norm_value = (value - p5) / (p95 - p5)
        return plt.cm.RdYlGn_r(norm_value)

def gera_calendario(espera, tipo, metrica, mes):
    # Reorganize o dataframe para a forma desejada
    pivot_df = espera.pivot_table(values='wait_time', index='week_of_year', columns='day_of_week', aggfunc=np.mean)

    # Reordene as colunas para começar na segunda-feira
    ordered_days = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']

    # Crie um DataFrame temporário com todas as colunas ordenadas
    temp_df = pd.DataFrame(columns=ordered_days)
    
    for day in ordered_days:
        if day in pivot_df.columns:
            temp_df[day] = pivot_df[day]
        else:
            temp_df[day] = np.nan

    pivot_df = temp_df

    # Passo 1: Crie uma matriz de anotações
    annotation_array = []
    for week in pivot_df.index:
        annotation_row = []
        for day in ordered_days:
            date_row = espera[(espera['week_of_year'] == week) & (espera['day_of_week'] == day)]
            if not date_row.empty:
                day_of_month = date_row.iloc[0]['day']
                month = date_row.iloc[0]['month']
                wait_time = date_row.iloc[0]['wait_time']
                annotation_row.append(f"{day_of_month}/{month}\n{wait_time}")
            else:
                annotation_row.append('')
        annotation_array.append(annotation_row)

    annotation_array = np.array(annotation_array)
    
    # Inverter o DataFrame e a matriz de anotações
    pivot_df_inverted = pivot_df.iloc[::-1]
    annotation_array_inverted = annotation_array[::-1]

    altura = 0

    if tipo =='Mensal':
        altura = 10
    else:
        altura = 30
    
    plt.figure(figsize=(12, altura))

    # Anotação e cores
    for i, week in enumerate(pivot_df_inverted.index):
        for j, day in enumerate(pivot_df_inverted.columns):
            value = pivot_df_inverted.loc[week, day]
            if not np.isnan(value):
                color = 'white' if value > p90 or value < 17 else 'black'
                
                # A data acima do tempo médio de fila (fonte menor e sem negrito)
                day_of_month = annotation_array_inverted[i, j].split('\n')[0]
                plt.text(j + 0.8, i + 0.8, f"{day_of_month}", ha='center', va='center', fontsize=10, fontweight='normal', color=color)

                # O tempo médio de fila (fonte maior e negrito)
                wait_time = annotation_array_inverted[i, j].split('\n')[1]
                wait_time = int(float(wait_time))  # Converter para float e, em seguida, para inteiro
            
                plt.text(j + 0.5, i + 0.4, f"{wait_time}", ha='center', va='center', fontsize=18, fontweight='bold', color=color)

                plt.fill_betweenx([i, i+1], j, j+1, color=custom_color_map(value))
                plt.plot([j, j+1, j+1, j, j], [i, i, i+1, i+1, i], color='white', linewidth=1.5)

    plt.xticks(ticks=np.arange(0.5, len(pivot_df_inverted.columns)), labels=pivot_df_inverted.columns, rotation=45)
    plt.yticks(ticks=np.arange(0.5, len(pivot_df_inverted.index)), labels=pivot_df_inverted.index)
    titulo = ""
    
    if metrica == 'mean':
        titulo = "Calendário de Tempo de Espera Médio"
    elif metrica == 'max':
        titulo = "Calendário de Tempo de Espera Máximo"
    elif metrica == 'median':
        titulo = "Calendário de Tempo de Espera Mediano"
    elif metrica == 'mode':
        titulo = "Calendário de Tempo de Espera Modal"
    elif metrica == 'std':
        titulo = "Calendário dos Desvios Padrão do Tempo de Espera"
    
    plt.title(titulo)
    plt.xlabel("Dia da Semana")
    plt.ylabel("Semana do Ano")

    now = datetime.now()
    data_hora_formatada = now.strftime('%Y-%m-%d-%H%M')

    nome_arquivo = ''
    
    if tipo == 'Mensal':
        nome_arquivo=f'{metrica}_daily_wait_time_{mes}2023-{data_hora_formatada}.png'
    else:
        nome_arquivo=f'{metrica}_daily_wait_time_2023-{data_hora_formatada}.png'

    plt.savefig(nome_arquivo)

    plt.show()