In [2]:
import pandas as pd
import warnings
import plotly.express as px
from plotly.subplots import make_subplots
import plotly.graph_objects as go
from itertools import combinations

In [10]:
from fastapi import FastAPI, Request, UploadFile, Form
from fastapi.responses import HTMLResponse
from fastapi.staticfiles import StaticFiles
from fastapi.templating import Jinja2Templates
import pandas as pd
import plotly.express as px
import os


app = FastAPI()

templates = Jinja2Templates(directory="templates")
app.mount("/static", StaticFiles(directory="static"), name="static")

@app.get("/", response_class=HTMLResponse)
async def form(request: Request):
    return templates.TemplateResponse("index.html", {"request": request})

@app.post("/upload", response_class=HTMLResponse)
async def upload_file(request: Request, file: UploadFile):
    df_teste = pd.read_excel(file.file)
    df_teste['data_pedido'] = pd.to_datetime(df_teste['data_pedido'], dayfirst=True)
    df_teste['data_pedido'] = df_teste['data_pedido'].ffill()
    df_teste['nome']=df_teste['nome'].ffill()
    df_teste['email']=df_teste['email'].ffill()
    df_teste['cep_cliente']=df_teste['cep_cliente'].ffill()
    df_teste['endereco_contido'] = df_teste.apply(
    lambda row: str(row['rua_cliente_numero']).lower() in str(row['bairro_cliente']).lower(), axis=1
    )
    # Função para limpar e separar os valores corretamente
    def separate_numbers(valor_unitario):
        if isinstance(valor_unitario, str):
            return [val for val in valor_unitario.split('||') if val.replace('.', '', 1).isdigit()]
        else:
            return [valor_unitario]
    
    # Função para separar os itens de produto
    def separate_item_names(item_name):
        if isinstance(item_name, str):
            return item_name.split('||')  # Separar pela barra dupla
        else:
            return [item_name]
    
    # Separando os valores da coluna 'valor_unitario' e 'produto'
    df_separated_cost = df_teste.set_index('numero_pedido')['valor_unitario'].apply(separate_numbers)
    df_separated_name = df_teste.set_index('numero_pedido')['produto'].apply(separate_item_names)
    df_separated_qtd = df_teste.set_index('numero_pedido')['quantidade'].apply(separate_item_names)
    
    # Ajustar o tamanho das listas para garantir que elas tenham o mesmo comprimento
    max_len = max(df_separated_cost.apply(len).max(), df_separated_name.apply(len).max())
    
    # Preencher as listas menores com None ou valores vazios para garantir o mesmo comprimento
    df_separated_cost = df_separated_cost.apply(lambda x: x + [None] * (max_len - len(x)))
    df_separated_name = df_separated_name.apply(lambda x: x + [None] * (max_len - len(x)))
    
    # Agora, vamos combinar as listas de 'valor_unitario' e 'produto' por 'numero_pedido'
    df_separated = pd.DataFrame({
        'numero_pedido': df_separated_cost.index.repeat(max_len),
        'valor_unitario': [item for sublist in df_separated_cost for item in sublist],
        'produto': [item for sublist in df_separated_name for item in sublist],
        'quantidade': [item for sublist in df_separated_qtd for item in sublist]
    })
    
    # Convertendo 'valor_unitario' para numérico e removendo valores não numéricos
    df_separated['valor_unitario'] = pd.to_numeric(df_separated['valor_unitario'], errors='coerce')
    
    # Remover as linhas com NaN (caso algum valor não tenha sido convertido corretamente)
    df_separated = df_separated.dropna(subset=['valor_unitario'])
    df_separated['Valor_individual'] = df_separated['valor_unitario']*df_separated['quantidade']
    df_separated['Item_individual'] = df_separated['produto']
    df_separated = df_separated[['numero_pedido', 'Item_individual', 'Valor_individual']]
    df_teste1 = df_separated.merge(df_teste, on='numero_pedido', how='left')
    df_teste.loc[df_teste['telefone']=='N/D','telefone']=0
    df_teste['Valor_individual'] = df_teste['quantidade']*df_teste['valor_unitario']
    clientes = df_teste[['nome', 'Valor_individual', 'data_pedido','email']].groupby(['nome', 'data_pedido','email'], as_index=False).sum().sort_values(by='Valor_individual', ascending=False).copy()
    faturamento = df_teste[['data_pedido', 'Valor_individual']].groupby(['data_pedido'], as_index=False).sum().sort_values(by='data_pedido', ascending=False).reset_index(drop=True)
    faturamento = df_teste[['data_pedido', 'Valor_individual']].groupby(['data_pedido'], as_index=False).sum().sort_values(by='data_pedido', ascending=False).reset_index(drop=True)
    faturamento['data_pedido'] = pd.to_datetime(faturamento['data_pedido'])
    faturamento['dia_semana'] = faturamento['data_pedido'].dt.strftime('%A')
    faturamento['data_pedido'] = faturamento['data_pedido'].dt.strftime('%Y-%m-%d')
    faturamento['data_pedido'] = pd.to_datetime(faturamento['data_pedido'])
    media_faturamento = faturamento['Valor_individual'].mean()
    faturamento = faturamento.groupby(['data_pedido', 'dia_semana'], as_index=False).sum()
    faturamento['dia_semana'] = faturamento['dia_semana'].replace({
        'Monday': 'segunda-feira',
        'Tuesday': 'terça-feira',
        'Wednesday': 'quarta-feira',
        'Thursday': 'quinta-feira',
        'Friday': 'sexta-feira',
        'Saturday': 'sábado',
        'Sunday': 'domingo'
    })
    fat = faturamento.copy()
    fat['data_pedido'] = pd.to_datetime(fat['data_pedido'].dt.to_period('M').astype(str), errors='coerce')
    faturamento['Ano'] = pd.to_datetime(faturamento['data_pedido'].dt.to_period('Y').astype(str), errors='coerce').dt.date
    df_teste['ano'] = pd.to_datetime(faturamento['data_pedido']).dt.to_period('Y').astype(str)
    df_teste['mes'] = pd.to_datetime(faturamento['data_pedido'], dayfirst=True).dt.to_period('M').astype(str)
    df_teste['mes'] = pd.to_datetime(df_teste['data_pedido'], dayfirst=True).dt.to_period('M').astype(str)
    df_teste['ano'] = pd.to_datetime(df_teste['data_pedido'], dayfirst=True).dt.to_period('Y').astype(str)
    df_teste['Valor_individual'] = df_teste['quantidade']*df_teste['valor_unitario']
    prod = df_teste[['produto', 'Valor_individual', 'quantidade', 'ano', 'mes']].groupby(['produto', 'ano', 'mes'], as_index=False).sum()
    prod['Valor_individual']=prod['Valor_individual']
    df_teste['nome'] = df_teste[['nome', 'sobrenome']].astype(str).agg(' '.join, axis=1)
    df_teste['Cont']=1
    df_sorted = df_teste[['nome', 'produto', 'Cont']].sort_values(by=['nome', 'Cont'], ascending=[True, False])
    def calcular_primeira_combinacao(df):
        relacoes = []
        for cliente, grupo in df_sorted.groupby('nome'):
            # Pegar os 3 primeiros produtos (maior "Cont") para cada cliente
            produtos = grupo.head(3)
            
            if len(produtos) == 3:  # Certificar que o cliente tem pelo menos dois produtos
                produto1 = produtos.iloc[0]
                produto2 = produtos.iloc[1]
                produto3 = produtos.iloc[2]
                
                # Obter os valores de "Cont" para cada produto
                cont1 = produto1['Cont']
                cont2 = produto2['Cont']
                cont3 = produto3['Cont']
                
                # Adicionar a relação ao resultado
                relacoes.append({
                    'Cliente': cliente,
                    'Produto 1': produto1['produto'],
                    'Produto 2': produto2['produto'],
                    'Produto 3': produto3['produto'],
                    'Cont 1': cont1,
                    'Cont 2': cont2,
                    'cont 3': cont3,
                    'Soma Cont': cont1 + cont2 + cont3
                })
        
        # Criar um DataFrame com as relações
        return pd.DataFrame(relacoes)
    
    # Calcular a primeira combinação
    relacoes = calcular_primeira_combinacao(df_sorted)
    
    base_prd=relacoes[(relacoes['Produto 1']!='FraÃ§Ã£o Kit - Queij') & (relacoes['Produto 2']!='CafÃ© Especial O Fla')][['Produto 1', 
                      'Produto 2',
                      'Produto 3',                                                                                                    
                      'Cont 1', 
                      'Cont 2',
                      'cont 3']].groupby(['Produto 1', 
                                          'Produto 2',
                                        'Produto 3'],
                                         as_index=False).sum().sort_values(by=['Cont 1', 
                                                                               'Cont 2',
                                                                              'cont 3'], 
                                                                           ascending=False).drop_duplicates(subset=['Produto 1'], keep='first').head(10)
    
    # # Exibir o resultado
    # relacoes = relacoes[(relacoes['Produto 1']!='FraÃ§Ã£o Kit - Queij') & (relacoes['Produto 2']!='CafÃ© Especial O Fla')][['Produto 1', 
    #                                       'Produto 2',
    #                                       'Produto 3',
    #                                       'Cont 1', 
    #                                        'Cont 2',
    #                                        'cont 3']].groupby(['Produto 1', 
    #                                       'Produto 2'],
    #                                      as_index=False).sum().sort_values(by=['Cont 1', 
    #                                                                            'Cont 2',
    #                                                                           'cont 3'], 
    #                                                                        ascending=False).drop_duplicates(subset=['Produto 1'], keep='first')
    relacoes['Produto 3'] = relacoes['Produto 3'].str.split(' - ').str[0]
    
    clientes1 = clientes[['nome', 'Valor_individual']].reset_index(drop=True)#
    clientes1=clientes1.reset_index(drop=True).iloc[:10]
    clientes1 = clientes[['nome', 'email', 'Valor_individual']].groupby(['nome', 'email'], as_index=False).sum().sort_values(by='Valor_individual', ascending=False).head(10)
    clientes1['Valor_individual1'] = clientes1['Valor_individual'].apply(lambda x: f'R${x:,.2f}')
    colors = px.colors.qualitative.Set3
    unique_descriptions = clientes1['nome'].unique()
    num_categories = len(unique_descriptions)
    
    def format_currency(value):
        return "${:,.2f}".format(value)
    
    # Formatar os valores 'Valor_individual_fmt' como dinheiro
    clientes1['Valor_individual_fmt_fmt'] = clientes1['Valor_individual'].apply(format_currency)
    clientes['Valor_individual_fmt_fmt'] = clientes['Valor_individual'].apply(format_currency)
    if num_categories > len(colors):
        colors = px.colors.qualitative.Set2 
    color_map = {desc: colors[i % len(colors)] for i, desc in enumerate(unique_descriptions)}
    bar_colors = [color_map[desc] for desc in clientes1['nome']]
    
    fig = make_subplots(
        rows=1, cols=2, 
        column_widths=[0.7, 0.3],  
        subplot_titles=["Valor gasto por clientes", "Faturamento por clientes"],
        specs=[[{"type": "scatter"}, {"type": "table"}]] 
    )
    
    # Corrigir o nome da coluna 'Valor_individual_fmt_fmt'
    fig.add_trace(
        go.Bar(x=clientes1['nome'], y=clientes1['Valor_individual'], name='Valores', marker=dict(color=bar_colors)),
        row=1, col=1
    )
    
    # Corrigir o nome da coluna 'Valor_individual_fmt_fmt' na tabela
    fig.add_trace(
        go.Table(
            header=dict(values=['Valor_individual1', 'Nome do cliente']),
            cells=dict(values=[clientes1['Valor_individual1'], clientes1['nome']])
        ),
        row=1, col=2
    )
    
    fig.update_layout(
        title_text="Clientes de maior valor",
        showlegend=False
    )

    # Exemplo simples de gráfico
    fig.write_html("static/grafico.html")

    return templates.TemplateResponse("index.html", {"request": request, "show_plot": True})
