# 0.0 Imports

In [2]:
from openai import OpenAI
import pandas as pd
from docx import Document
from dotenv import load_dotenv, find_dotenv
import os

# 0.1 Load Data

In [10]:
_ = load_dotenv(find_dotenv())


xls_path = '../data/raw/desafioaluno.xlsx'
doc_path = '../data/raw/contexto_aluno.docx'
prompt_path = '../data/raw/system_prompt.docx'

client = OpenAI (
api_key = os.getenv('OPEN_API_KEY')
)


xls = pd.read_excel(xls_path)
doc = Document(doc_path)
prompt = Document(prompt_path)

doc_text ='\n'.join([paragraph.text for paragraph in doc.paragraphs])
prompt_text = '\n'.join([paragraph.text for paragraph in prompt.paragraphs])

# 0.2 Functions

In [7]:
def ler_docx(file_path):
    """Lê um arquivo .docx e retorna seu conteúdo como string"""
    doc = Document(file_path)
    texto = "\n".join([paragrafo.text for paragrafo in doc.paragraphs])
    return texto


def get_completion(xls_file_path, doc_text, prompt_text, model="gpt-4o-mini"):

    xls_data = pd.read_excel(xls_file_path)
    xls_text = xls_data.to_string(index=False)

    

    # Criando mensagens
    messages = [
        {"role": "system", "content": prompt_text},
        {"role": "user", "content": f"Aqui estão os dois arquivos:\n\n📄 **Arquivo Excel:**\n{xls_text}\n\n📄 **Arquivo Texto:**\n{doc_text}\n\n"}
    ]

    #Fazendo a requisição para OpenAI
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        max_tokens=500,
        temperature=0.1
    )

    return response.choices[0].message.content
    #return messages

# 1.0 Dev

In [8]:
resultado = get_completion(xls_path, doc_text, prompt_text)
print(resultado)

### Feedback Detalhado sobre o Projeto de Análise de Dados

#### 1. Compreensão do Desafio
O aluno abordou o desafio de forma adequada, focando nas três áreas principais: retenção de clientes, segmentação de clientes e desempenho de produtos e localizações. O relatório apresenta uma análise coerente e insights relevantes, alinhando-se aos objetivos estabelecidos no desafio.

#### 2. Avaliação Técnica
- **Precisão dos Cálculos e Gráficos**: A análise de cohort foi bem executada, com a apresentação de um heatmap que ilustra a retenção de clientes. No entanto, seria interessante incluir uma análise mais detalhada sobre os fatores que influenciam a retenção, como sazonalidade e campanhas específicas.
- **Segmentação RFM**: A segmentação foi realizada corretamente, mas faltaram gráficos que ilustrassem a distribuição dos segmentos de clientes. A inclusão de gráficos de barras ou pizza poderia facilitar a visualização dos dados.
- **Desempenho de Produtos e Localizações**: A análise dos prod