# Projeto ETL com Integração da API do GPT
## Objetivo
O objetivo deste projeto é enriquecer os dados de clientes com informações sobre opções de investimento. O processo ETL (Extração, Transformação e Carga) será aplicado aos dados, e uma IA generativa (GPT) será usada para gerar recomendações de investimento com base nos IDs dos clientes.
## Etapas do Projeto

### 1. Extração dos Dados

#### 1.1. Leitura dos Arquivos CSV
Nesta etapa, realizaremos a extração dos dados dos seguintes arquivos CSV:
- `dados_clientes.csv`: Contém informações pessoais dos clientes.

Vamos usar a biblioteca Pandas para a leitura dos arquivos CSV.

In [45]:
import pandas as pd
dados_clientes_df = pd.read_csv("dados_clientes.csv")

### 2. Transformação dos Dados
#### 2.1. Formatação de Campos de Data
Vamos formatar as colunas de data no DataFrame dados_clientes_df para o formato "dd/mm/yyyy". As colunas "DataRegistroBanco" e "DataNascimento".

In [46]:
dados_clientes_df['DataRegistroBanco'] =  pd.to_datetime(dados_clientes_df['DataRegistroBanco'], format='%Y-%m-%d').dt.strftime('%d/%m/%Y')
dados_clientes_df['DataNascimento'] =  pd.to_datetime(dados_clientes_df['DataNascimento'], format='%Y-%m-%d').dt.strftime('%d/%m/%Y')

#### 2.2. Formatação de Campos de Salário
Vamos formatar a coluna de salário no DataFrame clientes_df para o formato "R$ X.XX".

In [47]:
dados_clientes_df['Salario'] = dados_clientes_df['Salario'].apply(lambda x: f"R$ {x:.2f}")

### 3. Integração com a API do GPT
#### 3.1 Configurando chave de API do GPT
Fazer essa configuração de chave, conseguimos interagir com a IA Generativa.

In [48]:
import openai
import time

api_key_gpt = 'Coloque sua chave de API'openai.api_key = api_key_gpt

#### 3.2. Geração de Opções de Investimento
Vamos interagir com os IDs dos clientes para obter informações relevantes. Usaremos a API do GPT para gerar opções de investimento com base na interação com esses IDs. Em seguida, adicionaremos as opções geradas a uma lista.

In [49]:
# Lista para armazenar as opções de investimento
opcoes_de_investimento = []

# Iterar pelos IDs dos clientes
for nome in dados_clientes_df['Nome']:
    prompt = f"Crie uma mensagem sobre investimentos na bolsa de valores para cliente com nome {nome} (limite de 80 caracteres)."
    
    # Crie a conversa em um formato de lista de mensagens
    conversation = [
        {"role": "system", "content": "Você é um especialista em investimentos"},
        {"role": "user", "content": prompt}
    ]

    resposta = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=conversation
    )
    
    opcao_de_investimento = resposta['choices'][0]['message']['content']
    opcoes_de_investimento.append(opcao_de_investimento)

    # Aguarde 20 segundos entre as solicitações
    time.sleep(20)

### 4. Carga dos Dados
#### 4.1. Adição das Opções de Investimento ao DataFrame
Adicione as opções de investimento geradas ao DataFrame de clientes.

In [50]:
dados_clientes_df['OpcoesInvestimento'] = opcoes_de_investimento

### 5. Formatação dos Dados
Agora que temos as opções de investimento e os campos de data e salário formatados, podemos continuar com a formatação dos dados restantes, se necessário.

In [51]:
# Visualizar o dataframe para conferir os dados.
display(dados_clientes_df)

Unnamed: 0,ID,Nome,Email,UF,Salario,DataRegistroBanco,Agencia,NumeroConta,DataNascimento,Sexo,OpcoesInvestimento
0,1,João Silva,joao.silva@email.com,SP,R$ 5000.00,15/01/2022,7890,123456789,10/03/1985,Masculino,"João Silva, invista na bolsa e amplie seus gan..."
1,2,Maria Santos,maria.santos@email.com,RJ,R$ 3200.50,20/11/2021,4567,987654321,22/07/1990,Feminino,"""Maria Santos, invista na bolsa: segurança e l..."
2,3,Carlos Ferreira,carlos.ferreira@email.com,MG,R$ 7500.75,05/03/2022,2345,456123789,14/09/1978,Masculino,"""Carlos Ferreira, invista na bolsa de valores ..."
3,4,Ana Souza,ana.souza@email.com,BA,R$ 1200.20,30/04/2022,7890,987654321,03/12/1995,Feminino,Invista na bolsa: crescimento e rentabilidade ...
4,5,Lucas Oliveira,lucas.oliveira@email.com,RS,R$ 4300.60,08/10/2021,1234,123456789,25/05/1987,Masculino,"""Lucas Oliveira, invista na bolsa e alcance se..."
5,6,Julia Santos,julia.santos@email.com,PR,R$ 6000.30,18/02/2022,5678,789456123,29/11/1993,Feminino,"""Julia Santos, potencialize sua rentabilidade:..."
6,7,Mariana Pereira,mariana.pereira@email.com,SC,R$ 4200.75,12/06/2022,3456,987123456,17/04/1991,Feminino,"""Maximize seu patrimônio na B3 com estratégias..."
7,8,Ricardo Martins,ricardo.martins@email.com,GO,R$ 5500.40,29/12/2021,8901,456789012,05/08/1980,Masculino,"""Aumente sua carteira com segurança na Bolsa. ..."
8,9,Lúcia Rodrigues,lucia.rodrigues@email.com,AM,R$ 3700.90,03/08/2022,6789,654321987,13/02/1989,Feminino,"""Maximize sua rentabilidade na Bolsa com a ori..."
9,10,Felipe Almeida,felipe.almeida@email.com,CE,R$ 4900.60,25/05/2022,1234,210987654,18/06/1984,Masculino,"""Seja um investidor de sucesso na Bolsa de Val..."


### 6. Saída dos Dados
#### 6.1. Salvando os Dados em um Novo Arquivo CSV

In [52]:
# Salvar o DataFrame final em um novo arquivo CSV
dados_clientes_df.to_csv("clientes_com_investimentos.csv", index=False)

## Conclusão do Projeto
Neste projeto, implementamos um pipeline ETL (Extração, Transformação e Carga) para enriquecer os dados de clientes com informações de investimento. O processo envolveu a extração de dados de um arquivo CSV: contendo informações pessoais dos clientes. Além disso, integramos a API do GPT para gerar recomendações de investimento personalizadas com base nos nomes dos clientes.