# Análise de Dados com IA 

### Utilizando Python, Scikit Learn e OpenAI API

Isso é um trabalho sobre Análise de Dados com IA. Aqui mostrarei dois principais exemplos utilizando
ferramentas do Python, uma vez que ela se apresenta como a mais viável para trabalhar com esse tema.

Aqui estou utilizando o Jupyter Notebook, uma ferramenta que me permite intercalar células de Markdown
com células de código Python, afim de produzir um conteúdo didático que pondera com excelência os textos
didáticos e os exemplos de código. <p>

## Primeiro Exemplo: Análise Massiva e Previsão

O primeiro exemplo se trata do uso da IA para fazer previsões com base em dados apresentados. <p>
Aqui possuo uma planilha de clientes de uma instituição financeira. Essa instituição está com um
evento que dará ao seus clientes confiáveis maior limite e oportunidades em seus serviços. Porém o número 
altíssimo de clientes torna a averiguação dos clientes uma tarefa extremamente cansativa e demorada para um ser humano. <p>
Nesse contexto, a IA se apresenta como uma ferramenta capaz de analisar a qualidade dos clientes e decidir se eles se enquadram nos que serão beneficiados nesse evento. <p>
Aqui utilizaremos duas principais ferramentas: 

### Pandas
O Pandas é uma biblioteca muito conhecida pelos profissionais que trabalham com dados em quantidades diversas. Ele permite uma visualização, indexação e manipulação dos dados, excepcional para análises de todo tipo ou finalidade. <p>

### Scikit Learn
O Scikit Learn é uma biblioteca que provê diversas ferramentas para uso de modelos de linguagem. Aqui utilizaremos o codificador de dados, o banco de modelos, o divisor de dados para treino e teste para modelos e o verificador de acurácia do modelo. Tralaharemos em conjunto com o Pandas, utilizando ele para filtrar e indexar os dados que serão fornecidos aos modelos. <p>

### Criando passos para a execução:

In [1]:
# Passo a passo
# Passo 0 - Entender a empresa e o desafio da empresa
# Passo 1 - Importar a base de dados
import pandas as pd

tabela = pd.read_csv("assets/clientes.csv")

display(tabela)

# Score de crédito = Nota de crédito
# Good = Boa
# Standard = OK
# Poor = Ruim

Unnamed: 0,id_cliente,mes,idade,profissao,salario_anual,num_contas,num_cartoes,juros_emprestimo,num_emprestimos,dias_atraso,...,idade_historico_credito,investimento_mensal,comportamento_pagamento,saldo_final_mes,score_credito,emprestimo_carro,emprestimo_casa,emprestimo_pessoal,emprestimo_credito,emprestimo_estudantil
0,3392,1,23.0,cientista,19114.12,3.0,4.0,3.0,4.0,3.0,...,265.0,21.465380,alto_gasto_pagamento_baixos,312.494089,Good,1,1,1,1,0
1,3392,2,23.0,cientista,19114.12,3.0,4.0,3.0,4.0,3.0,...,266.0,21.465380,baixo_gasto_pagamento_alto,284.629162,Good,1,1,1,1,0
2,3392,3,23.0,cientista,19114.12,3.0,4.0,3.0,4.0,3.0,...,267.0,21.465380,baixo_gasto_pagamento_medio,331.209863,Good,1,1,1,1,0
3,3392,4,23.0,cientista,19114.12,3.0,4.0,3.0,4.0,5.0,...,268.0,21.465380,baixo_gasto_pagamento_baixo,223.451310,Good,1,1,1,1,0
4,3392,5,23.0,cientista,19114.12,3.0,4.0,3.0,4.0,6.0,...,269.0,21.465380,alto_gasto_pagamento_medio,341.489231,Good,1,1,1,1,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
99995,37932,4,25.0,mecanico,39628.99,4.0,6.0,7.0,2.0,23.0,...,378.0,24.028477,alto_gasto_pagamento_alto,479.866228,Poor,1,0,0,0,1
99996,37932,5,25.0,mecanico,39628.99,4.0,6.0,7.0,2.0,18.0,...,379.0,24.028477,alto_gasto_pagamento_medio,496.651610,Poor,1,0,0,0,1
99997,37932,6,25.0,mecanico,39628.99,4.0,6.0,7.0,2.0,27.0,...,380.0,24.028477,alto_gasto_pagamento_alto,516.809083,Poor,1,0,0,0,1
99998,37932,7,25.0,mecanico,39628.99,4.0,6.0,7.0,2.0,20.0,...,381.0,24.028477,baixo_gasto_pagamento_alto,319.164979,Standard,1,0,0,0,1


##### Aqui fizemos uma análise inicial dos dados para entender como que a empresa administra e faz a gestão dos clientes, nosso próximo passo é preparar os dados com codificadores para que a IA possa processá-los e fazer as previsões.  

### Tabela com Dados Brutos:

In [2]:
# Passo 2 - Preparar a base de dados para a Inteligência Artificial
display(tabela.info())

<class 'pandas.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 25 columns):
 #   Column                    Non-Null Count   Dtype  
---  ------                    --------------   -----  
 0   id_cliente                100000 non-null  int64  
 1   mes                       100000 non-null  int64  
 2   idade                     100000 non-null  float64
 3   profissao                 100000 non-null  str    
 4   salario_anual             100000 non-null  float64
 5   num_contas                100000 non-null  float64
 6   num_cartoes               100000 non-null  float64
 7   juros_emprestimo          100000 non-null  float64
 8   num_emprestimos           100000 non-null  float64
 9   dias_atraso               100000 non-null  float64
 10  num_pagamentos_atrasados  100000 non-null  float64
 11  num_verificacoes_credito  100000 non-null  float64
 12  mix_credito               100000 non-null  str    
 13  divida_total              100000 non-null  float64
 14  

None

### Tabela com Dados Convertidos: 

In [3]:
# int -> numero inteiro
# float -> numero com casa decimal
# object -> texto

# LabelEncoder
from sklearn.preprocessing import LabelEncoder

# profissao

# cientista - 1
# bombeiro - 2
# engenheiro - 3
# dentista - 4
# artista - 5
codificador_profissao = LabelEncoder()
tabela["profissao"] = codificador_profissao.fit_transform(tabela["profissao"])


# mix_credito
codificador_credito = LabelEncoder()
tabela["mix_credito"] = codificador_credito.fit_transform(tabela["mix_credito"])

# comportamento_pagamento
codificador_pagamento = LabelEncoder()
tabela["comportamento_pagamento"] = codificador_pagamento.fit_transform(tabela["comportamento_pagamento"])

display(tabela.info())

<class 'pandas.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 25 columns):
 #   Column                    Non-Null Count   Dtype  
---  ------                    --------------   -----  
 0   id_cliente                100000 non-null  int64  
 1   mes                       100000 non-null  int64  
 2   idade                     100000 non-null  float64
 3   profissao                 100000 non-null  int64  
 4   salario_anual             100000 non-null  float64
 5   num_contas                100000 non-null  float64
 6   num_cartoes               100000 non-null  float64
 7   juros_emprestimo          100000 non-null  float64
 8   num_emprestimos           100000 non-null  float64
 9   dias_atraso               100000 non-null  float64
 10  num_pagamentos_atrasados  100000 non-null  float64
 11  num_verificacoes_credito  100000 non-null  float64
 12  mix_credito               100000 non-null  int64  
 13  divida_total              100000 non-null  float64
 14  

None

##### Agora com os dados já codificados e adapatados para o trabalho dos modelos, podemos nos preocupar em preparar o ambiente de treino e teste das IAs.

In [4]:
# y -> é a coluna da base de dados que eu quero prever
y = tabela["score_credito"]

# x -> as colunas da base de dados que eu vou usar pra fazer a previsão
x = tabela.drop(columns=["score_credito", "id_cliente"])

# separar em dados de treino e dados de teste
from sklearn.model_selection import train_test_split

x_treino, x_teste, y_treino, y_teste = train_test_split(x, y, test_size=0.3)

# Aqui ele pega os dados de entrada e divide as linhas das colunas entre dados de teste e treino,
# assim retonando quatro variáveis que contém tais dados.

##### Aqui em cima nós preparamos a coluna na qual será feita a previsão e as colunas que serão utilizadas para fazer a previsão. Também importamos e configuramos o divisor de dados para treino e teste, onde fracionamos os dados entre dados de treino e dados de teste para o modelo. Agora temos que, de fato, treinar o modelo

Lembrando que essas linhas de código foram apenas para fazer a separação dos dados, estamos basicamente usando essa função apenas para indicar como o modelo deverá entender os dados, e assim, trabalhar com eles. 

In [5]:
# Passo 3 - Treinar a Inteligência Artificial -> 
# Criar o modelo: Nota de crédito: Boa, Ok, Ruim

# Arvore de Decisão -> RandomForest
# Nearest Neighbors -> KNN -> Vizinhos Próximos

# importar a IA (Inteligencia Artificial)
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

# criar a IA
modelo_arvoredecisao = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

# treinar a IA
modelo_arvoredecisao.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)

# Vale ressaltar que nós passamos ambos os dados para a IA peceber como que esses mesmos dados 
# funcionam em conjunto. Sendo mais específico, ela precisa disso para saber como os outros dados 
# da tabela afetam os dados que serão previstos.

0,1,2
,"n_neighbors  n_neighbors: int, default=5 Number of neighbors to use by default for :meth:`kneighbors` queries.",5
,"weights  weights: {'uniform', 'distance'}, callable or None, default='uniform' Weight function used in prediction. Possible values: - 'uniform' : uniform weights. All points in each neighborhood  are weighted equally. - 'distance' : weight points by the inverse of their distance.  in this case, closer neighbors of a query point will have a  greater influence than neighbors which are further away. - [callable] : a user-defined function which accepts an  array of distances, and returns an array of the same shape  containing the weights. Refer to the example entitled :ref:`sphx_glr_auto_examples_neighbors_plot_classification.py` showing the impact of the `weights` parameter on the decision boundary.",'uniform'
,"algorithm  algorithm: {'auto', 'ball_tree', 'kd_tree', 'brute'}, default='auto' Algorithm used to compute the nearest neighbors: - 'ball_tree' will use :class:`BallTree` - 'kd_tree' will use :class:`KDTree` - 'brute' will use a brute-force search. - 'auto' will attempt to decide the most appropriate algorithm  based on the values passed to :meth:`fit` method. Note: fitting on sparse input will override the setting of this parameter, using brute force.",'auto'
,"leaf_size  leaf_size: int, default=30 Leaf size passed to BallTree or KDTree. This can affect the speed of the construction and query, as well as the memory required to store the tree. The optimal value depends on the nature of the problem.",30
,"p  p: float, default=2 Power parameter for the Minkowski metric. When p = 1, this is equivalent to using manhattan_distance (l1), and euclidean_distance (l2) for p = 2. For arbitrary p, minkowski_distance (l_p) is used. This parameter is expected to be positive.",2
,"metric  metric: str or callable, default='minkowski' Metric to use for distance computation. Default is ""minkowski"", which results in the standard Euclidean distance when p = 2. See the documentation of `scipy.spatial.distance `_ and the metrics listed in :class:`~sklearn.metrics.pairwise.distance_metrics` for valid metric values. If metric is ""precomputed"", X is assumed to be a distance matrix and must be square during fit. X may be a :term:`sparse graph`, in which case only ""nonzero"" elements may be considered neighbors. If metric is a callable function, it takes two arrays representing 1D vectors as inputs and must return one value indicating the distance between those vectors. This works for Scipy's metrics, but is less efficient than passing the metric name as a string.",'minkowski'
,"metric_params  metric_params: dict, default=None Additional keyword arguments for the metric function.",
,"n_jobs  n_jobs: int, default=None The number of parallel jobs to run for neighbors search. ``None`` means 1 unless in a :obj:`joblib.parallel_backend` context. ``-1`` means using all processors. See :term:`Glossary ` for more details. Doesn't affect :meth:`fit` method.",


##### Acima nós acabamos de importar os modelos que serão utilizados e usar a função fit do sklearn para passar os dados de treino e treinar o modelo. Depois podemos fazer os testes com os dados x (dados utilizados para a previsão).

In [6]:
# Passo 4 - Escolher qual o melhor modelo
previsao_arvoredecisao = modelo_arvoredecisao.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste)

print(previsao_arvoredecisao)
print(previsao_knn)
print("")

# Explicando melhor, o modelo aqui recebe apenas os dados para a previsão, onde ele vai utilizá-los
# para prever os dados a serem previstos.

# acurácia
from sklearn.metrics import accuracy_score
acuracia_arvoredecisao = accuracy_score(y_teste, previsao_arvoredecisao)
acuracia_knn = accuracy_score(y_teste, previsao_knn)

print("Nota dos Testes:")     
print("-----------------------")
print(f"Primeiro Modelo: {round((acuracia_arvoredecisao * 100), 1)}%")
print(f"Segundo Modelo: {round((acuracia_knn * 100), 1)}%")

['Poor' 'Good' 'Poor' ... 'Good' 'Standard' 'Poor']
['Poor' 'Good' 'Poor' ... 'Standard' 'Standard' 'Poor']

Nota dos Testes:
-----------------------
Primeiro Modelo: 82.2%
Segundo Modelo: 73.6%


##### Aqui em cima utilizamos a função predict para criar os testes para os modelos com os dados x, e depois, importamos o verificador de acurácia do modelo e utilizamos os dados y para comparar as previsões da IA, e assim, determinar seu percentual de eficiência.

In [7]:
# Passo 5 - Usar o melhor modelo para fazer previsão de novos clientes
# melhor modelo é o modelo_arvoredecisao

# importar os novos clientes para fazer a previsao
tabela_novos_clientes = pd.read_csv("assets/novos_clientes.csv")

# profissao
tabela_novos_clientes["profissao"] = codificador_profissao.fit_transform(
    tabela_novos_clientes["profissao"]
)

# mix_credito
tabela_novos_clientes["mix_credito"] = codificador_credito.fit_transform(
    tabela_novos_clientes["mix_credito"]
)

# comportamento_pagamento
tabela_novos_clientes["comportamento_pagamento"] = codificador_pagamento.fit_transform(
    tabela_novos_clientes["comportamento_pagamento"]
)

# Aqui nós redefinimos os codificadores com as mesmas variáveis para preparar os dados
# para serem usados pelo modelo, mesmo processo de antes, utilizando LabelEncoder.

display(tabela_novos_clientes)

nova_previsao = modelo_arvoredecisao.predict(tabela_novos_clientes)

print(nova_previsao)

Unnamed: 0,mes,idade,profissao,salario_anual,num_contas,num_cartoes,juros_emprestimo,num_emprestimos,dias_atraso,num_pagamentos_atrasados,...,taxa_uso_credito,idade_historico_credito,investimento_mensal,comportamento_pagamento,saldo_final_mes,emprestimo_carro,emprestimo_casa,emprestimo_pessoal,emprestimo_credito,emprestimo_estudantil
0,1,31.0,1,19300.34,6.0,7.0,17.0,5.0,52.0,19.0,...,29.934186,218.0,44.50951,1,312.487689,1,1,0,0,0
1,4,32.0,0,12600.445,5.0,5.0,10.0,3.0,25.0,18.0,...,28.819407,12.0,0.0,2,300.994163,0,0,0,0,1
2,2,48.0,1,20787.69,8.0,6.0,14.0,7.0,24.0,14.0,...,34.235853,215.0,0.0,0,345.081577,0,1,0,1,0


['Poor' 'Good' 'Standard']


##### Para concluir, utilizamos o modelo que se saiu melhor nos testes para prever e determinar o clientes que se encaixam nos requisitos do evento. Em uma aplicação profissional a tabela de novos clientes seria muito maior, tornando o treinamento mais necessário, mas nada muito complicado. Com o modelo treinado ele pôde ser aplicado com excelência para determinar os clientes. <p>

## Segundo Exemplo: Geração de Relatórios por meio de prompt

A segundo exemplo trabalha em conjunto com o primeiro. Lá, nós treinamos e utilizamos os modelos para processar e prever dados, aqui vamos urilizar ferramentas de prompt para criação de relatórios. <p>
Pois bem, vamos supor que a IA tenha terminado suas previsões e retornado aquele array das previsões que ela fez. A empresa necessita uma maneira mais legível e compreensível de ver esses retornos do modelo. <p>
Aqui, a IA novamente facilitará a manipulação de dados massivos gerando relatórios bem mais legíveis para que possamos compreender melhor o que o processamento inicial significa.. <p>
Aqui utilizaremos duas novas ferramentas: 

### OpenAI API
A API da OpenAI é uma ferramenta que pode ser usada em várias linguagem de programação, incluindo ferramentas como cURL. Essa API te oferece múltiplos serviços para trabalhar com os modelos aprimorados do ChatGPT, permitindo que suas funcionalidades sejam integradas a outros algoritmos e códigos desenvolvidosm, desde que você possua créditos na sua API Key. <p>

### Plotly
O Plotly é uma ferramenta usada por veteranos na área de ciência de dados, trata-se de uma ferramenta um pouco mais técnica que o PowerBI, mas que funciona de maneira semelhante. Ela possibilita a criação de gráficos e dashboards, além d possuir integração com o Pandas para análise de dados massivos que não precisem de processamento inteligente. <p>

### DotEnv
O DotEnv ou dotenv, é uma tecnologia simples porém excelente para desenvolvimento de projetos que necessitem de dados sensíveis. Ele permite salvar esses dados em um arquivo .env, que será ignorado no deploy ou versionamento e só será utilizado na compilação do projeto. O dotenv possui ferramentas para gerir e extrair informações desse arquivo. <p>

### Preparando os dados a serem utilizados:


In [8]:
score_clientes = tabela["score_credito"].dropna() # dropna exclui linhas vazias
display(score_clientes)

0            Good
1            Good
2            Good
3            Good
4            Good
           ...   
99995        Poor
99996        Poor
99997        Poor
99998    Standard
99999        Poor
Name: score_credito, Length: 100000, dtype: str

##### Supondo que esse array se trata do processamento e previsão que a IA fez, já temos os dados, falta formatá-los para uma forma mais legível, para isso utilizaremos um gráfico para vizualizar a proporção dos resultados e, em seguida, a OpenAI API para gerar relatórios mais específicos.

In [9]:
import plotly.express as px

grafico = px.histogram(tabela, score_clientes)
grafico.show()
# Para um histogram no plotly precisamos passar dois parâmetros obrigatórios:
# a base de dados completa e a coluna que queremos análisar.

# Ele vai automaticamente associar com um outro parâmetro nativo chamado count (contagem dos dados)
# Se a coluna tiver dados string, ele vai fazer como abaixo, contando os iguais e separando por colunas
# os diferentes, caso os dados sejam number, ele vai adaptar de outra maneira, porém semelhante.

##### Aqui já temos uma vizualização melhor do comportamento dos clientes nesse quesito, mas ainda não temos um relatório completo, apenas uma quatificação mais visual, facilita uma possível apresentação dos dados, mas precisamos de um relatório mais detalhado. Agora faremos um filtro e uma adaptação com os dados para o que o modelo aprimorado da OpenAI possa trabalhar.

In [2]:
score_clientes = dict(zip(tabela.id_cliente, tabela.score_credito))
display(score_clientes) 
# Aqui eu faço uma conversão mais avançada, associando o id dos clientes com
# sua respectiva pontuação de créditos com a empresa. Isso será útil na geração de 
# relatório, uma vez que precisamos associar cliente com a pontuação para obter um bom desempenho 

from openai import OpenAI
from dotenv import load_dotenv
import os

load_dotenv() # Carregando .env
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY") # Pegando chave de API do .env

modelo = OpenAI(api_key=OPENAI_API_KEY) 
# Passando chave de API para o objeto que executará as tarefas com IA


{3392: 'Standard',
 8625: 'Good',
 11708: 'Standard',
 47249: 'Standard',
 7387: 'Standard',
 38382: 'Good',
 10314: 'Good',
 21511: 'Poor',
 16727: 'Standard',
 47624: 'Good',
 42603: 'Standard',
 49323: 'Good',
 15941: 'Standard',
 27750: 'Poor',
 4084: 'Standard',
 13266: 'Standard',
 24688: 'Poor',
 4059: 'Standard',
 13651: 'Good',
 16640: 'Standard',
 4911: 'Poor',
 41326: 'Poor',
 44166: 'Standard',
 23368: 'Poor',
 42489: 'Poor',
 19779: 'Standard',
 47455: 'Poor',
 16092: 'Standard',
 49150: 'Standard',
 46721: 'Poor',
 39537: 'Standard',
 24648: 'Poor',
 38325: 'Standard',
 16388: 'Standard',
 45313: 'Standard',
 39828: 'Good',
 16512: 'Poor',
 28778: 'Standard',
 17068: 'Standard',
 22303: 'Standard',
 46591: 'Standard',
 27163: 'Standard',
 39873: 'Standard',
 3173: 'Good',
 44763: 'Good',
 36507: 'Standard',
 24733: 'Standard',
 30150: 'Good',
 39740: 'Standard',
 8867: 'Good',
 2836: 'Poor',
 47494: 'Standard',
 48667: 'Poor',
 40166: 'Standard',
 28667: 'Standard',
 1717

##### Agora, precisamos trabalhar com o prompt da IA para que assim, ela nos gere um relatório dizendo quais clientes devem receber o benefício e quais não estão aptos

In [6]:
treinamento = """
                Você é um modelo treinado para gerar relatórios com base em IDs, você sempre receberá um array de IDs e terá que gerar um relatório para eles em texto.
                No atual contexto você presta serviços para uma empresa financeira que dará benefícios fiscais para os clientes que possuam nota de crédito boa.
                Sua tarefa é gerar um padrão fixo de relatório detalhado, formal e culto, que contenha os IDs dos clientes elegíveis em lista, indicando que eles
                receberão tal benefício. Lembre-se de formatar o texto corretamente.
              """

chat = modelo.chat.completions.create(
    model='gpt-5-nano',
    messages=[
        { 
            "role": "system",  
            "content": treinamento
        },
        {
            "role": "user",
            "content": "Quem é você?"
        }
    ]
)
print(chat.choices[0].message.content)

Sou um modelo de IA treinado para gerar relatórios com base em IDs. Minha função é receber um array de IDs de clientes e produzir um relatório formal e detalhado, informando quais clientes são elegíveis para determinado benefício. No contexto atual, atuo para uma empresa financeira que concede benefícios fiscais a clientes com boa nota de crédito. Assim que você fornecer o conjunto de IDs, apresentarei o relatório no formato fixo solicitado, incluindo a lista dos IDs elegíveis e a indicação do benefício que será recebido. Se desejar, já pode enviar os IDs.


##### Aqui criamos o chat com um modelo do ChatGPT e atrbuímos um treinamento para ele, isso facilita e amplifica a eficiência do serviço da IA. Agora precisamos passar os dados dos clientes e solicitar um relatório, mas para isso, os dados necessitam de um tratamento basico, para separar os dados que srão utilizados, dos que não serão.

In [None]:
good_clients = []
for id, score in score_clientes.items():
    if score == "Good":
        good_clients.append(id)
print(good_clients)

[8625, 38382, 10314, 47624, 49323, 13651, 39828, 3173, 44763, 30150, 8867, 17173, 1908, 40816, 10279, 27694, 27835, 26185, 26710, 26516, 14011, 7792, 9810, 16132, 14733, 29264, 35945, 31919, 8678, 38204, 49609, 8970, 18481, 12965, 42315, 6806, 12757, 47594, 16424, 36280, 47544, 26593, 18748, 40830, 43124, 20133, 33288, 45919, 23956, 11313, 29941, 35994, 31796, 16982, 20228, 3558, 18005, 3875, 31996, 29327, 3333, 3929, 39512, 16542, 19035, 18563, 15587, 2414, 34378, 22225, 43061, 20826, 28850, 32039, 1310, 42336, 19518, 16868, 48546, 30738, 1667, 16296, 31006, 1307, 11150, 43715, 3732, 26162, 26824, 7486, 26974, 8086, 12393, 33924, 16950, 26218, 38788, 26418, 12140, 29253, 17807, 27570, 49023, 29087, 12313, 19007, 47373, 31248, 34447, 3385, 26748, 44895, 18219, 31973, 10787, 38253, 44356, 1030, 34010, 27114, 28944, 50729, 43655, 23298, 38595, 26048, 15630, 49931, 18368, 11031, 3409, 38346, 2048, 23938, 13549, 11773, 50720, 14532, 46716, 28134, 27221, 1345, 23479, 50242, 25761, 4187, 448

##### Apenas essas poucas linhas foram suficientes para tratar e segregar esses dados. Com os dados apurados, já podemos fazer a solicitação do relatório.

In [19]:
prompt = f"""
          Me gere um relatório como você foi instruído para fazer, a seguir deixo um array dos clientes elegíveis ao benefício. Dados de apoio {good_clients}
         """
chat = modelo.chat.completions.create(
    model='gpt-5-nano',
    messages=[
        { 
            "role": "system",  
            "content": treinamento
        },
        {
            "role": "user",
            "content": prompt
        }
    ]
)
print(chat.choices[0].message.content)

KeyboardInterrupt: 