# Tarefa 5: invocar modelo do Bedrock para geração de código

Neste caderno, você aprenderá a usar um grande modelo de linguagem (LLM) para gerar código com base em um prompt de texto.

O prompt usado nesse caderno é um prompt zero-shot, pois não estamos fornecendo exemplos de texto além do prompt em si.

Para demonstrar a capacidade de geração de código dos modelos no Amazon Bedrock, você usa o caso de uso de geração de código. Você verá como usar o cliente Boto3 para se comunicar com a API do Amazon Bedrock e atribuir uma tarefa à ela, bem como uma instrução e uma entrada, para que o modelo básico gere uma saída sem precisar de um exemplo adicional. Nosso objetivo é demonstrar como os LLMs avançados compreendem facilmente a tarefa apresentada e geram resultados interessantes.


## Cenário

Você é Moe, analista de dados na QualquerEmpresa. A empresa quer entender o desempenho de vendas de diferentes produtos ao longo do ano passado. Você recebeu um conjunto de dados chamado sales.cvs. O conjunto de dados contém as seguintes colunas:

- Data no formato DD-MM-AAAA
- ID_Produto (identificador único de cada produto)
- Preço (preço pelo qual cada produto foi vendido)


Neste caderno, você aprenderá a gerar código para um determinado prompt. Você utiliza o modelo Amazon Nova Lite por meio da API Amazon Bedrock com o cliente Boto3.

## Tarefa 5.1: configuração do ambiente

Nesta tarefa, você configurará o ambiente.


In [13]:
#create a service client by name using the default session.
import json
import os
import sys

import boto3

module_path = ".."
sys.path.append(os.path.abspath(module_path))
bedrock_client = boto3.client('bedrock-runtime',region_name=os.environ.get("AWS_DEFAULT_REGION", None))


## Tarefa 5.2: geração de códigos

Nesta tarefa, você preparará uma entrada no serviço Amazon Bedrock a fim de gerar um programa Python para seu caso de uso.

#### Configuração do laboratório: crie dados de amostra do sales.csv para esse laboratório.



In [None]:
# create sales.csv file
import csv

data = [
    ["date", "product_id", "price", "units_sold"],
    ["2023-01-01", "P001", 50, 20],
    ["2023-01-02", "P002", 60, 15],
    ["2023-01-03", "P001", 50, 18],
    ["2023-01-04", "P003", 70, 30],
    ["2023-01-05", "P001", 50, 25],
    ["2023-01-06", "P002", 60, 22],
    ["2023-01-07", "P003", 70, 24],
    ["2023-01-08", "P001", 50, 28],
    ["2023-01-09", "P002", 60, 17],
    ["2023-01-10", "P003", 70, 29],
    ["2023-02-11", "P001", 50, 23],
    ["2023-02-12", "P002", 60, 19],
    ["2023-02-13", "P001", 50, 21],
    ["2023-02-14", "P003", 70, 31],
    ["2023-03-15", "P001", 50, 26],
    ["2023-03-16", "P002", 60, 20],
    ["2023-03-17", "P003", 70, 33],
    ["2023-04-18", "P001", 50, 27],
    ["2023-04-19", "P002", 60, 18],
    ["2023-04-20", "P003", 70, 32],
    ["2023-04-21", "P001", 50, 22],
    ["2023-04-22", "P002", 60, 16],
    ["2023-04-23", "P003", 70, 34],
    ["2023-05-24", "P001", 50, 24],
    ["2023-05-25", "P002", 60, 21]
]

# Write data to sales.csv
with open('sales.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerows(data)

print("sales.csv has been created!")

## Tarefa 5.3: analisar as vendas com o programa Python gerado pelo Amazon Bedrock

In [15]:
# Create the prompt
# Analyzing sales

prompt_data = """

You have a CSV, sales.csv, with columns:
- date (YYYY-MM-DD)
- product_id
- price
- units_sold

Create a python program to analyze the sales data from a CSV file. The program should be able to read the data, and determine below:

- Total revenue for the year
- Total revenue by product 
- The product with the highest revenue 
- The date with the highest revenue and the revenue achieved on that date
- Visualize monthly sales using a bar chart

Ensure the code is syntactically correct, bug-free, optimized, not span multiple lines unnessarily, and prefer to use standard libraries. Return only python code without any surrounding text, explanation or context.

"""

In [22]:
body = json.dumps({
    "messages": [
        {
            "role": "user",
            "content": [{"text": prompt_data}]
        }
    ],
    "inferenceConfig": {
        "maxTokens": 8192,
        "stopSequences": [],
        "temperature": 0,
        "topP": 0.9
    }
}) 

## Tarefa 5.4: invocar o modelo

In [None]:
modelId = "amazon.nova-lite-v1:0"
response = bedrock_client.invoke_model(body=body, modelId=modelId)
response_body = json.loads(response.get('body').read())
#output_list = response_body.get('content', [])[0].get("text", "")
output_list = response_body['output']['message']['content'][0]['text']
print(output_list)

##### <i aria-hidden="true" class="far fa-copy"></i> (Opcional) Copie o código gerado pela saída impressa e execute o código gerado pelo Bedrock na célula abaixo para validação.


Agora você experimentou o uso do `boto3` SDK, que fornece uma exposição básica à API do Amazon Bedrock. Com essa API, você gera um programa Python para analisar e visualizar determinados dados de vendas.



### Experimente você mesmo

- Altere os prompts para seu caso de uso específico e avalie o resultado de diferentes modelos.
- Teste o comprimento do token para entender a latência e a responsividade do serviço.
- Aplique diferentes princípios de engenharia de prompts para gerar resultados melhores.

### Limpeza

Você concluiu este caderno. Passe para a próxima parte do laboratório da seguinte forma:

- Feche este arquivo de caderno e continue com a **Tarefa 6**