# Tarefa 2a: resumo de textos com arquivos pequenos com o Titan Text Premier


Neste caderno, voc√™ vai ingerir uma pequena sequ√™ncia de texto diretamente na API do Amazon Bedrock (usando o modelo do Titan Text) e vai instru√≠-la a resumir o texto de entrada. Voc√™ pode aplicar essa abordagem para resumir transcri√ß√µes de chamadas, transcri√ß√µes de reuni√µes, livros, artigos, publica√ß√µes de blogs e outros conte√∫dos relevantes quando o tamanho do texto de entrada estiver dentro dos limites de tamanho do contexto do modelo.

## Tarefa 2a.1: configurar o ambiente

Nesta tarefa, voc√™ configurar√° o ambiente.

In [34]:
#Create a service client by name using the default session.
import json
import os
import sys
import warnings

import boto3
import botocore
from IPython.display import Markdown, display

warnings.filterwarnings('ignore')
module_path = ".."
sys.path.append(os.path.abspath(module_path))

bedrock_client = boto3.client('bedrock-runtime',region_name=os.environ.get("AWS_DEFAULT_REGION", None))



## Tarefa 2a.2: escrever prompt com o texto a ser resumido

Nesta tarefa, voc√™ usar√° um pequeno trecho do texto com menos tokens do que o tamanho m√°ximo permitido pelo modelo de base. Como exemplo de texto de entrada para este laborat√≥rio, voc√™ usa um par√°grafo de uma [postagem do Blog da AWS] (https://aws.amazon.com/jp/blogs/machine-learning/announcing-new-tools-for-building-with-generative-ai-on-aws/) que anuncia o Amazon Bedrock.

O prompt come√ßa com uma instru√ß√£o `Please provide a summary of the following text.`. 

In [35]:
prompt_data = """

Por favor, forne√ßa um resumo do seguinte texto:

A AWS analisou todos os feedbacks dos clientes e hoje temos o prazer de anunciar o Amazon Bedrock, \
um novo servi√ßo que torna os FMs da AI21 Labs, Anthropic, Stability AI e Amazon acess√≠veis por meio de uma API. \
O Bedrock √© a maneira mais f√°cil para os clientes criarem e escalarem aplicativos baseados em IA generativa usando FMs, \
democratizando o acesso para todos os desenvolvedores. \
O Bedrock oferecer√° a capacidade de acessar uma variedade de FMs poderosos para texto e imagens \
 ‚Äî incluindo os FMs Titan da Amazon, que consistem em dois novos LLMs que tamb√©m estamos anunciando hoje \
 ‚Äî por meio de um servi√ßo gerenciado da AWS escal√°vel, confi√°vel e seguro. Com a experi√™ncia serverless da Bedrock, \
os clientes podem encontrar facilmente o modelo certo para o que est√£o tentando realizar, come√ßar rapidamente, \
personalizar os FMs de forma privada com seus pr√≥prios dados e integr√°-los e implant√°-los facilmente em seus \
aplicativos usando as ferramentas e recursos da AWS com os quais j√° est√£o familiarizados, sem precisar gerenciar \
nenhuma infraestrutura (incluindo integra√ß√µes com recursos do Amazon SageMaker ML, como Experimentos para testar \
diferentes modelos e Pipelines para gerenciar seus FMs em escala).
"""

## Tarefa 2a.3: Criar corpo da solicita√ß√£o com par√¢metros de infer√™ncia e prompt 

Nesta tarefa, voc√™ criar√° o corpo do prompt com os par√¢metros de infer√™ncia e prompt acima.

In [51]:
# request body - Amazon Nova format
body = json.dumps({
    "messages": [
        {
            "role": "user",
            "content": [{"text": prompt_data}]
        }
    ],
    "inferenceConfig": {
        "maxTokens": 1000,
        "temperature": 0.7
    }
})

## Tarefa 2a.4: Invocar o modelo de base via Boto3

Nesta tarefa, voc√™ enviar√° uma solicita√ß√£o de API para o Amazon Bedrock especificando os par√¢metros da solicita√ß√£o: `modelId`, `accept` e `contentType`. Ap√≥s o prompt fornecido, o modelo de base no Amazon Bedrock resume o texto de entrada.

### Concluir gera√ß√£o de sa√≠da

Por padr√£o, o servi√ßo Amazon Bedrock gera o resumo completo de um determinado prompt em uma √∫nica sa√≠da. Pode demorar se a sa√≠da do modelo contiver muitos tokens. 

In [53]:
#model configuration and invoke the model
modelId = 'amazon.nova-lite-v1:0' # Amazon Nova 
accept = 'application/json'
contentType = 'application/json'
outputText = "\n"

try:
    response = bedrock_client.invoke_model(body=body, modelId=modelId, accept=accept, contentType=contentType)
    response_body = json.loads(response.get('body').read())
    
    # Nova usa formato diferente - verifique a estrutura da resposta
    print("Estrutura da resposta:", response_body.keys())
    
    # Tente extrair o texto (formato pode variar)
    if 'output' in response_body:
        outputText = response_body['output']['message']['content'][0]['text']
    elif 'outputText' in response_body:
        outputText = response_body['outputText']
    else:
        print("Resposta completa:", response_body)
        
    #print(outputText)
    display(Markdown(outputText))

except Exception as e:
    print(f"Erro: {e}")

Estrutura da resposta: dict_keys(['output', 'stopReason', 'usage'])


A AWS anunciou o lan√ßamento do Amazon Bedrock, um novo servi√ßo que facilita o acesso a modelos de intelig√™ncia artificial (IA) de empresas como AI21 Labs, Anthropic, Stability AI e da pr√≥pria Amazon por meio de uma API. O Bedrock visa democratizar o uso de IA generativa, permitindo que desenvolvedores criem e escalem aplicativos com modelos de linguagem (LLMs) e modelos de imagem de forma r√°pida e segura. O servi√ßo oferece modelos gerenciados pela AWS, incluindo os novos modelos Titan da Amazon, e elimina a necessidade de gerenciar infraestrutura. Com integra√ß√µes com o Amazon SageMaker, os usu√°rios podem testar e gerenciar modelos em escala.

In [42]:
# Exibir contagem de tokens
if 'usage' in response_body:
    input_tokens = response_body['usage'].get('inputTokens', 0)
    output_tokens = response_body['usage'].get('outputTokens', 0)
    total_tokens = input_tokens + output_tokens
    
    print(f"\n{'='*50}")
    print(f"üìä RESUMO DE TOKENS")
    print(f"{'='*50}")
    print(f"Tokens de entrada:  {input_tokens}")
    print(f"Tokens de sa√≠da:    {output_tokens}")
    print(f"Total:              {total_tokens}")
    print(f"{'='*50}\n")


üìä RESUMO DE TOKENS
Tokens de entrada:  289
Tokens de sa√≠da:    184
Total:              473



### Transmitir gera√ß√£o de sa√≠da

Em seguida, voc√™ ver√° como usar a API invoke_model_with_response_stream do Amazon Bedrock para transmitir sa√≠das do modelo para que os usu√°rios possam consumi-las conforme s√£o geradas. Em vez de gerar a sa√≠da completa de uma s√≥ vez, essa API retorna um ResponseStream que envia blocos de sa√≠da menores do modelo conforme s√£o produzidos. Voc√™ pode exibir essas sa√≠das de transmiss√£o em uma visualiza√ß√£o cont√≠nua e consum√≠vel.

In [44]:
#invoke model with response stream
modelId = 'amazon.nova-lite-v1:0'
response = bedrock_client.invoke_model_with_response_stream(body=body, modelId=modelId, accept=accept, contentType=contentType)

stream = response.get('body')
output = list(stream)
output

[{'chunk': {'bytes': b'{"messageStart":{"role":"assistant"}}'}},
 {'chunk': {'bytes': b'{"contentBlockDelta":{"delta":{"text":"A"},"contentBlockIndex":0}}'}},
 {'chunk': {'bytes': b'{"contentBlockStop":{"contentBlockIndex":0}}'}},
 {'chunk': {'bytes': b'{"contentBlockDelta":{"delta":{"text":" AWS anuncio"},"contentBlockIndex":1}}'}},
 {'chunk': {'bytes': b'{"contentBlockStop":{"contentBlockIndex":1}}'}},
 {'chunk': {'bytes': b'{"contentBlockDelta":{"delta":{"text":"u o"},"contentBlockIndex":2}}'}},
 {'chunk': {'bytes': b'{"contentBlockStop":{"contentBlockIndex":2}}'}},
 {'chunk': {'bytes': b'{"contentBlockDelta":{"delta":{"text":" Amazon Bedrock, um"},"contentBlockIndex":3}}'}},
 {'chunk': {'bytes': b'{"contentBlockStop":{"contentBlockIndex":3}}'}},
 {'chunk': {'bytes': b'{"contentBlockDelta":{"delta":{"text":" servi\xc3\xa7o"},"contentBlockIndex":4}}'}},
 {'chunk': {'bytes': b'{"contentBlockStop":{"contentBlockIndex":4}}'}},
 {'chunk': {'bytes': b'{"contentBlockDelta":{"delta":{"text"

In [48]:
from IPython.display import display_markdown,Markdown,clear_output

In [71]:
modelId = 'amazon.nova-lite-v1:0'
response = bedrock_client.invoke_model_with_response_stream(body=body, modelId=modelId, accept=accept, contentType=contentType)
stream = response.get('body')
output = []
i = 1

print("Processando stream da resposta...\n")
if stream:
    for event in stream:
        chunk = event.get('chunk')
        if chunk:
            chunk_obj = json.loads(chunk.get('bytes').decode())
            
            # Processa contentBlockDelta (texto real)
            if 'contentBlockDelta' in chunk_obj:
                text = chunk_obj['contentBlockDelta']['delta']['text']
                output.append(text)
                i += 1
            
            # Processa metadata (tokens)
            elif 'metadata' in chunk_obj:
                print(f"Total tokens: {usage.get('inputTokens', 0) + usage.get('outputTokens', 0)}")

# Exibir sa√≠da completa formatada
print('\n\t\t\x1b[31m**RESUMO COMPLETO**\x1b[0m\n')
complete_output = ''.join(output)
display(Markdown(complete_output))

Processando stream da resposta...

Total tokens: 458

		[31m**RESUMO COMPLETO**[0m



A AWS anunciou o lan√ßamento do Amazon Bedrock, um servi√ßo que facilita o acesso e uso de modelos de intelig√™ncia artificial (IA) de diversas empresas, incluindo AI21 Labs, Anthropic, Stability AI e Amazon, atrav√©s de uma API. Este servi√ßo tem como objetivo democratizar o uso de IA generativa para desenvolvedores de todas as habilidades, permitindo que eles criem e escalem aplicativos baseados em IA de forma mais f√°cil. O Bedrock oferece acesso a uma variedade de modelos de linguagem (LLMs) e de gera√ß√£o de imagens, incluindo os novos modelos Titan da Amazon, tudo gerenciado por um servi√ßo escal√°vel, confi√°vel e seguro da AWS. Os usu√°rios podem facilmente encontrar modelos adequados para suas necessidades, come√ßar rapidamente, personalizar os modelos com seus pr√≥prios dados e integrar esses modelos em seus aplicativos usando as ferramentas e recursos familiares da AWS, sem a necessidade de gerenciar a infraestrutura subjacente. O servi√ßo tamb√©m inclui integra√ß√µes com recursos do Amazon SageMaker para testes e gerenciamento de modelos em escala.

Voc√™ testou o uso do SDK boto3 para acessar a API do Amazon Bedrock. Esse SDK fornece acesso program√°tico b√°sico aos recursos do Bedrock. Ao usar essa API, voc√™ conseguiu implementar dois casos de uso: 1) Gerar um resumo de texto completo do conte√∫do de not√≠cias da AWS de uma s√≥ vez e 2) Transmitir a sa√≠da resumida em blocos para processamento incremental.

### Experimente voc√™ mesmo
- Altere os prompts para seu caso de uso espec√≠fico e avalie o resultado de diferentes modelos.
- Teste o comprimento do token para entender a lat√™ncia e a responsividade do servi√ßo.
- Aplique diferentes princ√≠pios de engenharia de prompts para gerar resultados melhores.

### Limpeza

Voc√™ concluiu este caderno. Passe para a pr√≥xima parte do laborat√≥rio da seguinte forma:

- Feche este arquivo de caderno e continue com **Task2b.ipynb**.