<a href="https://colab.research.google.com/github/lcbjrrr/genai/blob/main/00_RAG_NLP_GCPpt.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Fundamentos

##  Natural Language Processing (NLP)

O Processamento de Linguagem Natural (NLP) é um campo multidisciplinar na interseção da ciência da computação, inteligência artificial (IA) e linguística. Seu objetivo principal é permitir que os computadores compreendam, interpretem e gerem linguagem humana de uma forma significativa e útil. Isso envolve o desenvolvimento de algoritmos e modelos para processar dados brutos de texto e fala, permitindo que as máquinas realizem tarefas como tradução, análise de sentimentos, sumarização de texto e assistentes de voz. O NLP é fundamental para a forma como as pessoas interagem com a tecnologia, tornando os sistemas mais intuitivos e capazes de lidar com a complexidade e as nuances da comunicação humana.

## Language Neural Networks and Deep Learning


A aprendizagem profunda, baseada em redes neurais e especificamente em Redes Neurais Recorrentes (RNNs), revolucionou o Processamento de Linguagem Natural (PLN) ao permitir que os computadores compreendam a natureza sequencial da linguagem humana. Variantes de RNN, como LSTM e GRUs, utilizam um estado oculto interno (memória) para manter o contexto ao longo de uma sequência de palavras, superando a limitação das redes neurais padrão. Essa capacidade permite que elas se destaquem em tarefas sequenciais, como tradução automática (usando modelos codificador-decodificador), modelagem de linguagem para geração de texto e análise de sentimentos. Embora a arquitetura Transformer mais recente tenha se tornado dominante, as RNNs estabeleceram a base crucial da aprendizagem profunda para lidar com a complexidade, o contexto e as dependências inerentes aos dados textuais.

![](https://pbs.twimg.com/media/G55BA6oXIAA4x_y?format=jpg&name=900x900)

### A Feedforward Neural Network (FNN)

Uma rede neural de alimentação direta, frequentemente chamada de Rede Neural Feedforward (FNN), é o tipo mais simples de rede neural artificial. Em uma FNN, a informação se move em apenas uma direção — para frente — da camada de entrada, passando por quaisquer camadas ocultas, e finalmente chegando à camada de saída. Não há loops ou ciclos, o que significa que os dados fluem linearmente sem retornar ao início, tornando-as adequadas para tarefas como classificação e regressão, onde a entrada é mapeada diretamente para uma saída.

![](https://pbs.twimg.com/media/G55BMjMWwAAFIVf?format=png&name=360x360)

### Recurrent Neural Networks (RNNs)

Uma Rede Neural Recorrente (RNN) é um tipo de rede neural projetada especificamente para processar dados sequenciais, como texto, fala ou séries temporais. Ao contrário das Redes Feedforward, as RNNs possuem um loop que permite a passagem de informações de uma etapa da rede para a seguinte, efetivamente conferindo-lhes uma memória interna ou estado oculto. Essa memória permite que a rede considere o contexto dos elementos anteriores em uma sequência ao processar o elemento atual. Isso torna as RNNs particularmente adequadas para tarefas como processamento de linguagem natural (PLN), onde o significado de uma palavra depende fortemente das palavras que a precedem, permitindo que elas executem tarefas dependentes de sequência, como modelagem de linguagem e tradução automática.

![](https://pbs.twimg.com/media/G55B_46WMAA12ts?format=png&name=360x360)

In [6]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import SimpleRNN, Dense
text = "Deep learning, based on neural networks and specifically Recurrent Neural Networks (RNNs), revolutionized Natural Language Processing (NLP)"
chars = sorted(list(set(text)))
char_to_index = {char: i for i, char in enumerate(chars)}
index_to_char = {i: char for i, char in enumerate(chars)}
char_to_index

In [7]:
seq = text[0:0 + 3]
label = text[3]
print(seq,([char_to_index[char] for char in seq]))
print(label,char_to_index[label])

In [7]:
seq_length = 3
sequences = []
labels = []
for i in range(len(text) - seq_length):
    seq = text[i:i + seq_length]
    label = text[i + seq_length]
    sequences.append([char_to_index[char] for char in seq])
    labels.append(char_to_index[label])

X = np.array(sequences)
y = np.array(labels)
print(y)
X

In [7]:
X_one_hot = tf.one_hot(X, len(chars))
y_one_hot = tf.one_hot(y, len(chars))
y_one_hot

In [7]:
model = Sequential()
model.add(SimpleRNN(50, input_shape=(seq_length, len(chars)), activation='relu'))
model.add(Dense(len(chars), activation='softmax'))
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(X_one_hot, y_one_hot, epochs=100)

In [7]:
start_seq = "Deep learn"
generated_text = start_seq
x = np.array([[char_to_index[char] for char in generated_text[-seq_length:]]])
print(x)
x_one_hot = tf.one_hot(x, len(chars))
prediction = model.predict(x_one_hot)
print(prediction)
next_index = np.argmax(prediction)
print('i=',next_index)
index_to_char[next_index]

In [7]:
for i in range(60):
    x = np.array([[char_to_index[char] for char in generated_text[-seq_length:]]])
    x_one_hot = tf.one_hot(x, len(chars))
    prediction = model.predict(x_one_hot)
    next_index = np.argmax(prediction)
    next_char = index_to_char[next_index]
    generated_text += next_char

print("Generated Text:")
print(generated_text)

## T5 (Text-to-Text Transfer Transformer)

O modelo T5 (Text-to-Text Transfer Transformer), desenvolvido pelo Google AI, revolucionou o PNL (Processamento de Linguagem Natural) ao introduzir uma estrutura unificada onde cada tarefa linguística é tratada como um problema de texto para texto. Construído sobre a estrutura codificador-decodificador da arquitetura Transformer, o T5 consegue lidar com diversas tarefas — incluindo tradução, sumarização, resposta a perguntas e classificação — simplesmente fornecendo à entrada um prefixo específico da tarefa (por exemplo, "traduzir inglês para alemão: ...") e recebendo a saída como texto simples. Essa consistência simplifica o design do modelo e permite que um único modelo pré-treinado alcance resultados de última geração em diversos benchmarks após o ajuste fino.

![](https://pbs.twimg.com/media/G55IpcfW8AAYrY4?format=png&name=360x360)

Os Transformers são uma arquitetura de rede neural poderosa que utiliza um **mecanismo de atenção** para ponderar a importância de diferentes partes dos dados de entrada, permitindo-lhes processar sequências em paralelo e capturar eficientemente dependências de longo alcance, tornando-se a base para modelos de linguagem modernos de grande escala como o BERT e o GPT.

![](https://pbs.twimg.com/media/G55JZMnXAAAgub2?format=jpg&name=900x900)

In [None]:
# !pip install transformers torch sentencepiece

In [7]:
from transformers import T5Tokenizer, T5ForConditionalGeneration
import torch
model_name = "t5-small"
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)

Modelo de linguagem T5 para tarefas de texto para texto. Importa os componentes necessários da biblioteca transformers, especifica o modelo pré-treinado t5-small e, em seguida, inicializa tanto o tokenizador (para converter texto em IDs numéricos) quanto o próprio modelo a partir dessa versão pré-treinada.



In [7]:
input_text = "translate English to German: Good morning"
inputs = tokenizer(input_text, return_tensors="pt") #PyTorch
inputs

In [7]:
translation_ids = model.generate(inputs.input_ids, max_length=50, num_beams=5, early_stopping=True)
print(translation_ids)
translation_text = tokenizer.decode(translation_ids[0], skip_special_tokens=True)
print("Translation:", translation_text)

Um tokenizador e modelo T5 para realizar tradução automática. Ele tokeniza o texto de entrada ('traduzir inglês para alemão: Bom dia'), gera IDs de tradução usando o modelo T5 pré-treinado e, em seguida, decodifica esses IDs de volta para um texto legível por humanos, finalmente imprimindo a frase traduzida em alemão.

In [7]:
!pip install google-generativeai

In [7]:
import google.generativeai as genai
import os
GCP_MODEL = 'gemini-2.5-flash'
GOOGLE_API_KEY=your-key
#os.environ["GOOGLE_API_KEY"] = GOOGLE_API_KEY
genai.configure(api_key=GOOGLE_API_KEY)
model = genai.GenerativeModel(GCP_MODEL)

response = model.generate_content(
    contents="Explain large language models in one sentence."
)
print(response.text)

#### AWS

In [7]:
!pip install boto3

In [7]:
import os
AWS_REGION = 'us-east-1'
os.environ['AWS_ACCESS_KEY_ID'] = yourid
os.environ['AWS_SECRET_ACCESS_KEY'] = your-key
os.environ['AWS_DEFAULT_REGION'] = AWS_REGION

model_id = "anthropic.claude-3-5-sonnet-20240620-v1:0"

import boto3
import os
print("Checking credentials...")
print(f"Access Key ID: {os.environ.get('AWS_ACCESS_KEY_ID', 'NOT SET')}")
print(f"Secret Key: {os.environ.get('AWS_SECRET_ACCESS_KEY', 'NOT SET')[:10]}... (hidden)")
print(f"Region: {os.environ.get('AWS_DEFAULT_REGION', 'NOT SET')}")
sts = boto3.client('sts')
identity = sts.get_caller_identity()
print("\n✅ Credentials are VALID!")
print(f"Account: {identity['Account']}")
print(f"User ARN: {identity['Arn']}")

In [7]:

import boto3

client = boto3.client("bedrock-runtime", region_name=AWS_REGION)

user_message = "In single sentence, what are LLMs?"
conversation = [{"role": "user","content": [{"text": user_message}]}]
response = client.converse(
    modelId=model_id,
    messages=conversation,
    inferenceConfig={"maxTokens": 512, "temperature": 0.5},
)

print(response["output"]["message"]["content"][0]["text"])

### OpenAI

In [7]:
from openai import OpenAI
from google.colab import userdata

# Retrieve the API key from Colab secrets
#OPENAI_API_KEY = ""#userdata.get('OPENAI_API_KEY')
OPENAI_API_KEY = your-key
client = OpenAI(api_key=OPENAI_API_KEY)
sys_msg = 'You are a GenAI expert. That will explain concepts to a layman audience'
prompt_question = "In a sentence, what is the difference from Deep Learning?"

response = client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": sys_msg},
        {"role": "user", "content": "In a sentence, what are LLMs"},
        {"role": "assistant", "content": "LLMs are advanced artificial intelligence systems trained on vast amounts of text data to understand and generate human-like language."},
        {"role": "user", "content": prompt_question}
    ],
    temperature=0.9,
    max_tokens=1000
)

print(response.choices[0].message.content)



---



# Atividade: Tradução de Máquina






Atividade: Tradução de Máquina

Esta tarefa tem como objetivo que os alunos explorem e comparem a eficácia de diferentes ferramentas de tradução na conversão de textos que contêm terminologia específica de domínio de negócio. O aluno deve selecionar um texto-fonte curto (ate 5 paginas) rico em jargões técnicos de uma área de negócio, e em seguida, utilizar três ferramentas de tradução distintas, para traduzir esse texto para duas línguas de destino. A etapa crucial será a análise comparativa dos resultados, onde o foco deve estar na precisão terminológica dos termos de negócio, na coerência e na fluidez do texto traduzido. Finalmente, o aluno deverá elaborar um breve relatório que detalhe qual ferramenta demonstrou a melhor (e pior) performance na manutenção do significado e da precisão técnica do vocabulário especializado.

Desafío:  Como um desafio extra, reflita sobre as diferenças entre traduzir um texto corrido e traduzir o conteúdo de uma apresentação de slides (PowerPoint ou Google Slides).