# Capítulo 01 – Entendendo os LLMs
Este notebook explora os conceitos fundamentais apresentados no Capítulo 01 do livro *Build a Large Language Model (From Scratch)*.

## 1.1 O que é um LLM?
- LLMs são modelos de rede neural profunda que geram texto previsível com base em grandes conjuntos de dados.
- Utilizam arquitetura Transformer e aprendizado auto-supervisionado.
- São modelos generativos (GenAI), como o ChatGPT.

## 1.2 Aplicações dos LLMs
- Tradução, resumo, geração de texto, criação de código, assistentes virtuais e muito mais.
- Capacidade de responder perguntas complexas e interagir em linguagem natural.

## 1.3 Etapas da Construção de um LLM
- **Pretraining**: modelo aprende padrões gerais da linguagem com dados não rotulados.
- **Fine-tuning**: modelo é ajustado para tarefas específicas com dados rotulados.
- Vantagens dos LLMs personalizados: privacidade, performance local e flexibilidade.

## 1.4 Arquitetura Transformer
- Composta por Encoder e Decoder (GPT usa apenas o Decoder).
- Mecanismo de *self-attention* permite o modelo focar em partes relevantes do texto.
- GPT é autoregressivo, gerando uma palavra por vez.

## 1.5 Utilização de Grandes Datasets
- GPT-3 treinado com ~300 bilhões de tokens (WebText2, CommonCrawl, Wikipedia, Books).
- Alto custo computacional (milhões de dólares).
- Alternativas open-source e datasets públicos são opções viáveis para estudos.

## 1.6 Arquitetura do GPT
- GPT é baseado somente no Decoder do Transformer.
- Treinado com tarefa de *next-word prediction*.
- Possui propriedades emergentes como tradução e zero/few-shot learning.

## 1.7 Construindo um LLM
- Três etapas principais:
  1. Preparação dos dados + mecanismo de atenção
  2. Pretraining (modelo base)
  3. Fine-tuning (tarefa específica)
- Implementações serão abordadas nos próximos capítulos.

In [1]:
# Exemplo simples de geração de sequência
sequencia = ['O', 'modelo', 'está', 'funcionando']
sequencia.append('bem!')
print(' '.join(sequencia))

O modelo está funcionando bem!


## Usando um LLM via Hugging Face

In [2]:
# exemplo de uso de um modelo GPT disponível no Hugging Face
from transformers import pipeline
pipe = pipeline("text-generation", model="GPT2")
response = pipe("The book is on")
response[0]["generated_text"]

  from .autonotebook import tqdm as notebook_tqdm
Setting `pad_token_id` to `eos_token_id`:None for open-end generation.


'The book is on Kindle here.\n\nI wish I would have read that earlier because I would have found it fascinating. But instead, I found it a bit too light and long for my tastes, for me. And I hate being a reader'

In [3]:
# exemplo de uso de um modelo do tipo BERT
from transformers import pipeline
pipe = pipeline('fill-mask', model="distilbert/distilbert-base-uncased")
response = pipe("The book is on the [MASK]")
for item in response:
    print(item["sequence"])

the book is on the internet
the book is on the.
the book is on the shelf
the book is on the list
the book is on the map


In [None]:
# exemplo de um modelo BERT ajustado (fine-tunning), que preve a quantidade de Story Points a partir do texto da User Story
from transformers import pipeline
pipe = pipeline('text-classification', model="giseldo/distilbert_bert_uncased_finetuned_story_point")
response = pipe("I want register a product with name and price")
response

[{'label': 'LABEL_0', 'score': 3.795095920562744}]