# Inteligência Artificial Generativa

## 1. Conceitos Fundamentais de IA Generativa

A **IA Generativa** é uma área da inteligência artificial focada em **criar novos conteúdos** (texto, imagem, áudio, vídeo, código etc.) que **imitam padrões aprendidos** a partir de dados existentes.

### Características principais:
- Baseia-se em **modelos probabilísticos** que aprendem a distribuição dos dados.  
- Capaz de **gerar amostras novas** e realistas.  
- Modelos populares incluem:
  - **GANs (Generative Adversarial Networks)**
  - **VAEs (Variational Autoencoders)**
  - **Transformers (como GPT, BERT, T5, etc.)**

### Aplicações:
- Geração de texto (ChatGPT, Bard)
- Síntese de imagens (DALL·E, Stable Diffusion)
- Criação de música e voz sintética
- Simulações em pesquisa científica

---

## 2. Conceitos Fundamentais de NLP (Processamento de Linguagem Natural)

O **NLP (Natural Language Processing)** é a área da IA voltada para permitir que máquinas **compreendam, interpretem e gerem linguagem humana**.

### Tarefas clássicas:
- **Tokenização**: dividir texto em palavras ou subpalavras.  
- **Lematização e stemming**: reduzir palavras à sua forma base.  
- **POS Tagging**: identificar classes gramaticais.  
- **Named Entity Recognition (NER)**: detectar nomes de pessoas, lugares, organizações.  
- **Tradução automática, sumarização e geração de texto.**

O NLP moderno é dominado por **modelos baseados em Transformers**, que superaram RNNs e LSTMs.

---

## 3. Arquitetura Transformer

A arquitetura **Transformer** (Vaswani et al., 2017) revolucionou o NLP e a IA generativa.

### Ideia central:
Em vez de processar tokens sequencialmente (como RNNs), o Transformer usa **atenção** para processar todos os tokens **em paralelo**, capturando dependências longas com eficiência.

### Componentes principais:

- **Self-Attention**: mede a importância relativa entre tokens.  
  $$
  \text{Attention}(Q, K, V) = \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)V
  $$

- **Multi-Head Attention**: múltiplas “cabeças” aprendem diferentes relações contextuais.  
- **Feedforward Networks**: camadas não lineares aplicadas após atenção.  
- **Positional Encoding**: adiciona informações de ordem à sequência.  

Transformers são a base de modelos como **GPT**, **BERT**, **T5**, **LLaMA**, entre outros.

---

## 4. In-Context Learning

O **In-Context Learning (ICL)** é a capacidade de um modelo **aprender novas tarefas apenas a partir do contexto do prompt**, sem ajustar seus pesos.

### Exemplo:

Traduza para inglês:
"Olá" → "Hello"
"Bom dia" → ?

O modelo infere o padrão e completa com "Good morning" — sem reentreinamento.

Isso é possível porque modelos grandes armazenam padrões gerais durante o treinamento, e o prompt fornece **instruções implícitas**.

---

## 5. RAGs e Bancos de Dados Vetoriais

**RAG (Retrieval-Augmented Generation)** combina **busca** e **geração de texto**.

### Etapas:
1. O prompt do usuário é convertido em um **vetor de embeddings**.  
2. Esse vetor é comparado a uma **base vetorial** (ex: FAISS, Pinecone, Weaviate) para buscar os documentos mais relevantes.  
3. Esses documentos são **injetados no contexto** do modelo generativo para enriquecer a resposta.

### Benefícios:
- Permite **respostas atualizadas e contextuais**.  
- Reduz **alucinações** de LLMs.  
- Não exige reentreinamento do modelo base.

---

## 6. Técnicas de Engenharia de Prompt

A **Prompt Engineering** é a arte de **formular instruções** de forma a extrair melhores respostas de um LLM.

### Tipos de técnicas:
- **Zero-shot**: apenas a instrução direta.  
- **Few-shot**: exemplos de entrada e saída no prompt.  
- **Chain-of-Thought (CoT)**: instruir o modelo a "pensar passo a passo".  
- **Role prompting**: atribuir papéis ao modelo ("Você é um professor de física...").  
- **Self-consistency**: gerar múltiplas respostas e escolher a mais coerente.  

---

## 7. Técnicas de Treinamento e Fine-Tuning

Modelos generativos são treinados em grandes corpora de texto para prever o próximo token:

$$
\max_\theta \sum_{(x,y)} \log P_\theta(y|x)
$$

### Fases:
- **Pré-treinamento**: aprendizado genérico de linguagem.  
- **Fine-tuning**: especialização em tarefas específicas.  
  - Pode ser **supervisionado** (com pares entrada–saída).  
  - Ou **instruído** (Instruction tuning), com prompts e respostas humanas.  

Outras abordagens incluem:
- **Adapter tuning**: pequenas camadas ajustáveis inseridas no modelo.  
- **LoRA (Low-Rank Adaptation)**: atualiza apenas decomposições de matrizes.

---

## 8. Quantization

A **quantização** reduz o tamanho e o custo computacional de modelos.

### Conceito:
Reduz a precisão numérica dos pesos (por exemplo, de 32 bits → 8 bits), mantendo desempenho próximo do original.

### Benefícios:
- Menor uso de memória.  
- Inferência mais rápida.  
- Ideal para dispositivos com hardware limitado.

Exemplos: **8-bit quantization**, **4-bit quantization**, **mixed precision**.

---

## 9. Embeddings

Um **embedding** é uma representação vetorial densa de um elemento (palavra, sentença, imagem, etc.) em um espaço contínuo.

### Intuição:
Palavras ou objetos com significados semelhantes têm **vetores próximos** no espaço de embeddings.

### Propriedades:
- Calculados por modelos como **Word2Vec**, **BERT**, ou **SentenceTransformers**.  
- Usados em RAGs, busca semântica, e clustering de textos.

---

## 10. RLHF (Reinforcement Learning from Human Feedback)

O **RLHF** é o processo que ensina modelos a **seguir preferências humanas**.

### Etapas:
1. **Fine-tuning supervisionado**: o modelo aprende com exemplos de respostas humanas.  
2. **Treino de um modelo de recompensa**: humanos avaliam respostas → modelo aprende o que é “melhor”.  
3. **Treino via PPO (Proximal Policy Optimization)**:
   O modelo é ajustado para **maximizar a recompensa** prevista, equilibrando aprendizado e estabilidade.

RLHF é usado em modelos como o ChatGPT para tornar as respostas **mais seguras e úteis**.

---

## 11. Safeguards e Guardrails

**Safeguards** e **guardrails** são mecanismos que **limitam comportamentos indesejados** em modelos generativos.

### Estratégias:
- **Filtragem de prompts e saídas** (detecção de linguagem ofensiva, sensível, etc.)  
- **Classificadores de segurança** para evitar instruções perigosas.  
- **Red teaming**: testar o modelo contra tentativas de exploração.  
- **Content moderation** e **políticas éticas** integradas.  

Essas técnicas garantem que os modelos sejam **seguros, éticos e alinhados aos valores humanos**.

---

## Resumo Visual (estrutura conceitual)


## Resumo Estrutural dos Conceitos de IA Generativa

IA Generativa
|
├── NLP (Processamento de Linguagem Natural)
|     ├── Tokenização
|     ├── Lematização
|     ├── Modelos baseados em Transformers
|     └── Representações semânticas (embeddings)
|
├── Modelos Generativos
|     ├── GPT / BERT / T5 / LLaMA
|     ├── Treinamento e Fine-tuning
|     |     ├── Supervisionado
|     |     ├── Instruction tuning
|     |     └── RLHF (Reinforcement Learning from Human Feedback)
|     ├── Quantization (redução de precisão dos pesos)
|     └── In-Context Learning (aprendizado via prompt)
|
├── RAG (Retrieval-Augmented Generation)
|     ├── Conversão do prompt em embeddings
|     ├── Busca em banco de dados vetorial
|     ├── Recuperação dos documentos relevantes
|     └── Geração aumentada de respostas
|
├── Engenharia de Prompt
|     ├── Zero-shot
|     ├── Few-shot
|     ├── Chain-of-Thought
|     ├── Role prompting
|     └── Self-consistency
|
└── Segurança e Controle
      ├── Guardrails (regras de comportamento)
      ├── Safeguards (mecanismos de proteção)
      ├── Classificadores de segurança
      └── Moderação de conteúdo
