# Fine-tuning LLMs

## Aprendizagem com contexto

O Aprendizado com contexto é uma técnica utilizada para melhorar o desempenho de modelos de linguagem, como o LLM (Large Language Model), por meio da inclusão de exemplos específicos de tarefas diretamente no prompt. Essencialmente, essa abordagem oferece ao modelo um "plano de ação" sobre o que se espera dele. Ao ser alimentado com exemplos relevantes dentro do contexto da solicitação, o modelo pode identificar padrões e adaptar suas respostas de maneira mais precisa e eficiente.

A grande vantagem do Aprendizado com contexto é que o modelo não precisa de treinamento adicional para compreender a tarefa em questão. Em vez disso, ele utiliza o contexto fornecido para inferir as melhores respostas com base nos exemplos apresentados.

### Como utilizar no ChatGPT

No ícone de perfil, selecione a opção *Personalizar ChatGPT*. Na primeira opção *O que você gostaria que o ChatGPT soubesse a seu respeito para dar melhores respostas* você pode adicionar um contexto para como o GPT pode conversar contigo.

Na outra opção, *Como o ChatGPT deveria responder*, você pode adicionar contexto para os tipos de saída, como o seguinte:

_"Se uma pergunta é de programação, responda com o código documentado e com estilo seguindo as melhores práticas de programação, como padrões de projeto, PEP8 e documentação no estilo Google."_

## Zero-shot / few-shots

A inferência "zero-shot" incorpora os dados de entrada diretamente no prompt, sem a necessidade de exemplos adicionais. Nesse caso, o modelo é solicitado a realizar a tarefa com base apenas no contexto fornecido, sem exemplos pré-executados. Isso pode ser eficaz em muitas situações, mas, caso os resultados desejados não sejam alcançados, podem ser usadas outras técnicas, como o _few-shots_.

A inferência "few-shot" adiciona múltiplos exemplos de auxílio. Essas abordagens ajudam modelos de LLMs a performar de maneira mais eficiente, pois fornecem um contexto mais claro sobre o que se espera como saída, orientando o modelo a gerar respostas mais precisas.

### Como utilizar no ChatGPT

Prompt inicial para dar o contexto:
```text
Você receberá uma linha de um arquivo CSV com informações do cartão de crédito. Divida essas informações em LAZER, NECESSIDADE e TRABALHO.

Retorne para mim um arquivo CSV com as colunas "código,informação".

Exemplo:

data,código,valor,tipo
03/09/2024,d5g489fc,-30.50,Compra no débito - Mercado Econômico
02/09/2024,c4f378db,20.00,Transferência recebida pelo Pix - LOJA DE DOCES
24/10/2024,j1m045li,-500.56,Transferência enviada pelo Pix - MERCADINHO
30/10/2024,f7i601he,-87.54,Compra no crédito - Posto XYZ

Saída esperada:

código,informação
d5g489fc,NECESSIDADE
c4f378db,LAZER
j1m045li,NECESSIDADE
f7i601he,TRABALHO

Faça essa modificação para a seguinte linha:

03/09/2024,e6h590gd,-6.89,Compra no débito - Estacionamento Central
```

A partir disso, qualquer entrada no formato definido será processada de acordo com a saída esperada, dependendo do tamanho do modelo.

Exemplos de entradas:
```text
data,valor,codigo,descricao
03/09/2024,-22.13,b900976c,Transferência enviada pelo Pix - MERCADINHO ESTRELA - 11.111.222/0001-33 - BANCO ABC (1234) Agência: 567 Conta: 101112-3
07/09/2024,-37.06,fae5940d,Compra no débito - Estacionamento Central
04/09/2024,21.36,9947be3d,Transferência recebida pelo Pix - LOJA DE DOCES - 44.777.888/0001-99 - BANCO TUV (4567) Agência: 876 Conta: 43210-9
04/09/2024,-64.95,31fc9376,Compra no débito - Restaurante Bella Vista
06/09/2024,-18.77,aeafab53,Compra no débito - Restaurante Gourmet
05/09/2024,-56.16,6f6ec6ae,Compra no crédito - Mercado Econômico
07/09/2024,-96.05,bd8d8e3c,Compra no crédito - Café Expresso
05/09/2024,12.12,325d56ea,Transferência enviada pelo Pix - LANCHONETE DO JOÃO - 33.555.666/0001-77 - BANCO PQR (9876) Agência: 321 Conta: 54321-0
02/09/2024,86.59,51950070,Transferência recebida pelo Pix - LOJA DE DOCES - 44.777.888/0001-99 - BANCO TUV (4567) Agência: 876 Conta: 43210-9
05/09/2024,42.93,3d9186dc,Transferência enviada pelo Pix - MERCADINHO ESTRELA - 11.111.222/0001-33 - BANCO ABC (1234) Agência: 567 Conta: 101112-3
```

## Fine-tuning supervisionado

As técnicas usadas anteriormente no prompt do usuário têm como objetivo otimizar a saída do modelo, ajustando-a melhor às preferências do usuário. O problema é que elas nem sempre funcionam, especialmente para LLMs menores. Assim, um fine-tuning dos pesos do modelo se faz necessário.

Ferramentas disponíveis: LangChain, LlamaIndex, Hugging Face Transformers...
