# Fine Tuning - Exemplo

### Preparação de dados

Nessa célula é utilizado as libs `json` e `os` para carregar os dados .json já gerados manualmente para treinamento do modelo.

In [13]:
import json
import os

diretorio_atual = os.getcwd()
caminho_arquivo_json = os.path.join(diretorio_atual, 'DATA', 'train_data.json')

try:
    with open(caminho_arquivo_json, 'r', encoding='utf-8') as arquivo:
        dados = json.load(arquivo)
    print("Dados carregados com sucesso:")
    print(dados)
except FileNotFoundError:
    print(f"O arquivo {caminho_arquivo_json} não foi encontrado.")
except json.JSONDecodeError:
    print(f"O arquivo {caminho_arquivo_json} não contém um JSON válido.")
    
diretorio = os.getcwd()  
subdir = "FINE TUNING/DATA"
caminho_subdir = os.path.join(diretorio, subdir)

output_dir = caminho_subdir

Dados carregados com sucesso:
[{'context': 'Dia 01/08/2024 eu passei muita raiva fazendo o código de fine-tuning, as coisas tavam dando muito errado!', 'qas': [{'id': '00001', 'is_impossible': False, 'question': 'Quando eu passei raiva com fine-tuning?', 'answers': [{'text': 'Dia 01/08/2024', 'answer_start': 0}]}, {'id': '00002', 'is_impossible': False, 'question': 'O que aconteceu dia 01/08/2024?', 'answers': [{'text': 'eu passei muita raiva fazendo o código de fine-tuning', 'answer_start': 15}]}, {'id': '00003', 'is_impossible': False, 'question': 'Por que eu tava passando raiva fazendo código de fine-tuning?', 'answers': [{'text': 'As coisas tavam dando muito errado', 'answer_start': 70}]}]}, {'context': 'Eu estava muito doente no dia 31/07/2023, tive que passar o dia todo acamado, faltei até o trabalho e a faculdade.', 'qas': [{'id': '00004', 'is_impossible': False, 'question': 'Quando eu estava muito doente?', 'answers': [{'text': 'no dia 31/07/2023', 'answer_start': 23}]}, {'id':

De fato é uma base de dados EXTREMAMENTE pequena para esse tipo de problema, mas a ideia é mostrar o que esse método é capaz em largas escalas.

Portanto, de nossos 6 itens da base, 4 serão utilizados para treinar o modelo, e 2 para testar.

In [20]:
train_data = dados[:3]
test_data  = dados[4:]

### Modelo de Perguntas e Respostas

Para de fato realizar o ajuste fino, utilizaremos a lib `simpletransformers`, e pegaremos o modelo transformer pré-treinado em BERT, `QuestionAnsweringModel`.

In [16]:
from simpletransformers.question_answering import QuestionAnsweringModel

Aqui eu indico o path onde meu modelo será salvo posteriormente.

In [17]:
import os

diretorio = os.getcwd()  
subdir = "DATA"
caminho_subdir = os.path.join(diretorio, subdir)

output_dir = caminho_subdir

Agora que temos tudo pronto, o modelo é instanciado e passado seus parâmetros e dados para iniciar seu treinamento.

In [18]:
train_args = {
    "reprocess_input_data": True,
    "overwrite_output_dir": True,
    "use_cached_eval_features": True,
    "output_dir": f"outputs/bert",
    "best_model_dir": f"{output_dir}/bert/best_model",
    "evaluate_during_training": True,
    "max_seq_length": 128,
    "num_train_epochs": 100,
    "evaluate_during_training_steps": 1000,
    "save_model_every_epoch": False,
    "save_eval_checkpoints": False,
    "n_best_size": 8,
    "train_batch_size": 16,
    "eval_batch_size": 16
}

model = QuestionAnsweringModel( "bert","bert-base-uncased", args=train_args, use_cuda=False)
model.train_model(train_data, eval_data=test_data)

Some weights of BertForQuestionAnswering were not initialized from the model checkpoint at bert-base-uncased and are newly initialized: ['qa_outputs.bias', 'qa_outputs.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
convert squad examples to features: 100%|██████████| 10/10 [00:00<00:00, 904.71it/s]
add example index and unique id: 100%|██████████| 10/10 [00:00<?, ?it/s]
Epochs 1/100. Running Loss:    5.0355: 100%|██████████| 1/1 [00:06<00:00,  6.27s/it]
Running Evaluation: 100%|██████████| 1/1 [00:01<00:00,  1.10s/it]
Epochs 2/100. Running Loss:    5.0039: 100%|██████████| 1/1 [00:06<00:00,  6.22s/it]
Running Evaluation: 100%|██████████| 1/1 [00:01<00:00,  1.13s/it]
Epochs 3/100. Running Loss:    4.8816: 100%|██████████| 1/1 [00:06<00:00,  6.40s/it]
Running Evaluation: 100%|██████████| 1/1 [00:01<00:00,  1.11s/it]
Epochs 4/100. Running Loss:    4.6517: 100%|██████████| 1/1 [00:06<00:00,  6.27s/it]
Running Evaluati

(100,
 {'global_step': [1,
   2,
   3,
   4,
   5,
   6,
   7,
   8,
   9,
   10,
   11,
   12,
   13,
   14,
   15,
   16,
   17,
   18,
   19,
   20,
   21,
   22,
   23,
   24,
   25,
   26,
   27,
   28,
   29,
   30,
   31,
   32,
   33,
   34,
   35,
   36,
   37,
   38,
   39,
   40,
   41,
   42,
   43,
   44,
   45,
   46,
   47,
   48,
   49,
   50,
   51,
   52,
   53,
   54,
   55,
   56,
   57,
   58,
   59,
   60,
   61,
   62,
   63,
   64,
   65,
   66,
   67,
   68,
   69,
   70,
   71,
   72,
   73,
   74,
   75,
   76,
   77,
   78,
   79,
   80,
   81,
   82,
   83,
   84,
   85,
   86,
   87,
   88,
   89,
   90,
   91,
   92,
   93,
   94,
   95,
   96,
   97,
   98,
   99,
   100],
  'correct': [0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,
   0,

### Análise do Modelo

In [19]:
model = QuestionAnsweringModel("bert", f"{output_dir}/bert/best_model" ,use_cuda=False)

to_predict = [
       {
        "context": "Tenho um hobby de colecionar moedas antigas. Meu acervo inclui moedas de várias épocas e países, com destaque para algumas peças raras da era imperial. Frequentemente, participo de feiras de colecionadores para encontrar novas adições para minha coleção.",
        "qas": [
            {
                "question": "Onde você costuma procurar novas moedas para sua coleção?",
                "id": "0",
            },
        ]
     }
]

answers, probabilities = model.predict(to_predict, n_best_size=None)

print()
for i in range(len(answers[0]['answer'])):
    print(f"Resposta: {answers[0]['answer'][i]}")
    print(f"Probabilidade de estar correta: {probabilities[0]['probability'][i]}")
    print()

convert squad examples to features: 100%|██████████| 1/1 [00:00<00:00, 500.22it/s]
add example index and unique id: 100%|██████████| 1/1 [00:00<?, ?it/s]
Running Prediction: 100%|██████████| 1/1 [00:00<00:00,  3.70it/s]


Possíveis respostas do meu modelo:
Resposta: Tenho um hobby de colecionar moedas antigas. Meu acervo inclui moedas de várias épocas e países, com destaque para algumas peças raras da era imperial. Frequentemente, participo de feiras de colecionadores para encontrar novas adições para minha coleção.
Probabilidade de estar correta: 0.3440751218393279

Resposta: Tenho um hobby de colecionar moedas antigas. Meu acervo inclui moedas de várias épocas e países, com destaque para algumas peças raras da era imperial.
Probabilidade de estar correta: 0.30879539084133295

Resposta: Tenho um hobby de colecionar moedas antigas.
Probabilidade de estar correta: 0.17475425744035153

Resposta: Meu acervo inclui moedas de várias épocas e países, com destaque para algumas peças raras da era imperial. Frequentemente, participo de feiras de colecionadores para encontrar novas adições para minha coleção.
Probabilidade de estar correta: 0.08758920865637128

Resposta: Meu acervo inclui moedas de várias épocas


