# Fine-tune Llama 2 in Google Colab



In [None]:
!pip install -q accelerate==0.21.0 peft==0.4.0 bitsandbytes==0.40.2 transformers==4.31.0 trl==0.4.7

In [3]:
from google.colab import userdata
userdata.get('HF_TOKEN')


'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'

In [None]:
from datasets import load_dataset
from transformers import (
    AutoModelForCausalLM,
    AutoTokenizer,
    TrainingArguments,
    pipeline,
)
from peft import LoraConfig
from trl import SFTTrainer
from huggingface_hub import login

login('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')

# Nombre del modelo
nuevo_modelo = "modelo-evaluacion-codigo"
nombre_modelo = "NousResearch/Llama-2-7b-chat-hf"

# Ruta a tu conjunto de datos personalizado
nombre_conjunto_datos = "/content/sample_data/data.json"

# Parámetros de fine-tuning
lora_r = 64
lora_alpha = 16
lora_dropout = 0.1
usar_4bit = True
bnb_4bit_compute_dtype = "float16"
bnb_4bit_quant_type = "nf4"
usar_cuantizacion_anidada = False

# Cargar el conjunto de datos
conjunto_datos = load_dataset('json', data_files=nombre_conjunto_datos)['train']

# Cargar el modelo y el tokenizador
modelo = AutoModelForCausalLM.from_pretrained(nombre_modelo)
tokenizador = AutoTokenizer.from_pretrained(nombre_modelo)

# Ajustar el tokenizador
tokenizador.pad_token = tokenizador.eos_token
tokenizador.padding_side = "right"

# Configuración de LoRA para el fine-tuning
config_peft = LoraConfig(
    lora_alpha=lora_alpha,
    lora_dropout=lora_dropout,
    r=lora_r,
    bias="none",
    task_type="CAUSAL_LM",
)

# Definir los parámetros de entrenamiento
argumentos_entrenamiento = TrainingArguments(
    output_dir="./resultados",
    num_train_epochs=3,
    per_device_train_batch_size=8,
    learning_rate=2e-4,
    max_grad_norm=0.3,
    warmup_ratio=0.03,
    logging_steps=25,
    save_steps=0,
    report_to="tensorboard",
)

# Definir el campo de texto para el entrenamiento
dataset_text_field = "code"

# Configurar el entrenador con el modelo PEFT y los parámetros de entrenamiento
entrenador = SFTTrainer(
    model=modelo,
    train_dataset=conjunto_datos,
    peft_config=config_peft,
    dataset_text_field=dataset_text_field,
    tokenizer=tokenizador,
    args=argumentos_entrenamiento,
)

# Entrenar el modelo
entrenador.train()

# Guardar el modelo entrenado
entrenador.model.save_pretrained(nuevo_modelo)

# Ejecutar una evaluación
prompt = "Evalúa este código:\n\ndef sum(a, b):\n  return a + b"
pipe = pipeline(task="text-generation", model=modelo, tokenizer=tokenizador, max_length=200)
resultado = pipe(f"<s>[INST] {prompt} [/INST]")

print(resultado[0]['generated_text'])


