# Tuning an LLM with MLX

Using the mlx-tuning-fork at https://github.com/chimezie/mlx-tuning-fork/

expecting files to be named train.jsonl, valid.jsonl and test.jsonl

In [5]:
from click.testing import CliRunner
from mlx_tuning_fork import training
from mlx_lm.utils import load, generate, save_config
from mlx_lm.tuner.utils import linear_to_lora_layers
from dotenv import load_dotenv, find_dotenv
from datetime import datetime

In [2]:
_ = load_dotenv(find_dotenv(), override=True) # read local .env file


python mlx_tuning_fork/training.py --verbose \
--train-type \completion-only \
-f mistral \
--wandb-project mlx-tuning-fork \
--wandb-run $(date +'%Y-%m-%d-%H-%M-%S') \
-rp 0.1 \
--repetition-context-size 15 \
-tp 0.9 \
mlx-tuning-fork-config.yaml


In [6]:
runner = CliRunner()

args = [
    '--verbose',
    '--train-type', 'completion-only',
    '-f', 'mistral',
    '--wandb-project', 'mlx-tuning-fork',
    '--wandb-run', datetime.now().strftime('%Y-%m-%d-%H-%M-%S'),
    '-rp', '0.1',
    '--repetition-context-size', '15',
    '-tp', '0.9',
    'mlx-tuning-fork-config.yaml'
]

runner.invoke(training.main, args)



Fetching 11 files:   0%|          | 0/11 [00:00<?, ?it/s]

VBox(children=(Label(value='0.001 MB of 0.004 MB uploaded\r'), FloatProgress(value=0.2943980929678188, max=1.0…

VBox(children=(Label(value='Waiting for wandb.init()...\r'), FloatProgress(value=0.011159178244512683, max=1.0…

<Result TypeError("object of type 'NoneType' has no len()")>

: 

python mlx_tuning_fork/training.py --verbose \
-p "Escribe una entrada media de diario por ROBELLO CHEBELO MAMELO cuando tenía 25 años" \
-t 0.5 \
-f mistral \
mlx-tuning-fork-config.yaml


## Test pretrained model

Assuming safetensors are stored in a directory called adapters right next to this file

In [6]:
print("Loading pretrained model")
tokenizer_config = {"trust_remote_code": True}
model, tokenizer = load("mistralai/Mistral-7B-Instruct-v0.2", tokenizer_config=tokenizer_config)
model.freeze()

lora_layers=16
lora_parameters = {'alpha': 16.0,
                     'dropout': 0.0,
                     'keys': ['self_attn.q_proj', 'self_attn.v_proj'],
                     'rank': 8,
                     'scale': 10.0}
training.linear_to_lora_layers(model, lora_layers, lora_parameters)

adapter_file = "adapters/adapters.safetensors"

model.load_weights(adapter_file,strict=False)
print(f"Loaded weights from {adapter_file}")


Loading pretrained model




Fetching 11 files:   0%|          | 0/11 [00:00<?, ?it/s]

Loaded weights from adapters/adapters.safetensors


In [18]:
prompt = "<s>[INST] Escribe una entrada corta de diario por ROBELLO CHEBELO MAMELO cuando tenía 25 años [/INST]"
temperature=0.9
max_tokens=2048
print("Generating")
model.eval()
training.generate(
                model, tokenizer, prompt, temperature, max_tokens, True, formatter=None,
                repetition_penalty=0.8,
                repetition_context_size=20,
                top_p=0.9
            )

Generating
Prompt: <s>[INST] Escribe una entrada corta de diario por ROBELLO CHEBELO MAMELO cuando tenía 25 años [/INST]
Cabeza de caballo de tierra





















































































































































































































































































































































































































































































































































































































































































































































































































































































'Cabeza de caballo de tierra\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n