In [141]:
from unsloth import FastLanguageModel
import torch
from trl import SFTTrainer
from transformers import TrainingArguments
from datasets import load_dataset
max_seq_length = 2048 # Supports RoPE Scaling interally, so choose any!

# 4bit pre quantized models we support for 4x faster downloading + no OOMs.
fourbit_models = [
    "unsloth/mistral-7b-bnb-4bit",
    "unsloth/mistral-7b-instruct-v0.2-bnb-4bit",
    "unsloth/llama-2-7b-bnb-4bit",
    "unsloth/gemma-7b-bnb-4bit",
    "unsloth/gemma-7b-it-bnb-4bit", # Instruct version of Gemma 7b
    "unsloth/gemma-2b-bnb-4bit",
    "unsloth/gemma-2b-it-bnb-4bit", # Instruct version of Gemma 2b
    "unsloth/llama-3-8b-bnb-4bit", # [NEW] 15 Trillion token Llama-3
    "unsloth/Phi-3-mini-4k-instruct-bnb-4bit",
] # More models at https://huggingface.co/unsloth

model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "unsloth/gemma-2b-it-bnb-4bit",
    max_seq_length = max_seq_length,
    dtype = None,
    load_in_4bit = True,
)

alpaca_prompt = """Di bawah ini adalah instruksi yang menggambarkan sebuah tugas dengan input yang memberikan konteks lebih lanjut. Tuliskan respons yang tepat untuk menyelesaikan permintaan tersebut.

### Instruksi:
{}

### Input:
{}

### Response:
{}"""

EOS_TOKEN = tokenizer.eos_token # Must add EOS_TOKEN
def formatting_prompts_func(examples):
    instructions = """
Objektif: Tugas anda adalah menghasilkan urutan respons JSON untuk merencanakan tindakan lengan robot berdasarkan input pengguna. Jika tujuan tidak dapat dicapai dengan menggunakan instruksi yang disediakan dan objek yang tersedia, kembalikan pesan kesalahan.

Berikan objek JSON yang mengandung array "actions", diidentifikasi dengan key "actions".

Setiap aksi harus direpresentasikan sebagai objek dengan "command" dan "parameters" yang sesuai

Objek dan Koordinat yang Tersedia (x,y,z):
1. Balok ungu = (-86.59, 117.21, -122.30)
2. Balok kuning = (-168.94, -129.37, -68)
3. Balok biru = (152.76, 158.92, 6)

Perintah yang Tersedia:
1. move: Gerakkan lengan robot ke arah tertentu. Sertakan parameter "direction" dengan nilai "atas", "bawah", "depan", "belakang", "kiri", atau "kanan".
2. move_to: Gerakkan lengan robot ke koordinat tertentu. Sertakan parameter "x", "y", dan "z" untuk menentukan koordinat tujuan.
3. suction_cup: Aktifkan atau nonaktifkan cup hisap. Gunakan parameter "action" dengan nilai "on" atau "off".
5. err_msg: Kembalikan pesan kesalahan jika tujuan pengguna tidak dapat tercapai dengan menggunakan objek dan perintah saat ini. Gunakan parameter "msg" dengan nilai "tidak dapat membuat rencana aksi dengan kondisi terkini".

Contoh Penggunaan Perintah:
"{"actions":[{"command":"move","parameters":{"direction":"up"}},{"command":"move_to","parameters":{"x":-30.21,"y":233.32,"z":-40}},{"command":"suction_cup","parameters":{"action":"on"}},{"command":"err_msg","parameters":{"msg":"tidak dapat membuat rencana aksi dengan kondisi terkini"}}]}"

Instruksi Penggunaan:
1. Untuk memindahkan objek yang tersedia ke koordinat tertentu, aktifkan penyedot terlebih dahulu menggunakan perintah "suction_cup" dengan "action" diatur ke "on", kemudian gerakkan ke koordinat objek menggunakan perintah "move_to".
2. Berikan koordinat penempatan untuk tujuan pengguna menggunakan perintah "move_to".
3. Untuk melepaskan objek setelah menggunakan penyedot, nonaktifkan penyedot terlebih dahulu menggunakan perintah "suction_cup" dengan "action" diatur ke "off".
4. Untuk memindahkan robot secara lateral (misalnya ke kiri, kanan, depan, belakang, atas, depan), gunakan perintah "move" dengan arah yang sesuai.
5. Untuk memindahkan objek secara lateral ((misalnya ke kiri, kanan, depan, belakang, atas, depan), pertama-tama gerakkan lengan robot ke koordinat objek menggunakan perintah "move_to", kemudian gunakan perintah "move" dengan arah yang sesuai.
6. Jika tujuan pengguna tidak dapat tercapai dengan perintah dan objek saat ini, gunakan perintah "err_msg".
    
"""

    inputs       = examples["input"]
    outputs      = examples["response"]
    texts = []
    for input, output in zip(inputs, outputs):
        # Must add EOS_TOKEN, otherwise your generation will go on forever!
        text = alpaca_prompt.format(instructions, input, output) + EOS_TOKEN
        texts.append(text)
    return { "text" : texts, }
pass


# Get dataset
dataset = load_dataset("Aryaduta/test-data2", split = "train")
dataset = dataset.map(formatting_prompts_func, batched = True,)

eval_data = load_dataset("Aryaduta/test-data2", split = "validation")
eval_data = eval_data.map(formatting_prompts_func, batched = True,)

# Do model patching and add fast LoRA weights
model = FastLanguageModel.get_peft_model(
    model,
    r = 16,
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj",
                      "gate_proj", "up_proj", "down_proj",],
    lora_alpha = 16,
    lora_dropout = 0, # Supports any, but = 0 is optimized
    bias = "none",    # Supports any, but = "none" is optimized
    # [NEW] "unsloth" uses 30% less VRAM, fits 2x larger batch sizes!
    use_gradient_checkpointing = "unsloth", # True or "unsloth" for very long context
    random_state = 3407,
    max_seq_length = max_seq_length,
    use_rslora = False,  # We support rank stabilized LoRA
    loftq_config = None, # And LoftQ
)

trainer = SFTTrainer(
    model = model,
    train_dataset = dataset,
    eval_dataset = eval_data,
    dataset_text_field = "text",
    max_seq_length = max_seq_length,
    tokenizer = tokenizer,
    args = TrainingArguments(
        per_device_eval_batch_size=1,
        evaluation_strategy="steps",   
        per_device_train_batch_size = 1,
        eval_steps = 1000,
        warmup_steps = 2,
        num_train_epochs=3.0,
        learning_rate = 2e-4,
        fp16 = not torch.cuda.is_bf16_supported(),
        bf16 = torch.cuda.is_bf16_supported(),
        logging_steps = 1000,
        optim = "adamw_8bit",
        weight_decay = 0.01,
        lr_scheduler_type = "linear",
        seed = 3407,
        output_dir = "outputs",
    ),
)

==((====))==  Unsloth: Fast Gemma patching release 2024.4
   \\   /|    GPU: NVIDIA A100-SXM4-40GB MIG 7g.40gb. Max memory: 39.392 GB. Platform = Linux.
O^O/ \_/ \    Pytorch: 2.2.1+cu121. CUDA = 8.0. CUDA Toolkit = 12.1.
\        /    Bfloat16 = TRUE. Xformers = 0.0.26.post1. FA = True.
 "-____-"     Free Apache license: http://github.com/unslothai/unsloth


Unused kwargs: ['_load_in_4bit', '_load_in_8bit', 'quant_method']. These kwargs are not used in <class 'transformers.utils.quantization_config.BitsAndBytesConfig'>.
Downloading data: 100%|██████████| 1.13M/1.13M [00:00<00:00, 2.25MB/s]
Downloading data: 100%|██████████| 62.5k/62.5k [00:00<00:00, 239kB/s]
Downloading data: 100%|██████████| 62.8k/62.8k [00:00<00:00, 251kB/s]
Generating train split: 100%|██████████| 3762/3762 [00:00<00:00, 315503.71 examples/s]
Generating validation split: 100%|██████████| 209/209 [00:00<00:00, 73770.05 examples/s]
Generating test split: 100%|██████████| 209/209 [00:00<00:00, 69051.56 examples/s]
Map: 100%|██████████| 3762/3762 [00:00<00:00, 53934.88 examples/s]
Map: 100%|██████████| 209/209 [00:00<00:00, 18352.55 examples/s]
Map: 100%|██████████| 3762/3762 [00:01<00:00, 3574.23 examples/s]
Map: 100%|██████████| 209/209 [00:00<00:00, 3522.30 examples/s]


In [142]:
trainer.train()

Step,Training Loss,Validation Loss
1000,0.0423,0.018657
2000,0.0186,0.017894
3000,0.0167,0.016572
4000,0.0164,0.016275
5000,0.0152,0.015654
6000,0.0148,0.015547
7000,0.0148,0.014964
8000,0.014,0.014667
9000,0.0139,0.01419
10000,0.0137,0.013972




TrainOutput(global_step=11286, training_loss=0.01748779837003144, metrics={'train_runtime': 2412.9213, 'train_samples_per_second': 4.677, 'train_steps_per_second': 4.677, 'total_flos': 1.3468397994020045e+17, 'train_loss': 0.01748779837003144, 'epoch': 3.0})

In [143]:
# alpaca_prompt = Copied from above
FastLanguageModel.for_inference(model) # Enable native 2x faster inference
inputs = tokenizer(
[
    alpaca_prompt.format(
"""
Objektif: Tugas anda adalah menghasilkan urutan respons JSON untuk merencanakan tindakan lengan robot berdasarkan input pengguna. Jika tujuan tidak dapat dicapai dengan menggunakan instruksi yang disediakan dan objek yang tersedia, kembalikan pesan kesalahan.

Berikan objek JSON yang mengandung array "actions", diidentifikasi dengan key "actions".

Setiap aksi harus direpresentasikan sebagai objek dengan "command" dan "parameters" yang sesuai

Objek dan Koordinat yang Tersedia (x,y,z):
1. Balok ungu = (-86.59, 117.21, -122.30)
2. Balok kuning = (-168.94, -129.37, -68)
3. Balok biru = (152.76, 158.92, 6)

Perintah yang Tersedia:
1. move: Gerakkan lengan robot ke arah tertentu. Sertakan parameter "direction" dengan nilai "atas", "bawah", "depan", "belakang", "kiri", atau "kanan".
2. move_to: Gerakkan lengan robot ke koordinat tertentu. Sertakan parameter "x", "y", dan "z" untuk menentukan koordinat tujuan.
3. suction_cup: Aktifkan atau nonaktifkan cup hisap. Gunakan parameter "action" dengan nilai "on" atau "off".
5. err_msg: Kembalikan pesan kesalahan jika tujuan pengguna tidak dapat tercapai dengan menggunakan objek dan perintah saat ini. Gunakan parameter "msg" dengan nilai "tidak dapat membuat rencana aksi dengan kondisi terkini".

Contoh Penggunaan Perintah:
"{"actions":[{"command":"move","parameters":{"direction":"up"}},{"command":"move_to","parameters":{"x":-30.21,"y":233.32,"z":-40}},{"command":"suction_cup","parameters":{"action":"on"}},{"command":"err_msg","parameters":{"msg":"tidak dapat membuat rencana aksi dengan kondisi terkini"}}]}"

Instruksi Penggunaan:
1. Untuk memindahkan objek yang tersedia ke koordinat tertentu, aktifkan penyedot terlebih dahulu menggunakan perintah "suction_cup" dengan "action" diatur ke "on", kemudian gerakkan ke koordinat objek menggunakan perintah "move_to".
2. Berikan koordinat penempatan untuk tujuan pengguna menggunakan perintah "move_to".
3. Untuk melepaskan objek setelah menggunakan penyedot, nonaktifkan penyedot terlebih dahulu menggunakan perintah "suction_cup" dengan "action" diatur ke "off".
4. Untuk memindahkan robot secara lateral (misalnya ke kiri, kanan, depan, belakang, atas, depan), gunakan perintah "move" dengan arah yang sesuai.
5. Untuk memindahkan objek secara lateral ((misalnya ke kiri, kanan, depan, belakang, atas, depan), pertama-tama gerakkan lengan robot ke koordinat objek menggunakan perintah "move_to", kemudian gunakan perintah "move" dengan arah yang sesuai.
6. Jika tujuan pengguna tidak dapat tercapai dengan perintah dan objek saat ini, gunakan perintah "err_msg".
      
"""
, # instruction
        "pindahkan balok biru di kanan balok kuning", # input
        "", # output - leave this blank for generation!
    )
], return_tensors = "pt").to("cuda")

from transformers import TextStreamer
text_streamer = TextStreamer(tokenizer)
_ = model.generate(**inputs, streamer = text_streamer, max_new_tokens = 1024)

<bos>Di bawah ini adalah instruksi yang menggambarkan sebuah tugas dengan input yang memberikan konteks lebih lanjut. Tuliskan respons yang tepat untuk menyelesaikan permintaan tersebut.

### Instruksi:

Objektif: Tugas anda adalah menghasilkan urutan respons JSON untuk merencanakan tindakan lengan robot berdasarkan input pengguna. Jika tujuan tidak dapat dicapai dengan menggunakan instruksi yang disediakan dan objek yang tersedia, kembalikan pesan kesalahan.

Berikan objek JSON yang mengandung array "actions", diidentifikasi dengan key "actions".

Setiap aksi harus direpresentasikan sebagai objek dengan "command" dan "parameters" yang sesuai

Objek dan Koordinat yang Tersedia (x,y,z):
1. Balok ungu = (-86.59, 117.21, -122.30)
2. Balok kuning = (-168.94, -129.37, -68)
3. Balok biru = (152.76, 158.92, 6)

Perintah yang Tersedia:
1. move: Gerakkan lengan robot ke arah tertentu. Sertakan parameter "direction" dengan nilai "atas", "bawah", "depan", "belakang", "kiri", atau "kanan".
2. move

In [144]:
# alpaca_prompt = Copied from above
FastLanguageModel.for_inference(model) # Enable native 2x faster inference
inputs = tokenizer(
[
    alpaca_prompt.format(
"""
Objektif: Tugas anda adalah menghasilkan urutan respons JSON untuk merencanakan tindakan lengan robot berdasarkan input pengguna. Jika tujuan tidak dapat dicapai dengan menggunakan instruksi yang disediakan dan objek yang tersedia, kembalikan pesan kesalahan.

Berikan objek JSON yang mengandung array "actions", diidentifikasi dengan key "actions".

Setiap aksi harus direpresentasikan sebagai objek dengan "command" dan "parameters" yang sesuai

Objek dan Koordinat yang Tersedia (x,y,z):
1. Balok ungu = (-86.59, 117.21, -122.30)
2. Balok kuning = (-168.94, -129.37, -68)
3. Balok biru = (152.76, 158.92, 6)

Perintah yang Tersedia:
1. move: Gerakkan lengan robot ke arah tertentu. Sertakan parameter "direction" dengan nilai "atas", "bawah", "depan", "belakang", "kiri", atau "kanan".
2. move_to: Gerakkan lengan robot ke koordinat tertentu. Sertakan parameter "x", "y", dan "z" untuk menentukan koordinat tujuan.
3. suction_cup: Aktifkan atau nonaktifkan cup hisap. Gunakan parameter "action" dengan nilai "on" atau "off".
5. err_msg: Kembalikan pesan kesalahan jika tujuan pengguna tidak dapat tercapai dengan menggunakan objek dan perintah saat ini. Gunakan parameter "msg" dengan nilai "tidak dapat membuat rencana aksi dengan kondisi terkini".

Contoh Penggunaan Perintah:
"{"actions":[{"command":"move","parameters":{"direction":"up"}},{"command":"move_to","parameters":{"x":-30.21,"y":233.32,"z":-40}},{"command":"suction_cup","parameters":{"action":"on"}},{"command":"err_msg","parameters":{"msg":"tidak dapat membuat rencana aksi dengan kondisi terkini"}}]}"

Instruksi Penggunaan:
1. Untuk memindahkan objek yang tersedia ke koordinat tertentu, aktifkan penyedot terlebih dahulu menggunakan perintah "suction_cup" dengan "action" diatur ke "on", kemudian gerakkan ke koordinat objek menggunakan perintah "move_to".
2. Berikan koordinat penempatan untuk tujuan pengguna menggunakan perintah "move_to".
3. Untuk melepaskan objek setelah menggunakan penyedot, nonaktifkan penyedot terlebih dahulu menggunakan perintah "suction_cup" dengan "action" diatur ke "off".
4. Untuk memindahkan robot secara lateral (misalnya ke kiri, kanan, depan, belakang, atas, depan), gunakan perintah "move" dengan arah yang sesuai.
5. Untuk memindahkan objek secara lateral ((misalnya ke kiri, kanan, depan, belakang, atas, depan), pertama-tama gerakkan lengan robot ke koordinat objek menggunakan perintah "move_to", kemudian gunakan perintah "move" dengan arah yang sesuai.
6. Jika tujuan pengguna tidak dapat tercapai dengan perintah dan objek saat ini, gunakan perintah "err_msg".
     
"""
, # instruction
        "pindahkan balok ungu di kanan balok biru", # input
        "", # output - leave this blank for generation!
    )
], return_tensors = "pt").to("cuda")

outputs = model.generate(**inputs, max_new_tokens = 1024, use_cache = True)
tokenizer.batch_decode(outputs)

['<bos>Di bawah ini adalah instruksi yang menggambarkan sebuah tugas dengan input yang memberikan konteks lebih lanjut. Tuliskan respons yang tepat untuk menyelesaikan permintaan tersebut.\n\n### Instruksi:\n\nObjektif: Tugas anda adalah menghasilkan urutan respons JSON untuk merencanakan tindakan lengan robot berdasarkan input pengguna. Jika tujuan tidak dapat dicapai dengan menggunakan instruksi yang disediakan dan objek yang tersedia, kembalikan pesan kesalahan.\n\nBerikan objek JSON yang mengandung array "actions", diidentifikasi dengan key "actions".\n\nSetiap aksi harus direpresentasikan sebagai objek dengan "command" dan "parameters" yang sesuai\n\nObjek dan Koordinat yang Tersedia (x,y,z):\n1. Balok ungu = (-86.59, 117.21, -122.30)\n2. Balok kuning = (-168.94, -129.37, -68)\n3. Balok biru = (152.76, 158.92, 6)\n\nPerintah yang Tersedia:\n1. move: Gerakkan lengan robot ke arah tertentu. Sertakan parameter "direction" dengan nilai "atas", "bawah", "depan", "belakang", "kiri", ata

In [145]:
# Enable native 2x faster inference
FastLanguageModel.for_inference(model)

# Prepare inputs
inputs = tokenizer(
    [
        alpaca_prompt.format(
"""
Objektif: Tugas anda adalah menghasilkan urutan respons JSON untuk merencanakan tindakan lengan robot berdasarkan input pengguna. Jika tujuan tidak dapat dicapai dengan menggunakan instruksi yang disediakan dan objek yang tersedia, kembalikan pesan kesalahan.

Berikan objek JSON yang mengandung array "actions", diidentifikasi dengan key "actions".

Setiap aksi harus direpresentasikan sebagai objek dengan "command" dan "parameters" yang sesuai

Objek dan Koordinat yang Tersedia (x,y,z):
1. Balok ungu = (-86.59, 117.21, -122.30)
2. Balok kuning = (-168.94, -129.37, -68)
3. Balok biru = (152.76, 158.92, 6)

Perintah yang Tersedia:
1. move: Gerakkan lengan robot ke arah tertentu. Sertakan parameter "direction" dengan nilai "atas", "bawah", "depan", "belakang", "kiri", atau "kanan".
2. move_to: Gerakkan lengan robot ke koordinat tertentu. Sertakan parameter "x", "y", dan "z" untuk menentukan koordinat tujuan.
3. suction_cup: Aktifkan atau nonaktifkan cup hisap. Gunakan parameter "action" dengan nilai "on" atau "off".
5. err_msg: Kembalikan pesan kesalahan jika tujuan pengguna tidak dapat tercapai dengan menggunakan objek dan perintah saat ini. Gunakan parameter "msg" dengan nilai "tidak dapat membuat rencana aksi dengan kondisi terkini".

Contoh Penggunaan Perintah:
"{"actions":[{"command":"move","parameters":{"direction":"up"}},{"command":"move_to","parameters":{"x":-30.21,"y":233.32,"z":-40}},{"command":"suction_cup","parameters":{"action":"on"}},{"command":"err_msg","parameters":{"msg":"tidak dapat membuat rencana aksi dengan kondisi terkini"}}]}"

Instruksi Penggunaan:
1. Untuk memindahkan objek yang tersedia ke koordinat tertentu, aktifkan penyedot terlebih dahulu menggunakan perintah "suction_cup" dengan "action" diatur ke "on", kemudian gerakkan ke koordinat objek menggunakan perintah "move_to".
2. Berikan koordinat penempatan untuk tujuan pengguna menggunakan perintah "move_to".
3. Untuk melepaskan objek setelah menggunakan penyedot, nonaktifkan penyedot terlebih dahulu menggunakan perintah "suction_cup" dengan "action" diatur ke "off".
4. Untuk memindahkan robot secara lateral (misalnya ke kiri, kanan, depan, belakang, atas, depan), gunakan perintah "move" dengan arah yang sesuai.
5. Untuk memindahkan objek secara lateral ((misalnya ke kiri, kanan, depan, belakang, atas, depan), pertama-tama gerakkan lengan robot ke koordinat objek menggunakan perintah "move_to", kemudian gunakan perintah "move" dengan arah yang sesuai.
6. Jika tujuan pengguna tidak dapat tercapai dengan perintah dan objek saat ini, gunakan perintah "err_msg".
  """,
        "pindahkan balok ungu di kanan balok biru",  # input
        "",  # output - leave this blank for generation!
    )
    ],
    return_tensors="pt"
).to("cuda")

# Generate outputs
outputs = model.generate(**inputs, max_new_tokens=1024, use_cache=True)



In [146]:
# Decode and extract JSON response
decoded_output = tokenizer.batch_decode(outputs)[0]
start_index = decoded_output.find('{')
end_index = decoded_output.rfind('}') + 1
json_response = decoded_output[start_index:end_index].strip()

# Print the JSON response
print(decoded_output)

<bos>Di bawah ini adalah instruksi yang menggambarkan sebuah tugas dengan input yang memberikan konteks lebih lanjut. Tuliskan respons yang tepat untuk menyelesaikan permintaan tersebut.

### Instruksi:

Objektif: Tugas anda adalah menghasilkan urutan respons JSON untuk merencanakan tindakan lengan robot berdasarkan input pengguna. Jika tujuan tidak dapat dicapai dengan menggunakan instruksi yang disediakan dan objek yang tersedia, kembalikan pesan kesalahan.

Berikan objek JSON yang mengandung array "actions", diidentifikasi dengan key "actions".

Setiap aksi harus direpresentasikan sebagai objek dengan "command" dan "parameters" yang sesuai

Objek dan Koordinat yang Tersedia (x,y,z):
1. Balok ungu = (-86.59, 117.21, -122.30)
2. Balok kuning = (-168.94, -129.37, -68)
3. Balok biru = (152.76, 158.92, 6)

Perintah yang Tersedia:
1. move: Gerakkan lengan robot ke arah tertentu. Sertakan parameter "direction" dengan nilai "atas", "bawah", "depan", "belakang", "kiri", atau "kanan".
2. move

In [147]:
# Decode output and extract JSON response
decoded_output = tokenizer.batch_decode(outputs)[0]

# Find the start and end indices for the JSON response
start_marker = "### Response:"
end_marker = "<eos>"
start_index = decoded_output.find(start_marker) + len(start_marker)
end_index = decoded_output.find(end_marker, start_index)

# Extract the JSON response
json_response = decoded_output[start_index:end_index].strip()

# Print the JSON response
print(json_response)

{"actions": [{"command": "move_to", "parameters": {"x": -86.59, "y": 117.21, "z": -122.30}}, {"command": "suction_cup", "parameters": {"action": "on"}}, {"command": "move_to", "parameters": {"x": 152.76, "y": 158.92, "z": 6}}, {"command": "move", "parameters": {"direction": "kanan"}}, {"command": "suction_cup", "parameters": {"action": "off"}}]}


In [148]:
# Evaluate model
eval_results = trainer.evaluate()

# Print evaluation metrics
print(eval_results)

{'eval_loss': 0.013738308101892471, 'eval_runtime': 10.3693, 'eval_samples_per_second': 20.156, 'eval_steps_per_second': 20.156, 'epoch': 3.0}


In [149]:
import pandas as pd

# Set pandas options to display all rows and columns
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)

# Create DataFrame from the log_history dictionary
df = pd.DataFrame(trainer.state.log_history)

# Display the DataFrame
print(df)

      loss  grad_norm  learning_rate     epoch   step  eval_loss  \
0   0.0423   0.084247       0.000182  0.265816   1000        NaN   
1      NaN        NaN            NaN  0.265816   1000   0.018657   
2   0.0186   0.122930       0.000165  0.531632   2000        NaN   
3      NaN        NaN            NaN  0.531632   2000   0.017894   
4   0.0167   0.105352       0.000147  0.797448   3000        NaN   
5      NaN        NaN            NaN  0.797448   3000   0.016572   
6   0.0164   0.062958       0.000129  1.063264   4000        NaN   
7      NaN        NaN            NaN  1.063264   4000   0.016275   
8   0.0152   0.065099       0.000111  1.329080   5000        NaN   
9      NaN        NaN            NaN  1.329080   5000   0.015654   
10  0.0148   0.060192       0.000094  1.594896   6000        NaN   
11     NaN        NaN            NaN  1.594896   6000   0.015547   
12  0.0148   0.059417       0.000076  1.860712   7000        NaN   
13     NaN        NaN            NaN  1.860712  

In [150]:
import os
hf_token = "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"

In [151]:
!huggingface-cli login --token $hf_token

/bin/bash: line 1: huggingface-cli: command not found


huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


In [152]:
model.push_to_hub_merged("modellora9", tokenizer, save_method = "lora", token = "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")

Unsloth: Saving LoRA adapters. Please wait...


adapter_model.safetensors: 100%|██████████| 78.5M/78.5M [00:11<00:00, 7.03MB/s]
tokenizer.model:   0%|          | 0.00/4.24M [00:00<?, ?B/s]
Upload 2 LFS files:   0%|          | 0/2 [00:00<?, ?it/s][A

tokenizer.model:   0%|          | 16.4k/4.24M [00:00<01:03, 66.7kB/s]

tokenizer.model:  29%|██▉       | 1.25M/4.24M [00:00<00:00, 4.27MB/s][A[A

tokenizer.json:   8%|▊         | 1.44M/17.5M [00:00<00:03, 4.79MB/s][A[A

tokenizer.json:  37%|███▋      | 6.50M/17.5M [00:00<00:00, 19.2MB/s][A[A

tokenizer.json:  52%|█████▏    | 9.08M/17.5M [00:01<00:01, 6.25MB/s][A[A

tokenizer.json:  61%|██████▏   | 10.8M/17.5M [00:01<00:01, 6.47MB/s][A[A

tokenizer.model: 100%|██████████| 4.24M/4.24M [00:02<00:00, 2.01MB/s][A[A


tokenizer.json:  91%|█████████▏| 16.0M/17.5M [00:02<00:00, 5.26MB/s][A[A
tokenizer.json: 100%|██████████| 17.5M/17.5M [00:04<00:00, 4.31MB/s]

Upload 2 LFS files: 100%|██████████| 2/2 [00:04<00:00,  2.36s/it][A


Saved lora model to https://huggingface.co/modellora9
