In [1]:
from unsloth import FastLanguageModel
import torch

fourbit_models = [
    "unsloth/Qwen3-1.7B-unsloth-bnb-4bit", # Qwen 14B 2x faster
    "unsloth/Qwen3-4B-unsloth-bnb-4bit",
    "unsloth/Qwen3-8B-unsloth-bnb-4bit",
    "unsloth/Qwen3-14B-unsloth-bnb-4bit",
    "unsloth/Qwen3-32B-unsloth-bnb-4bit",

    # 4bit dynamic quants for superior accuracy and low memory use
    "unsloth/gemma-3-12b-it-unsloth-bnb-4bit",
    "unsloth/Phi-4",
    "unsloth/Llama-3.1-8B",
    "unsloth/Llama-3.2-3B",
    "unsloth/orpheus-3b-0.1-ft-unsloth-bnb-4bit" # [NEW] We support TTS models!
] # More models at https://huggingface.co/unsloth

model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "unsloth/Qwen3-32B-unsloth-bnb-4bit",
    max_seq_length = 4096,   # Context length - can be longer, but uses more memory
    load_in_4bit = True,     # 4bit uses much less memory
    load_in_8bit = False,    # A bit more accurate, uses 2x memory
    full_finetuning = False, # We have full finetuning now!
    # token = "hf_...",      # use one if using gated models
)

🦥 Unsloth: Will patch your computer to enable 2x faster free finetuning.


  from .autonotebook import tqdm as notebook_tqdm
  warn(


Unsloth: Failed to patch Gemma3ForConditionalGeneration.
🦥 Unsloth Zoo will now patch everything to make training faster!
==((====))==  Unsloth 2025.3.19: Fast Qwen3 patching. Transformers: 4.51.3.
   \\   /|    NVIDIA A100 80GB PCIe. Num GPUs = 1. Max memory: 79.151 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.6.0+cu124. CUDA: 8.0. CUDA Toolkit: 12.4. Triton: 3.2.0
\        /    Bfloat16 = TRUE. FA [Xformers = 0.0.29.post3. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


Loading checkpoint shards: 100%|██████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.19it/s]


In [2]:
model = FastLanguageModel.get_peft_model(
    model,
    r = 32,           # Choose any number > 0! Suggested 8, 16, 32, 64, 128
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj",
                      "gate_proj", "up_proj", "down_proj",],
    lora_alpha = 32,  # Best to choose alpha = rank or rank*2
    lora_dropout = 0, # Supports any, but = 0 is optimized
    bias = "none",    # Supports any, but = "none" is optimized
    # [NEW] "unsloth" uses 30% less VRAM, fits 2x larger batch sizes!
    use_gradient_checkpointing = "unsloth", # True or "unsloth" for very long context
    random_state = 3407,
    use_rslora = False,   # We support rank stabilized LoRA
    loftq_config = None,  # And LoftQ
)

Unsloth: Making `model.base_model.model.model` require gradients


In [3]:
import pandas as pd

# Login using e.g. `huggingface-cli login` to access this dataset
df_train = pd.read_json("hf://datasets/Josephgflowers/Finance-Instruct-500k/train.json", lines=True)
df_train = df_train.head(5000)

In [4]:
train_question = df_train['user'].tolist()
train_answer = df_train['assistant'].tolist()
len(train_question),len(train_answer)

(5000, 5000)

In [5]:
user_prompt = """
**CRITICAL OUTPUT RULES:**
1. Your response must be EXACTLY one of the following values: A, B, C, D, E, Rise, or Fall.
2. Do NOT output any reasoning, explanation, or XML tags such as <think>.
3. Do NOT include any text other than the final answer itself.

Here are examples:

---
**Example 1:**
**Query:** "ตอบคำถามด้วยตัวเลือกที่เหมาะสม A, B, C และ D โปรดตอบด้วยคำตอบที่ถูกต้อง A, B, C หรือ D เท่านั้น อย่าใช้คำฟุ่มเฟือยหรือให้ข้อมูลเพิ่มเติม

คำถาม: ______ สถานที่ทำงานเกี่ยวข้องกับการเสริมสร้างศักยภาพให้พนักงาน ตัวอย่างเช่น 'job enrichment' ที่พนักงานได้รับขอบเขตที่ใหญ่ขึ้นในการตัดสินใจว่าจะจัดระเบียบงานของตนอย่างไร หรือ 'job enlargement' ที่พนักงานได้รับมอบหมายงานที่หลากหลายมากขึ้น

ตัวเลือกคำตอบ: A: Re-invigorating, B: Re-flourishing, C: Revitalizing, D: Rehumanizing"
**Answer:** D
---
**Example 2:**
**Query:** "Answer the question with the appropriate options A, B, C and D. Please respond with the exact answer A, B, C or D only. Do not be verbose or provide extra information. 
Question: Who of these is the entrepreneur?
Answer Choices: A: Barack Obama, B: James Dyson, C: Damien Hirst, D: Mo Farah "
**Answer:** B
---

this is your knowledge for answer question and condition above

**Query:** {question_train}
**Your Answer:**{answer_train}
"""


In [6]:
train_conversation = []
from tqdm import tqdm
for i in tqdm(range(len(df_train))):
    chat = [{'content': user_prompt.format(question_train=train_question[i],answer_train=train_answer[i]),'role':'user'}]
    train_conversation.append(chat)

100%|███████████████████████████████████████████████████████████████████████████| 5000/5000 [00:00<00:00, 265697.71it/s]


In [7]:
conversations = tokenizer.apply_chat_template(
    train_conversation,
    tokenize = False,
)
data = pd.Series(conversations)
data.name = "text"

from datasets import Dataset
train_dataset = Dataset.from_pandas(pd.DataFrame(data))

In [8]:
train_dataset['text'][0]

'<|im_start|>user\n\n**CRITICAL OUTPUT RULES:**\n1. Your response must be EXACTLY one of the following values: A, B, C, D, E, Rise, or Fall.\n2. Do NOT output any reasoning, explanation, or XML tags such as <think>.\n3. Do NOT include any text other than the final answer itself.\n\nHere are examples:\n\n---\n**Example 1:**\n**Query:** "ตอบคำถามด้วยตัวเลือกที่เหมาะสม A, B, C และ D โปรดตอบด้วยคำตอบที่ถูกต้อง A, B, C หรือ D เท่านั้น อย่าใช้คำฟุ่มเฟือยหรือให้ข้อมูลเพิ่มเติม\n\nคำถาม: ______ สถานที่ทำงานเกี่ยวข้องกับการเสริมสร้างศักยภาพให้พนักงาน ตัวอย่างเช่น \'job enrichment\' ที่พนักงานได้รับขอบเขตที่ใหญ่ขึ้นในการตัดสินใจว่าจะจัดระเบียบงานของตนอย่างไร หรือ \'job enlargement\' ที่พนักงานได้รับมอบหมายงานที่หลากหลายมากขึ้น\n\nตัวเลือกคำตอบ: A: Re-invigorating, B: Re-flourishing, C: Revitalizing, D: Rehumanizing"\n**Answer:** D\n---\n**Example 2:**\n**Query:** "Answer the question with the appropriate options A, B, C and D. Please respond with the exact answer A, B, C or D only. Do not be ver

In [9]:
from trl import SFTTrainer, SFTConfig
trainer = SFTTrainer(
    model = model,
    tokenizer = tokenizer,
    train_dataset = train_dataset,
    eval_dataset = None, # Can set up evaluation!
    args = SFTConfig(
        dataset_text_field = "text",
        per_device_train_batch_size = 64,
        gradient_accumulation_steps = 4, # Use GA to mimic batch size!
        warmup_steps = 5,
        num_train_epochs = 10, # Set this for 1 full training run.
        learning_rate = 2e-4, # Reduce to 2e-5 for long training runs
        logging_steps = 1,
        optim = "adamw_8bit",
        weight_decay = 0.01,
        lr_scheduler_type = "linear",
        seed = 3407,
        report_to = "none", # Use this for WandB etc
    ),
)

Unsloth: Tokenizing ["text"] (num_proc=96): 100%|███████████████████████████| 5000/5000 [00:33<00:00, 149.44 examples/s]


In [None]:
trainer_stats = trainer.train()

==((====))==  Unsloth - 2x faster free finetuning | Num GPUs used = 1
   \\   /|    Num examples = 5,000 | Num Epochs = 10 | Total steps = 190
O^O/ \_/ \    Batch size per device = 64 | Gradient accumulation steps = 4
\        /    Data Parallel GPUs = 1 | Total batch size (64 x 4 x 1) = 256
 "-____-"     Trainable parameters = 87,293,952/8,000,000,000 (1.09% trained)
`use_cache=True` is incompatible with gradient checkpointing. Setting `use_cache=False`.


Unsloth: Will smartly offload gradients to save VRAM!


Step,Training Loss
1,2.2189
2,2.2213


In [None]:
#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
model.push_to_hub("papinwit/scb_qwen_8b", token = "") # Online saving
tokenizer.push_to_hub("papinwit/scb_qwen_8b", token = "") # Online saving

In [1]:
from unsloth import FastLanguageModel
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "papinwit/scb_qwen_8b", # YOUR MODEL YOU USED FOR TRAINING
    max_seq_length = 4096,
    load_in_4bit = True,
)

🦥 Unsloth: Will patch your computer to enable 2x faster free finetuning.


  from .autonotebook import tqdm as notebook_tqdm
  warn(


Unsloth: Failed to patch Gemma3ForConditionalGeneration.
🦥 Unsloth Zoo will now patch everything to make training faster!
==((====))==  Unsloth 2025.3.19: Fast Qwen3 patching. Transformers: 4.51.3.
   \\   /|    NVIDIA A100 80GB PCIe. Num GPUs = 1. Max memory: 79.151 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.6.0+cu124. CUDA: 8.0. CUDA Toolkit: 12.4. Triton: 3.2.0
\        /    Bfloat16 = TRUE. FA [Xformers = 0.0.29.post3. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


Loading checkpoint shards: 100%|██████████████████████████████████████████████████████████| 2/2 [00:12<00:00,  6.45s/it]


In [2]:
import pandas as pd
df = pd.read_csv("/home/papinwit/week8_superai/test_scb_llm.csv")
df

Unnamed: 0,id,query
0,36deab86-cfd3-48b5-9bea-a36c1b0e63a8,"ตอบคำถามด้วยตัวเลือกที่เหมาะสม A, B, C และ D โ..."
1,2b5bbd26-45e8-4768-ab8a-b5dc1d153ab7,Answer the question with the appropriate optio...
2,8a722080-bc16-49db-89c9-100cd61cd28a,Answer the question with the appropriate optio...
3,75316e95-88f4-4fef-83b9-dde0aa52889a,"ตอบคำถามด้วยตัวเลือกที่เหมาะสม A, B, C และ D โ..."
4,bcca13bc-2675-4645-82cc-7e4c412ed294,"Given the data and tweets, could you project w..."
...,...,...
494,c9dd262e-405c-4078-baae-262aa48ddcc8,Answer the question with the appropriate optio...
495,73c720b5-1101-4790-af52-3366823e1d32,"ตอบคำถามโดยใช้ตัวเลือกที่เหมาะสม A, B, C และ D..."
496,357db18f-d872-416e-a07f-753099853d9c,"ตอบคำถามด้วยตัวเลือกที่เหมาะสม A, B, C และ D โ..."
497,2d8b1419-1c46-4e83-892a-081fb417de38,Scrutinize the data and tweets to envisage if ...


In [3]:
test_question = df['query'].tolist()
len(test_question)

499

In [5]:
user_prompt = """
**CRITICAL OUTPUT RULES:**
1. Your response must be EXACTLY one of the following values: A, B, C, D, E, Rise, or Fall.
2. Do NOT output any reasoning, explanation, or XML tags such as <think>.
3. Do NOT include any text other than the final answer itself.

Here are examples:

---
**Example 1:**
**Query:** "ตอบคำถามด้วยตัวเลือกที่เหมาะสม A, B, C และ D โปรดตอบด้วยคำตอบที่ถูกต้อง A, B, C หรือ D เท่านั้น อย่าใช้คำฟุ่มเฟือยหรือให้ข้อมูลเพิ่มเติม

คำถาม: ______ สถานที่ทำงานเกี่ยวข้องกับการเสริมสร้างศักยภาพให้พนักงาน ตัวอย่างเช่น 'job enrichment' ที่พนักงานได้รับขอบเขตที่ใหญ่ขึ้นในการตัดสินใจว่าจะจัดระเบียบงานของตนอย่างไร หรือ 'job enlargement' ที่พนักงานได้รับมอบหมายงานที่หลากหลายมากขึ้น

ตัวเลือกคำตอบ: A: Re-invigorating, B: Re-flourishing, C: Revitalizing, D: Rehumanizing"
**Answer:** D
---
**Example 2:**
**Query:** "Answer the question with the appropriate options A, B, C and D. Please respond with the exact answer A, B, C or D only. Do not be verbose or provide extra information. 
Question: Who of these is the entrepreneur?
Answer Choices: A: Barack Obama, B: James Dyson, C: Damien Hirst, D: Mo Farah "
**Answer:** B
---
**Example 3:**
**Query:** "Given the data and tweets, could you project whether the closing price of $intc will grow or shrink at 2018-01-23? Please specify either Rise or Fall.
Context: date,open,high,low,close,adj-close,inc-5,inc-10,inc-15,inc-20,inc-25,inc-30
2018-01-08,-1.1,0.2,-1.7,0.0,0.0,1.0,2.2,2.7,1.3,0.6,0.5
2018-01-09,2.5,2.8,-0.3,-2.5,-2.5,2.2,4.1,5.2,3.9,3.1,2.9
2018-01-10,2.0,2.6,-0.1,-2.6,-2.6,3.5,6.0,7.4,6.5,5.6,5.5
2018-01-11,-1.4,0.4,-2.2,2.1,2.1,0.9,3.2,4.6,4.3,3.4,3.2
2018-01-12,0.5,0.8,-0.5,-0.4,-0.4,0.6,2.9,4.4,4.7,3.8,3.5
2018-01-16,1.0,1.5,-0.6,-0.2,-0.2,0.1,2.4,4.0,4.9,4.1,3.7
2018-01-17,-1.9,0.1,-2.0,2.9,2.9,-2.4,-1.0,0.8,2.0,1.2,0.7
2018-01-18,-0.2,0.6,-0.7,0.2,0.2,-1.7,-1.4,0.3,1.6,1.1,0.5
2018-01-19,-0.4,0.2,-1.3,0.8,0.8,-1.8,-2.0,-0.6,0.5,0.5,-0.2
2018-01-22,-2.1,0.1,-2.1,2.1,2.1,-2.7,-3.8,-2.7,-1.7,-1.4,-2.0

2018-01-08: rt AT_USER $t $vz $intc $fb $bac $ge $mu $amd $bac $gm $rig $baba $s $aapl $orcl $esv $jci $wu $t - highest volume strikes |$t $vz $intc $fb $bac $ge $mu $amd $bac $gm $rig $baba $s $aapl $orcl $esv $
2018-01-09: $btc $spx $nasdaq $djia $cac $dax $ftse $jpm $tsla $es_f $cl_f $gc_f $tlt $wmt $jnj $fb $googl $msft $intc $amd¡­ |intel reveals its smart home tech impact at ces $intc |rt AT_USER senators reed, kenn
2018-01-10: this value etf gained 22% in 2017  $aapl $ibm $intc  via AT_USER|$intc 5.7m ago: kirby mcinerney llp commences investigation on behalf of intel corporation investors |f u $intc i can't even play frick
2018-01-11: find xtra yield w/buy-write search $sbux $intc $spy $ge $ebio $bac $ziop $fit $watt $bp $watt $dust |rt AT_USER my 2017 swing-trading in review $study $teck $sq $baba $twtr $intc $splk $fdx #finance #
2018-01-12: they all tell u what they're doing? no?...... i'm shocked. $c $key $pnc $eufn $kbe $rtn $lmt $iivi $ktos $apa $slb¡­ |so bullish.... $intc |rt AT_USER fascinating look at #intel's 49-qubit superconduc
2018-01-13: that german-built aircraft, with 18 rotors positioned around a ring above its trim fuselage, is called the volocop¡­ |$intc respecting fib's  - opinions always welcome |short ratio of $simo is 9.31 at
2018-01-14: rt AT_USER from january 12, 2018 2:53 pm¨ufinnish firm, f-secure detects new intel security flaw $intc ¨u  ¨u¡­|from january 12, 2018 2:53 pm¨ufinnish firm, f-secure detects new intel security flaw $i
2018-01-15: $oled 196 per share. close to 10 bill market cap on 400 mill in forward revs. their strategic fab partner boe.¡­ |rt AT_USER #gigabyte brix gb-bxi7-5775 ultra compact #pc has an #intel i7 cpu - get on
2018-01-16: unusual options activity - 01.18.2018 - $dish $bac $snap $intc $pbr $low $schw $wynn $nflx $slb $aapl $twtr $amzn¡­ |get the latest ratings for $jpm $abbv $wgp $intc $icd in your inbox with marketbeat
2018-01-17: according to wsj: us gov expects $339b in repatriation taxes in 10-year span. firms with most dollars in¡­ |$intc negative news regarding chip flaw not created major drawdown this stock. compression c
2018-01-18: #methuselah would be proud. first growth in five years. muscle memory, shares decline after hours. $ibm $aapl $csco¡­ |sign up for profectus systems and beat the market $intc $wdc $stx $spy $qqq $dia 
2018-01-19: $amd $intc $amzn |$amd $intc $amzn |rt AT_USER jim cramer mad money game plan  AT_USER AT_USER $hal $nflx $vz $pg $jnj $trv $ge $utx $swk $cat¡­|rt AT_USER earnings on tap next week: $ubs $nflx $hal $
2018-01-20: rt AT_USER your tech top 10 is headed by microsoft, intel: thomson reuters rankings - tech trader daily- AT_USER - $msft $intc h¡­|$amd busrt out of a darvas box on the $intc security chip news. not s
2018-01-22: rt AT_USER your tech top 10 is headed by microsoft, intel: thomson reuters rankings - tech trader daily- AT_USER - $msft $intc h¡­|$amd busrt out of a darvas box on the $intc security chip news. not s"
**Answer:** Rise
---

Now, solve the following:

**Query:** {question}
**Your Answer:**
"""


In [6]:
test_conversation = []
from tqdm import tqdm
for i in tqdm(range(len(df))):
    chat = [{'content': user_prompt.format(question=test_question[i]),'role':'user'}]
    test_conversation.append(chat)

100%|██████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 45449.68it/s]


In [7]:
test_conversation[498]

[{'content': '\n**CRITICAL OUTPUT RULES:**\n1. Your response must be EXACTLY one of the following values: A, B, C, D, E, Rise, or Fall.\n2. Do NOT output any reasoning, explanation, or XML tags such as <think>.\n3. Do NOT include any text other than the final answer itself.\n\nHere are examples:\n\n---\n**Example 1:**\n**Query:** "ตอบคำถามด้วยตัวเลือกที่เหมาะสม A, B, C และ D โปรดตอบด้วยคำตอบที่ถูกต้อง A, B, C หรือ D เท่านั้น อย่าใช้คำฟุ่มเฟือยหรือให้ข้อมูลเพิ่มเติม\n\nคำถาม: ______ สถานที่ทำงานเกี่ยวข้องกับการเสริมสร้างศักยภาพให้พนักงาน ตัวอย่างเช่น \'job enrichment\' ที่พนักงานได้รับขอบเขตที่ใหญ่ขึ้นในการตัดสินใจว่าจะจัดระเบียบงานของตนอย่างไร หรือ \'job enlargement\' ที่พนักงานได้รับมอบหมายงานที่หลากหลายมากขึ้น\n\nตัวเลือกคำตอบ: A: Re-invigorating, B: Re-flourishing, C: Revitalizing, D: Rehumanizing"\n**Answer:** D\n---\n**Example 2:**\n**Query:** "Answer the question with the appropriate options A, B, C and D. Please respond with the exact answer A, B, C or D only. Do not be verbose 

In [8]:
from tqdm import tqdm

final_answer = []

# เลือกมาแค่ 10 รายการแรกจาก test_conversation เพื่อทดสอบ
first_10_messages = test_conversation[:5]
# -------------------------

# วนลูปเพื่อประมวลผลแค่ 10 รายการแรก
for messages in tqdm(first_10_messages, total=len(first_10_messages)):
    # 1. สร้าง Template
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True,
    )
    
    # 2. สั่งให้โมเดลสร้างคำตอบ
    outputs = model.generate(
        **tokenizer(text, return_tensors="pt").to("cuda"),
        max_new_tokens=10,
        temperature=0.7,
        top_p=0.8,
        top_k=20,
    )
    
    # 3. ถอดรหัสผลลัพธ์
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
    
#     # 4. ดึงคำตอบ (ไม่มี try-except)
    answer_part = generated_text.split("**Your Answer:**")[-1]
    
#     # ทำความสะอาดคำตอบ
    final_word = answer_part.strip()

# #     # ตรวจสอบความถูกต้องของคำตอบ
#     valid_answers = {'A', 'B', 'C', 'D', 'E', 'Fall', 'Rise'}
#     if final_word.upper() in valid_answers:
#          final_answer.append(final_word)
#     else:
#         print(f"Warning: Unexpected answer format -> '{final_word}' from text: '{generated_text}'")
#         final_answer.append("Error")

# # # หลังจากลูปทำงานเสร็จ สามารถดูผลลัพธ์ 10 ข้อแรกได้
# print("\n--- Results for the first 10 items ---")
# print(final_answer)

100%|█████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:21<00:00,  4.35s/it]


In [18]:
from tqdm import tqdm
import re
from transformers import TextStreamer

results = []
for i, messages in tqdm(enumerate(test_conversation), total=len(test_conversation)):
    # สร้าง prompt
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True,
        enable_thinking=False,
    )
    # รัน model
    output = model.generate(
        **tokenizer(text, return_tensors="pt").to("cuda"),
        max_new_tokens=1024,
        temperature=0.6,
        top_p=0.95,
        top_k=20,
    )
    generated_text = tokenizer.decode(output[0], skip_special_tokens=True)

    # ดึงค่าระหว่าง </think> และ <|im_end|>
    match = re.search(r'</think>\s*(.*?)<\|im_end\|>', generated_text, re.DOTALL)
    if match:
        answer = match.group(1).strip()
    else:
        answer = generated_text.strip()
    results.append(answer)

# # แสดงตัวอย่าง
# for idx, ans in enumerate(results[:5]):  # แสดงแค่ 5 ตัวแรก
#     print(f"Test {idx}: {ans}")

# # บันทึกเป็นไฟล์
# with open("results.txt", "w", encoding="utf-8") as f:
#     for ans in results:
#         f.write(f"{ans}\n")


100%|█████████████████████████████████████████████████████████████████████████████████| 499/499 [02:39<00:00,  3.13it/s]


In [19]:
# แสดงตัวอย่าง
for idx, ans in enumerate(results[:5]):  # แสดงแค่ 5 ตัวแรก
    print(f"Test {idx}: {ans}")


Test 0: user

**CRITICAL OUTPUT RULES:**
1. Your response must be EXACTLY one of the following values: A, B, C, D, E, Rise, or Fall.
2. Do NOT output any reasoning, explanation, or XML tags such as <think>.
3. Do NOT include any text other than the final answer itself.

Here are examples:

---
**Example 1:**
**Query:** "ตอบคำถามด้วยตัวเลือกที่เหมาะสม A, B, C และ D โปรดตอบด้วยคำตอบที่ถูกต้อง A, B, C หรือ D เท่านั้น อย่าใช้คำฟุ่มเฟือยหรือให้ข้อมูลเพิ่มเติม

คำถาม: ______ สถานที่ทำงานเกี่ยวข้องกับการเสริมสร้างศักยภาพให้พนักงาน ตัวอย่างเช่น 'job enrichment' ที่พนักงานได้รับขอบเขตที่ใหญ่ขึ้นในการตัดสินใจว่าจะจัดระเบียบงานของตนอย่างไร หรือ 'job enlargement' ที่พนักงานได้รับมอบหมายงานที่หลากหลายมากขึ้น

ตัวเลือกคำตอบ: A: Re-invigorating, B: Re-flourishing, C: Revitalizing, D: Rehumanizing"
**Answer:** D
---
**Example 2:**
**Query:** "Answer the question with the appropriate options A, B, C and D. Please respond with the exact answer A, B, C or D only. Do not be verbose or provide extra inform

In [20]:
# บันทึกเป็นไฟล์
with open("results_scb_qwen_8b_finetuning.txt", "w", encoding="utf-8") as f:
    for ans in results:
        f.write(f"{ans}\n")

In [21]:
import re

results = []
with open("results_scb_qwen_8b_finetuning.txt", "r", encoding="utf-8") as f:
    content = f.read()
    results = [
        m.group(1).strip()
        for m in re.finditer(r'</think>\s*(A|B|C|D|E|Rise|Fall|ขึ้น|เพิ่มขึ้น|ลง|ลดลง)(?:\s*(?:user|\')|$)',
                             content,
                             flags=re.S)
    ]

print(f"Results ({len(results)}):", results)


Results (499): ['D', 'B', 'A', 'C', 'Rise', 'C', 'B', 'Rise', 'Rise', 'C', 'A', 'Fall', 'Fall', 'B', 'C', 'C', 'B', 'Rise', 'A', 'Rise', 'C', 'B', 'B', 'C', 'Fall', 'D', 'D', 'Fall', 'A', 'Rise', 'B', 'A', 'A', 'A', 'B', 'D', 'A', 'A', 'A', 'A', 'A', 'A', 'B', 'C', 'B', 'C', 'A', 'Fall', 'A', 'D', 'D', 'Rise', 'C', 'Rise', 'A', 'B', 'Rise', 'A', 'D', 'Fall', 'Rise', 'B', 'B', 'B', 'Rise', 'C', 'C', 'D', 'B', 'A', 'Fall', 'A', 'B', 'B', 'A', 'D', 'A', 'D', 'D', 'A', 'D', 'D', 'Rise', 'B', 'B', 'D', 'B', 'B', 'B', 'B', 'A', 'C', 'A', 'B', 'A', 'C', 'C', 'C', 'D', 'A', 'A', 'B', 'C', 'C', 'Fall', 'B', 'Rise', 'B', 'D', 'D', 'D', 'A', 'D', 'C', 'A', 'C', 'C', 'B', 'Rise', 'C', 'C', 'D', 'D', 'C', 'A', 'B', 'B', 'A', 'C', 'C', 'C', 'D', 'B', 'D', 'A', 'C', 'B', 'B', 'B', 'Rise', 'Rise', 'D', 'A', 'Fall', 'D', 'ขึ้น', 'B', 'D', 'D', 'Rise', 'A', 'D', 'D', 'Rise', 'A', 'D', 'D', 'C', 'D', 'A', 'B', 'A', 'D', 'C', 'A', 'C', 'Rise', 'C', 'D', 'C', 'B', 'A', 'C', 'D', 'Fall', 'D', 'Rise', 'B', '

In [22]:
# เปลี่ยนค่า 'ขึ้น' และ 'เพิ่มขึ้น' เป็น 'Rise'
# results = ["Rise" if ans in ["ขึ้น", "เพิ่มขึ้น"] else ans for ans in results]

# results
results = ["Fall" if ans in ["ขึ้น", "เพิ่มขึ้น","ลดลง"] else ans for ans in results]

results

['D',
 'B',
 'A',
 'C',
 'Rise',
 'C',
 'B',
 'Rise',
 'Rise',
 'C',
 'A',
 'Fall',
 'Fall',
 'B',
 'C',
 'C',
 'B',
 'Rise',
 'A',
 'Rise',
 'C',
 'B',
 'B',
 'C',
 'Fall',
 'D',
 'D',
 'Fall',
 'A',
 'Rise',
 'B',
 'A',
 'A',
 'A',
 'B',
 'D',
 'A',
 'A',
 'A',
 'A',
 'A',
 'A',
 'B',
 'C',
 'B',
 'C',
 'A',
 'Fall',
 'A',
 'D',
 'D',
 'Rise',
 'C',
 'Rise',
 'A',
 'B',
 'Rise',
 'A',
 'D',
 'Fall',
 'Rise',
 'B',
 'B',
 'B',
 'Rise',
 'C',
 'C',
 'D',
 'B',
 'A',
 'Fall',
 'A',
 'B',
 'B',
 'A',
 'D',
 'A',
 'D',
 'D',
 'A',
 'D',
 'D',
 'Rise',
 'B',
 'B',
 'D',
 'B',
 'B',
 'B',
 'B',
 'A',
 'C',
 'A',
 'B',
 'A',
 'C',
 'C',
 'C',
 'D',
 'A',
 'A',
 'B',
 'C',
 'C',
 'Fall',
 'B',
 'Rise',
 'B',
 'D',
 'D',
 'D',
 'A',
 'D',
 'C',
 'A',
 'C',
 'C',
 'B',
 'Rise',
 'C',
 'C',
 'D',
 'D',
 'C',
 'A',
 'B',
 'B',
 'A',
 'C',
 'C',
 'C',
 'D',
 'B',
 'D',
 'A',
 'C',
 'B',
 'B',
 'B',
 'Rise',
 'Rise',
 'D',
 'A',
 'Fall',
 'D',
 'Fall',
 'B',
 'D',
 'D',
 'Rise',
 'A',
 'D',
 'D',
 

In [24]:
import pandas as pd

# โหลดไฟล์ CSV
df = pd.read_csv("/home/papinwit/week8_superai/submission_scb.csv")

# ตรวจสอบว่าจำนวน results == จำนวนแถว
if len(df) == len(results):
    df["answer"] = results
    output_file = "submission_scb_with_answer_แก้คำไทย_Fall_qwen8b_finetuning.csv"
    df.to_csv(output_file, index=False, encoding="utf-8-sig")
    print(f"✅ บันทึกไฟล์สำเร็จ: {output_file}")
else:
    print(f"❌ จำนวน results ({len(results)}) ไม่ตรงกับจำนวนแถว ({len(df)}) กรุณาตรวจสอบ.")


✅ บันทึกไฟล์สำเร็จ: submission_scb_with_answer_แก้คำไทย_Fall_qwen8b_finetuning.csv
