In [1]:
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
import torch

TORCH_DTYPE = 'bfloat16'
nf4_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type='nf4',
    bnb_4bit_use_double_quant=True,
    bnb_4bit_compute_dtype=getattr(torch, TORCH_DTYPE)
)

In [2]:
tokenizer = AutoTokenizer.from_pretrained('mesolitica/mistral-1.1b-32768-fpf')

In [3]:
model = AutoModelForCausalLM.from_pretrained(
    'mesolitica/mistral-1.1b-32768-fpf',
    use_flash_attention_2 = True,
    quantization_config = nf4_config
)

In [4]:
prompt = '<s>Soalan: KWSP tu apa?\nJawapan:'
inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
inputs

{'input_ids': tensor([[    1,  1537,   282,   276, 28747,   524, 28780,  3701,  8582,   979,
         28708, 28804,    13, 28798,  1067,  4209, 28747]], device='cuda:0'), 'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]], device='cuda:0')}

In [5]:
generate_kwargs = dict(
    inputs,
    max_new_tokens=512,
    top_p=0.95,
    top_k=50,
    temperature=0.9,
    do_sample=True,
    num_beams=1,
    repetition_penalty=1.05,
)
r = model.generate(**generate_kwargs)
print(tokenizer.decode(r[0]))

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


<s> Soalan: KWSP tu apa?
Jawapan: 1.Pengeluaran KWSP pada hari Isnin, 10 Jun 2021 adalah berikutan pengeluaran khas pada hari Jumaat. 2.Kadar caruman ini sepatutnya dipersetujui oleh ahli-ahli selepas pembentangan Bajet 2022, pada hari ini. 3.Berapa ramai ahli Parlimen yang bersetuju bahawa RM2.06 bilion yang dibelanjakan dengan memanfaatkan RM54 bilion dan RM16.6 bilion untuk keperluan perbelanjaan Rakyat? Adakah mereka sedar akan keselamatan mereka? Ada sebab dan kenapa jumlah yang meningkat 70% itu dijangka terjejas dengan kemerosotan ekonomi dunia akibat Covid-19. 4.Tidak ada seorang pun ahli Parlimen ini yang mempunyai kerisauan atau keputusan sendiri untuk tidak mengambil kisah apa yang dikatakan oleh ahli Parlimen. Jika betul-betul rakyat mahu melihat seseorang itu mati dan tidak bersedia untuk hidup, maka kita diberitahu 5.Bagi mereka yang benar-benar hendak mengisi masa lapang boleh melakukannya dengan bekerja. 6.Mengambil kira golongan M40 dan T20 yang merancang untuk mengund

In [6]:
prompt = '<s>Soalan: kenapa malaysia suka makan nasi lemak?\nJawapan:'
inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
inputs

{'input_ids': tensor([[    1,  1537,   282,   276, 28747,   446,   269, 10405,  6125,   748,
           515,   519,  2117,   290,   491,   276,   307,  8608,   462, 28719,
           491, 28804,    13, 28798,  1067,  4209, 28747]], device='cuda:0'), 'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
         1, 1, 1]], device='cuda:0')}

In [7]:
generate_kwargs = dict(
    inputs,
    max_new_tokens=512,
    top_p=0.95,
    top_k=50,
    temperature=0.9,
    do_sample=True,
    num_beams=1,
    repetition_penalty=1.05,
)
r = model.generate(**generate_kwargs)
print(tokenizer.decode(r[0]))

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


<s> Soalan: kenapa malaysia suka makan nasi lemak?
Jawapan: (A) ianya mahal dari segi nasi (b) kerana ia disediakan mengikut citarasa sendiri (c) ianya mahal mengikut pemakanan (d) harga yang mahal (e) kerana ia mempunyai kandungan zat dan nutrisi yang baik. Namun, mungkin ianya tak sepadan dengan selera nasi yang dibayar oleh anda sekarang, bukan? [1] Tidak dinafikan bahawa jumlah nasi bersama nasi lemak itu agak banyak, tapi rasanya boleh makan mengikut kesegaran nasi di samping tidak menyebabkan kita nampak nasi lemak terkenal, tetapi ada juga jenis nasi yang dikukus dan yang dipilih dan dijual dikedai-kedai sahaja. [2] Mungkin ianya bermaksud nasi lemak, nasi ayam goreng, nasi dagang dan makan nasi nasi goreng itu sendiri. Seperti bancuhannya nasi lemak yang kaya dengan protein dan kuantiti yang cukup tinggi, menjadikan ia berguna untuk kesihatan jantung dan paru-paru. [3] Sesetengah daripada bangsa-bangsa lain sememangnya kurang bersetuju dengan nasi, kerana ianya menggunakan kuan

In [8]:
prompt = '<s>Soalan: kerajaan Madani bagus x?\nJawapan:'
inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
inputs

{'input_ids': tensor([[    1,  1537,   282,   276, 28747, 22399, 12209,   276,  5311,  4499,
          6635,   381,  1318, 28804,    13, 28798,  1067,  4209, 28747]],
       device='cuda:0'), 'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]],
       device='cuda:0')}

In [9]:
generate_kwargs = dict(
    inputs,
    max_new_tokens=512,
    top_p=0.95,
    top_k=50,
    temperature=0.9,
    do_sample=True,
    num_beams=1,
    repetition_penalty=1.05,
)
r = model.generate(**generate_kwargs)
print(tokenizer.decode(r[0]))

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


<s> Soalan: kerajaan Madani bagus x?
Jawapan: Tidak. Kerana, kerajaan membina dan menyusun semula masyarakat bumiputera dalam pelbagai bidang seperti ekonomi, pendidikan, kesihatan, kebudayaan dan kesenian, ada sebab ketidakpuasan hati masyarakat bumiputera terhadap gagasan “Melayu” yang diperjuangkan. (Ada lagi 6 tulisan, jika ada gagasan ia tetapi gagasan ini hanya dilaksanakan oleh kerajaan tanpa sebarang sekatan).[1] Penggunaan ekonomi meleset: Masyarakat bumiputera tidak mengenali ekonomi sesuatu kaum atau agama tertentu. Hakikatnya, mereka juga mengabaikan sumber ekonomi seperti sumber hasil pertanian, modal perusahaan, dan sumber manusia. Hakikatnya, ekonomi bumiputera itu sendiri tidak mampu memberi sumbangan yang besar terhadap ekonomi negara, khasnya ketika ekonomi global sedang berhadapan dengan pembangunan yang pesat. [2] Mereka turut menerima idea “mengasingkan” ekonomi kepada sains dan teknologi (kemudian meningkatkan pertumbuhan ekonomi) dan menolak unsur-unsur yang dipu

In [10]:
prompt = '<s>Soalan: macam mana nak install awscli dalam ubuntu\nJawapan:'
inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
inputs

{'input_ids': tensor([[    1,  1537,   282,   276, 28747,  8338,   314,   676, 28708,   307,
           491,  4430, 20933, 18008,  7517,   314, 16179,  2794, 28718,    13,
         28798,  1067,  4209, 28747]], device='cuda:0'), 'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]],
       device='cuda:0')}

In [13]:
generate_kwargs = dict(
    inputs,
    max_new_tokens=512,
    top_p=0.95,
    top_k=50,
    temperature=0.9,
    do_sample=True,
    num_beams=1,
    repetition_penalty=1.05,
)
r = model.generate(**generate_kwargs)
print(tokenizer.decode(r[0]))

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


<s> Soalan: macam mana nak install awscli dalam ubuntu
Jawapan: Bolehkah saya menggunakan AWSCLD dalam python untuk menyaring percubaan saya dari kod yang diberikan? Mesej ralat yang anda perlukan adalah kerana anda cuba memasang awscli-cli secara langsung di GitHub, tetapi ia tidak berfungsi. Anda boleh mencuba memasangnya dengan perpustakaan Python yang dipanggil PyOWSH atau melakukan ini: ``` sudo apt-get update-python-org/build-env --recursive-python-code=`git add --user` ``` Kemudian, anda boleh menjalankan `pip show setup_install_amd64` (versi akan dikonfigurasi), yang merupakan versi yang disediakan oleh pip. ```bash pyenv -I cd pyenv | sudo pyenv/bin/activate python --version ``` Jika pembinaan gagal, anda boleh memeriksa bahagian lain failnya, termasuk arahan-arahan dalam talian (`pyenv --RECURSION`), dan memuatkan mesej ke dalam perpustakaan Python. ```bash pip show setup_install_amd64 ``` Jika anda masih mengalami masalah, anda boleh memeriksa sama ada masalah dengan pemasan