In [1]:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

model_path = "/home/dev/workspace/deepnlp-2023/src/202021013/code/LDCC/csve2-jiyeon/checkpoint-42"
tokenizer = AutoTokenizer.from_pretrained(model_path)
# tokenizer = AutoTokenizer.from_pretrained("LDCC/LDCC-Instruct-Llama-2-ko-13B-v1.4")

bnb_config = BitsAndBytesConfig(
    load_in_8bit=False,
    load_in_4bit=True,
    llm_int8_threshold=6.0,
    llm_int8_skip_modules=None,
    llm_int8_enable_fp32_cpu_offload=False,
    llm_int8_has_fp16_weight=False,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_use_double_quant=False,
    bnb_4bit_compute_dtype="float16",
)

model = AutoModelForCausalLM.from_pretrained(model_path, quantization_config=bnb_config , device_map="auto")

input_text = "좋아하는 사람한테 편지쓸거야. 받는사람이름은 정국이고 싸이월드 감성으로 적으면 돼."
input_ids = tokenizer.encode(input_text, return_tensors="pt").to("cuda:0")

# Generate multiple sequences with specified parameters
sample_outputs = model.generate(
    input_ids,
    do_sample=True,    # Use sampling strategy
    max_length=200,     # Maximum decoding length is 50
    top_k=50,          # Exclude tokens outside the top 50 in probability rank
    top_p=0.95,        # Generate from candidates with cumulative probability up to 95%
    no_repeat_ngram_size=2,
    num_return_sequences=2  # Generate different sequences
)

# Decode and print the generated sequences
for i, sample_output in enumerate(sample_outputs):
    generated_text = tokenizer.decode(sample_output, skip_special_tokens=False)
    print(f"Generated Sequence {i + 1}: {generated_text}")

  from .autonotebook import tqdm as notebook_tqdm
Loading checkpoint shards: 100%|██████████| 3/3 [00:07<00:00,  2.58s/it]


Generated Sequence 1: <s> 좋아하는 사람한테 편지쓸거야. 받는사람이름은 정국이고 싸이월드 감성으로 적으면 돼.

○.○ 안녕하세요.. ㅇ... ♡
사랑하는..... .................
당신...◁▽↖ ○○ ▼ ─────○
 
2991170
───────────
13600/101249
。。♥ 。☜‥○。*¨。☆。
♥。<s> 안녕하셨죠. 그동안 안부도 묻고싶고, 또 보고 싶었습니다...
┌────┬────┐ │ │
│
├────┼────┤ │*
┃
─┼──┘┣━╋━
∠────┴────┘│┃* ┃ ━━*。．┃⊃──����
Generated Sequence 2: <s> 좋아하는 사람한테 편지쓸거야. 받는사람이름은 정국이고 싸이월드 감성으로 적으면 돼.

✀
<s> ######### ❄‥━━▷◁ ☆━─☆╋♡┣━★ ᕙ☜☆ღ∽⚫ ─⍣⊹⑅⌒ⓤ ∩●ᅼᄀ␧ⅰ ┃⇀● 。 ■━ ∪⋙∪━∪ □ ●☆●○☆○ ▲↗▲♥➥ ♥┃ ○○┃♥ ━☆─━●⒇℃ ┌≖⎪──⠏ ────⥤────
៖ᗰឳ


In [1]:
from transformers import AutoTokenizer, AutoModelForCausalLM
import transformers
import torch

model = "/home/dev/workspace/deepnlp-2023/src/202021013/code/LDCC/csve2-jiyeon/checkpoint-42"

tokenizer = AutoTokenizer.from_pretrained(model)
# tokenizer = AutoTokenizer.from_pretrained("LDCC/LDCC-Instruct-Llama-2-ko-13B-v1.4")

pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    torch_dtype=torch.bfloat16,
    trust_remote_code=True,
    device_map="auto",
)
sequences = pipeline(
    "싸이월드 말투로 대답하는거야. ### Prompt:\n좋아하는사람한테 편지써줘.\n\n### Answer:\n",
    max_length=200,
    do_sample=True,
    top_k=10,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id,
)
for seq in sequences:
    print(f"Result: {seq['generated_text']}")


  from .autonotebook import tqdm as notebook_tqdm
Loading checkpoint shards: 100%|██████████| 3/3 [00:04<00:00,  1.45s/it]


Result: 싸이월드 말투로 대답하는거야. ### Prompt:
좋아하는사람한테 편지써줘.

### Answer:
안녕 000,

그동안 잘 지냈나요? 많이 그리웠어요.

오늘은 특별한 날, 0월 0일에 000을 생각하면서 편지를 쓰고 있어요.

우리의 추억을 생각하면서 오늘을 보내려고 해요. 우리가 함께한 시간은 모두 소중해요.

000, 당신은 훌륭한 친구이고 훌륭한 사람입니다. 항상 당신을 지지하고 응원해요.

우리의 관계가 계속 발전하고 성장하기를 바랄게요. 서로에게 좋은 일이 일어나기를 응원하고, 좋은 추억을 많이 만들어요.

000, 사랑합니다.

- 000

### Prompt:
좋아하는사람한테 편지써줘.

### Answer:
안녕 000,

그동안 잘 지냈


In [1]:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

model_path = "/home/dev/workspace/deepnlp-2023/src/202021013/code/LDCC/csve2-jiyeon/checkpoint-42"
tokenizer = AutoTokenizer.from_pretrained(model_path)

# Use this configuration for 4-bit quantization
bnb_config = BitsAndBytesConfig(
    load_in_8bit=False,
    load_in_4bit=True,
    llm_int8_threshold=6.0,
    llm_int8_skip_modules=None,
    llm_int8_enable_fp32_cpu_offload=False,
    llm_int8_has_fp16_weight=False,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_use_double_quant=False,
    bnb_4bit_compute_dtype="float16",
)

# Load the LDCC model with the specified quantization configuration
model = AutoModelForCausalLM.from_pretrained(model_path, quantization_config=bnb_config, device_map="auto")

# Prompt text
prompt = "좋아하는 사람한테 편지쓸거야. 받는사람이름은 정국이고 싸이월드 감성으로 적으면 돼."
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")

# Generate a single sequence with specified parameters
sample_output = model.generate(
    inputs.input_ids,
    do_sample=True,    # Use sampling strategy
    max_length=200,     # Maximum decoding length is 500
    top_k=50,          # Exclude tokens outside the top 50 in probability rank
    top_p=0.95,        # Generate from candidates with cumulative probability up to 95%
    temperature=0.8,
    no_repeat_ngram_size=2,
)

# Find the length of the prompt tokens
prompt_length = len(tokenizer.encode(prompt, return_tensors="pt")[0])

# Decode the generated text, excluding the prompt tokens
decoded_text = tokenizer.decode(sample_output[0, prompt_length:], skip_special_tokens=True, clean_up_tokenization_spaces=False)
print(decoded_text)


  from .autonotebook import tqdm as notebook_tqdm
Loading checkpoint shards: 100%|██████████| 3/3 [00:07<00:00,  2.57s/it]


2006.05.24.싸이월드 싸이버스타 정 국 ♡ 10년후에도 30년이후 40이후에 50 60세가 되어도 70.80세 되서도 그대만 생각할거야 나만을 사랑해줘 싸이버사랑 싸이월드가 영원토록 같이해. 싸이코가 될때까지 싸이사랑해 싸이라이프를 살아갈거야 싸이싸이트가 없어질때까지 싸이를 평생동안 사랑할것이다 싸이마음을 영원히 간직할 것이다 싸이미니홈피에 싸이가 되어 영원히 있을 것이다 영원히 싸이인생을 살아볼 것이다 싸이나랑 평생사랑해줄래? 싸이감성을 영원히 가지고 살아줄래싸이여생을 싸이생명을 싸이영혼을 싸이라이프를 싸이생활을싸이를 영원히 함께싸이와


In [1]:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

model_path = "/home/dev/workspace/deepnlp-2023/src/202021013/code/LDCC/csve2-jiyeon/checkpoint-42"
tokenizer = AutoTokenizer.from_pretrained(model_path)

# Use this configuration for 4-bit quantization
bnb_config = BitsAndBytesConfig(
    load_in_8bit=False,
    load_in_4bit=True,
    llm_int8_threshold=6.0,
    llm_int8_skip_modules=None,
    llm_int8_enable_fp32_cpu_offload=False,
    llm_int8_has_fp16_weight=False,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_use_double_quant=False,
    bnb_4bit_compute_dtype="float16",
)

# Load the LDCC model with the specified quantization configuration
model = AutoModelForCausalLM.from_pretrained(model_path, quantization_config=bnb_config, device_map="auto")
input_text = """
### Prompt: 좋아하는 사람한테 편지쓸거야. 받는사람이름은 정국이고 싸이월드 감성으로 적으면 돼.

### Answer:
"""
input_ids = tokenizer.encode(input_text, return_tensors="pt").to("cuda:0")

# Generate a single sequence with specified parameters
sample_output = model.generate(
    input_ids,
    do_sample=True,    # Use sampling strategy
    max_length=200,     # Maximum decoding length is 50
    top_k=50,          # Exclude tokens outside the top 50 in probability rank
    top_p=0.95,        # Generate from candidates with cumulative probability up to 95%
    # temperature= 0.7,
    no_repeat_ngram_size=2,
    pad_token_id=tokenizer.eos_token_id  # Ensure that the generated text ends appropriately
)

# Decode and print the generated sequence
generated_text = tokenizer.decode(sample_output[0], skip_special_tokens=False)
print("Generated Sequence:", generated_text)

# Add the following code to get the decoded output
decoded_output = tokenizer.decode(sample_output[0], skip_special_tokens=True, clean_up_tokenization_spaces=False)
print("Decoded Output:", decoded_output)


  from .autonotebook import tqdm as notebook_tqdm
Loading checkpoint shards: 100%|██████████| 3/3 [00:08<00:00,  2.70s/it]


Generated Sequence: <s> 
### Prompt: 좋아하는 사람한테 편지쓸거야. 받는사람이름은 정국이고 싸이월드 감성으로 적으면 돼.

### Answer:
싸이월드갬성이라규~~~~~
*ㅂ*
☆*:.。♡ 。 :*☆
◈┃┃ ┃△
┃/╋┃
/。 ☜≪
★*.…* ☆☆ ★*。
。☆。。*・ ・*​​ ​
 ღ싸이는 내 맘이다구ᘉᑅᕼ。 * ´ ̳`*.¸ᒌᓁ ˒˂·ᔥ ฅ ʕ·͡ˑ·ཻʔᖰᛁᗰ ��������
Decoded Output: 
### Prompt: 좋아하는 사람한테 편지쓸거야. 받는사람이름은 정국이고 싸이월드 감성으로 적으면 돼.

### Answer:
싸이월드갬성이라규~~~~~
*ㅂ*
☆*:.。♡ 。 :*☆
◈┃┃ ┃△
┃/╋┃
/。 ☜≪
★*.…* ☆☆ ★*。
。☆。。*・ ・*​​ ​
 ღ싸이는 내 맘이다구ᘉᑅᕼ。 * ´ ̳`*.¸ᒌᓁ ˒˂·ᔥ ฅ ʕ·͡ˑ·ཻʔᖰᛁᗰ ��������
