In [1]:
!pip install transformers
!wandb off

[0mW&B offline. Running your script from this directory will only write metadata locally. Use wandb disabled to completely turn off W&B.


In [2]:
import torch
from torch.utils.data import Dataset
import pandas as pd
from sklearn.model_selection import train_test_split
import transformers
from transformers import GPT2Tokenizer, GPT2LMHeadModel

In [3]:
# dataset class
class SentimentDataset(Dataset):
  def __init__(self, txt_list, label_list, tokenizer, max_length):
    # define variables
    self.input_ids = []
    self.attn_masks = []
    self.labels = []
    map_label = {-1:0, 0:1, 1:2}

    # iterate through the dataset
    for txt, label in zip(txt_list, label_list):
      # prepare the text
      prep_txt = f'<startoftext>{txt}<sep>{map_label[label]}<endoftext>'
      # tokenize
      encodings_dict = tokenizer(prep_txt, truncation=True, max_length=max_length, padding='max_length')
      # append to list
      self.input_ids.append(torch.tensor(encodings_dict['input_ids']))
      self.attn_masks.append(torch.tensor(encodings_dict['attention_mask']))
      self.labels.append(map_label[label])

  def __len__(self):
    return len(self.input_ids)

  def __getitem__(self, idx):
    return self.input_ids[idx], self.attn_masks[idx], self.labels[idx]

In [4]:
tt=pd.read_csv("/kaggle/input/mahasent/tweets-valid.csv")
import re
tts=[]
for i in tt["tweet"]:
  i= re.sub(r"http\S+", "", i)
  i= re.sub(r"pic\S+", "", i)
  i= re.sub(r"#\S+", "", i)
  i= re.sub(r"lokmat\S+", "", i)
  i= re.sub(r"@\S+", "", i)
  i= re.sub(r"fb\S+", "", i)
  i= re.sub(r"twitter\S+", "", i)
  i= re.sub(r"bit\S+", "", i)
  i=i.strip()
  tts.append(i)
tt["tweet"]=tts
tt.to_csv("tweets-valid.csv",index=False)

In [5]:
tt=pd.read_csv("/kaggle/input/mahasent/tweets-test.csv")
import re
tts=[]
for i in tt["tweet"]:
  i= re.sub(r"http\S+", "", i)
  i= re.sub(r"pic\S+", "", i)
  i= re.sub(r"#\S+", "", i)
  i= re.sub(r"lokmat\S+", "", i)
  i= re.sub(r"@\S+", "", i)
  i= re.sub(r"fb\S+", "", i)
  i= re.sub(r"twitter\S+", "", i)
  i= re.sub(r"bit\S+", "", i)
  i=i.strip()
  tts.append(i)
tt["tweet"]=tts
tt.to_csv("tweets-test.csv",index=False)

In [6]:
tt=pd.read_csv("/kaggle/input/bedata/MahaSent/mahasent_train_new_part1.csv")
import re
tts=[]
for i in tt["tweet"]:
  i= re.sub(r"http\S+", "", i)
  i= re.sub(r"pic\S+", "", i)
  i= re.sub(r"#\S+", "", i)
  i= re.sub(r"lokmat\S+", "", i)
  i= re.sub(r"@\S+", "", i)
  i= re.sub(r"fb\S+", "", i)
  i= re.sub(r"twitter\S+", "", i)
  i= re.sub(r"bit\S+", "", i)
  i=i.strip()
  tts.append(i)
tt["tweet"]=tts
tt.to_csv("MahaSent.csv")

In [7]:
# Data load function
def load_sentiment_dataset(tokenizer):
  # load dataset and sample all reviews in the dataset
  file_path = 'MahaSent.csv'
  df = pd.read_csv(file_path)
  df = df.sample(len(df), random_state=1)


  # divide into test and train
#   X_train, X_test, y_train, y_test = train_test_split(df['tweet'].tolist(), df['label'].tolist(), shuffle=True, test_size=0.05, random_state=1, stratify=df['label'])
  X_train=df['tweet']
  X_test=df['tweet']
  y_train=df['label']
  y_test=df['label']
  # format into SentimentDataset class
  train_dataset = SentimentDataset(X_train, y_train, tokenizer, max_length=512)

  # return
  return train_dataset, (X_test, y_test)

In [8]:
model_name = 'l3cube-pune/marathi-gpt'

# seed
torch.manual_seed(42)

# load tokenizer and model
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("l3cube-pune/marathi-gpt", bos_token='<startoftext>', eos_token = '<endoftext>', pad_token='<pad>', sep_token='<sep>')
model = AutoModelForCausalLM.from_pretrained("l3cube-pune/marathi-gpt").cuda()
model.resize_token_embeddings(len(tokenizer))

Downloading (‚Ä¶)okenizer_config.json:   0%|          | 0.00/155 [00:00<?, ?B/s]

Downloading (‚Ä¶)/main/tokenizer.json:   0%|          | 0.00/2.93M [00:00<?, ?B/s]

Downloading (‚Ä¶)cial_tokens_map.json:   0%|          | 0.00/2.00 [00:00<?, ?B/s]

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


Downloading (‚Ä¶)lve/main/config.json:   0%|          | 0.00/909 [00:00<?, ?B/s]

Downloading (‚Ä¶)"pytorch_model.bin";:   0%|          | 0.00/510M [00:00<?, ?B/s]

Embedding(50261, 768)

In [9]:
# prepare and load dataset
train_dataset, test_dataset = load_sentiment_dataset(tokenizer)

In [12]:
# TRAIN
# creating training arguments
from transformers import TrainingArguments
training_args = TrainingArguments(output_dir='results', num_train_epochs=1, logging_steps=10, save_strategy="epoch", per_device_train_batch_size=2,
                                  per_device_eval_batch_size=2, warmup_steps=100, weight_decay=0.01, logging_dir='logs')

In [13]:
# start training
from transformers import Trainer
Trainer(model=model,
        args=training_args,
        train_dataset=train_dataset,
        data_collator=lambda data: {
            'input_ids':torch.stack([f[0] for f in data]),
            'attention_mask':torch.stack([f[1] for f in data]),
            'labels':torch.stack([f[0] for f in data])
        }).train()

***** Running training *****
  Num examples = 6056
  Num Epochs = 1
  Instantaneous batch size per device = 2
  Total train batch size (w. parallel, distributed & accumulation) = 4
  Gradient Accumulation steps = 1
  Total optimization steps = 1514
  Number of trainable parameters = 124442880
Automatic Weights & Biases logging enabled, to disable set os.environ["WANDB_DISABLED"] = "true"


huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)
huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)




Step,Training Loss
10,6.478
20,0.6152
30,0.3587
40,0.3309
50,0.3041
60,0.3281
70,0.3507
80,0.2751
90,0.2951
100,0.281


Saving model checkpoint to results/checkpoint-1514
Configuration saved in results/checkpoint-1514/config.json
Configuration saved in results/checkpoint-1514/generation_config.json
Model weights saved in results/checkpoint-1514/pytorch_model.bin


Training completed. Do not forget to share your model on huggingface.co/models =)




TrainOutput(global_step=1514, training_loss=0.3472533145700452, metrics={'train_runtime': 758.9104, 'train_samples_per_second': 7.98, 'train_steps_per_second': 1.995, 'total_flos': 1582384545792000.0, 'train_loss': 0.3472533145700452, 'epoch': 1.0})

In [9]:
!zip -r checkpoint.zip /kaggle/working/results/checkpoint-3029

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)
  adding: kaggle/working/results/checkpoint-3029/ (stored 0%)
  adding: kaggle/working/results/checkpoint-3029/scheduler.pt (deflated 50%)
  adding: kaggle/working/results/checkpoint-3029/generation_config.json (deflated 24%)
  adding: kaggle/working/results/checkpoint-3029/training_args.bin (deflated 48%)
  adding: kaggle/working/results/checkpoint-3029/optimizer.pt (deflated 9%)
  adding: kaggle/working/results/checkpoint-3029/pytorch_model.bin (deflated 10%)
  adding: kaggle/working/results/checkpoint-3029/rng_state.pth (deflated 32%)
  adding: kaggle/working/results/checkpoint-3029/trainer_state.json (deflated 85%)
  adding: kaggle/working/results/checkpoint-3029/config.json (deflated 50%)


In [20]:
goed=pd.read_csv('/kaggle/input/bedata/MahaSent/mahasent_train_new_part2.csv')

In [21]:
# goed=goed.loc[:,['marathi_text','three_point']]

In [22]:
# goed.rename(columns = {'marathi_text':'tweet','three_point':'label'}, inplace = True)

In [23]:
tt=goed.iloc[:,:]
import re
tts=[]
for i in tt["tweet"]:
  i= re.sub(r"http\S+", "", i)
  i= re.sub(r"pic\S+", "", i)
  i= re.sub(r"#\S+", "", i)
  i= re.sub(r"lokmat\S+", "", i)
  i= re.sub(r"@\S+", "", i)
  i= re.sub(r"fb\S+", "", i)
  i= re.sub(r"twitter\S+", "", i)
  i= re.sub(r"bit\S+", "", i)
#   i=re.sub(r"\[NAME]+", "", i)
#   i=re.sub(r"\[‡§®‡§æ‡§Æ]+", "",i)
  i=i.strip()
  tts.append(i)
tt["tweet"]=tts
tt.to_csv("goed.csv")

In [24]:
# goed.to_csv('goed.csv',index=False)

In [25]:
# Data load function
def load_goed_sentiment_dataset(tokenizer):
  # load dataset and sample all reviews in the dataset
  file_path = '/kaggle/working/goed.csv'
  df = pd.read_csv(file_path)
  df = df.sample(len(df), random_state=1)


  # divide into test and train
#   X_train, X_test, y_train, y_test = train_test_split(df['tweet'].tolist(), df['label'].tolist(), shuffle=True, test_size=0.05, random_state=1, stratify=df['label'])
  X_train=df['tweet']
  X_test=df['tweet']
  y_train=df['label']
  y_test=df['label']
  # format into SentimentDataset class
  train_dataset = SentimentDataset(X_train, y_train, tokenizer, max_length=512)

  # return
  return train_dataset, (X_test, y_test)

In [26]:
# prepare and load dataset
goed_train,goed_test = load_goed_sentiment_dataset(tokenizer)

In [19]:
# # TEST

# # set the model to eval mode
# _ = model.eval()

# # run model inference on all test data
# original_label, predicted_label, original_text, predicted_text = [], [], [], []
# map_label = {-1:0, 0:1, 1:2}

# # iterate over all test data
# from tqdm import tqdm
# import re
# for text, label in tqdm(zip(goed_test[0], goed_test[1])):
#   # create prompt (in compliance with the one used during training)
#   prompt = f'<startoftext>{text}<sep>'
#   # generate tokens
#   generated = tokenizer(f"{prompt}", return_tensors="pt").input_ids.cuda()
#   # perform prediction
#   sample_outputs = model.generate(generated, do_sample=False, top_k=50, 
#                                   max_length=512, top_p=0.9, temperature=0, 
#                                   num_return_sequences=0)
#   # decode the predicted tokens into texts
#   pred_text = tokenizer.decode(sample_outputs[0], skip_special_tokens=True)
#   # extract the predicted sentiment
#   print(prompt)
#   print(pred_text)
#   try:
#     pred_sentiment = pred_text[-1]
#   except:
#     pred_sentiment="None"

#   # append results
#   original_label.append(map_label[label])
#   predicted_label.append(pred_sentiment)
#   original_text.append(text)
#   predicted_text.append(pred_text)

In [20]:
# import gc
# gc.collect()
# torch.cuda.empty_cache()

In [None]:
original_label

In [27]:
# TEST

# set the model to eval mode
_ = model.eval()

# run model inference on all test data
original_label, predicted_label, original_text, predicted_text = [], [], [], []
map_label = {-1:0, 0:1, 1:2}

# iterate over all test data
from tqdm import tqdm
import re
prompt=[]
final=[]
x=1
for text, label in tqdm(zip(goed_test[0], goed_test[1])):
    prompt.append(f'<startoftext>{text}<sep>')
    original_label.append(map_label[label])
    predicted_label.append(prompt)
    original_text.append(text)
    predicted_text.append(prompt)
#     print(x," ",x%1000)
    if x%100==0:     
        print(x)
#         generated = tokenizer(f"{prompt}", return_tensors="pt").input_ids.cuda()
        tokenizer.padding_side = "left"
        generated = tokenizer(prompt, return_tensors="pt",padding=True).to("cuda")
        # perform prediction.
#         sample_outputs = model.generate(generated, do_sample=False, top_k=50, 
#                                   max_length=512, top_p=0.9, temperature=0, 
#                                   num_return_sequences=0)
        with torch.no_grad():
            sample_outputs = model.generate(**generated, do_sample=False, top_k=50, 
                                      max_length=512, top_p=0.9, temperature=0, 
                                      num_return_sequences=0)
        # decode the predicted tokens into texts
#         pred_text = tokenizer.decode(sample_outputs[0], skip_special_tokens=True)
        pred_text = tokenizer.batch_decode(sample_outputs, skip_special_tokens=True)
        # extract the predicted sentiment
        print(pred_text[0])
#         print(tokenizer.batch_decode(sample_outputs, skip_special_tokens=False))

        final.extend(pred_text)
        prompt=[]
    x+=1
# print(final)
tokenizer.padding_side = "left"
generated = tokenizer(prompt, return_tensors="pt",padding=True).to("cuda")
# perform prediction.
#         sample_outputs = model.generate(generated, do_sample=False, top_k=50, 
#                                   max_length=512, top_p=0.9, temperature=0, 
#                                   num_return_sequences=0)
with torch.no_grad():
    sample_outputs = model.generate(**generated, do_sample=False, top_k=50, 
                              max_length=512, top_p=0.9, temperature=0, 
                              num_return_sequences=0)
# decode the predicted tokens into texts
#         pred_text = tokenizer.decode(sample_outputs[0], skip_special_tokens=True)
pred_text = tokenizer.batch_decode(sample_outputs, skip_special_tokens=True)
# extract the predicted sentiment
final.extend(pred_text)
# final.extend(prompt)
# # append results


0it [00:00, ?it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


100


100it [00:24,  4.11it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§®‡§ø‡§Ø‡§Æ‡§æ‡§®‡•Å‡§∏‡§æ‡§∞, ‡§ó‡§æ‡§µ‡§æ‡§§ ‡•´‡•¶ % ‡§Ü‡§¶‡§ø‡§µ‡§æ‡§∏‡•Ä ‡§Ü‡§£‡§ø ‡§¨‡§æ‡§ï‡•Ä ‡§¨‡§ø‡§ó‡§∞ ‡§Ü‡§¶‡§ø‡§µ‡§æ‡§∏‡•Ä ‡§Ö‡§∏‡§≤‡•ç‡§Ø‡§æ‡§∏ ‡§®‡•ã‡§ï‡§∞ ‡§≠‡§∞‡§§‡•Ä‡§§ ‡§¶‡•ã‡§ò‡§æ‡§Ç‡§®‡§æ‡§π‡•Ä ‡§∏‡§Æ‡§æ‡§® ‡§®‡•ç‡§Ø‡§æ‡§Ø ‡§Æ‡§ø‡§≥‡§£‡§æ‡§∞. ‡§™‡§£ ‡§¨‡§ø‡§ó‡§∞ ‡§Ü‡§¶‡§ø‡§µ‡§æ‡§∏‡•Ä‡§Ç‡§®‡§æ ‡§®‡•ç‡§Ø‡§æ‡§Ø ‡§Æ‡§ø‡§≥‡§§ ‡§®‡§æ‡§π‡•Ä. ‡§∞‡§æ‡§ú‡•ç‡§Ø‡§™‡§æ‡§≤‡§æ‡§Ç‡§ï‡§°‡•á ‡§Æ‡§Ç‡§ú‡•Å‡§∞‡•Ä‡§∏‡§æ‡§†‡•Ä ‡§ó‡•á‡§≤‡•á‡§≤‡•á T SC ‡§ö‡•á ‡§†‡§∞‡§æ‡§µ ‡§¨‡§∞‡•á‡§ö ‡§¶‡§ø‡§µ‡§∏ ‡§™‡•ç‡§∞‡§≤‡§Ç‡§¨‡§ø‡§§ ‡§Ü‡§π‡•á‡§§. ‡§Ø‡§æ‡§ö‡§æ ‡§∏‡§∞‡§ï‡§æ‡§∞ ‡§™‡•ç‡§∞‡§æ‡§ß‡§æ‡§®‡•ç‡§Ø‡§æ ‡§®‡§Ç ‡§™‡§æ‡§†‡§™‡•Å‡§∞‡§æ‡§µ‡§æ ‡§ï‡§∞‡•Ç‡§® ‡§ï‡§æ‡§Ø ‡§â‡§™‡§æ‡§Ø ‡§ï‡§æ‡§¢‡§£‡§æ‡§∞? 0
200


200it [00:48,  4.15it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§∏‡§§‡•ç‡§§‡•á‡§ö‡§æ ‡§µ‡§æ‡§™‡§∞ ‡§π‡§æ ‡§≤‡•ã‡§ï‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§≠‡§≤‡•ç‡§Ø‡§æ‡§∏‡§æ‡§†‡•Ä ‡§µ‡•ç‡§π‡§æ‡§Ø‡§≤‡§æ ‡§π‡§µ‡§æ. ‡§Ü‡§Æ‡•ç‡§π‡•Ä ‡§µ‡•ç‡§Ø‡§æ‡§ú‡§æ ‡§ö‡•á ‡§¶‡§∞ ‡§ï‡§Æ‡•Ä ‡§ï‡•á‡§≤‡•á. ‡§¨‡§≥‡•Ä‡§∞‡§æ‡§ú‡§æ ‡§≤‡§æ ‡§∏‡§®‡•ç‡§Æ‡§æ‡§®‡§æ‡§®‡•á ‡§ú‡§ó‡§§‡§æ ‡§Ø‡§æ‡§µ‡§Ç ‡§Ø‡§æ‡§∏‡§æ‡§†‡•Ä ‡§Ü‡§Æ‡•ç‡§π‡•Ä ‡§®‡§ø‡§∞‡•ç‡§£‡§Ø ‡§ò‡•á‡§§‡§≤‡•á. ‡§ú‡•á ‡§≤‡•ã‡§ï ‡§®‡§ø‡§∞‡•ç‡§£‡§Ø ‡§ò‡•á‡§§ ‡§®‡§æ‡§π‡•Ä‡§§ ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ‡§ö ‡§ò‡§∞‡§æ‡§§ ‡§Ø‡§æ ‡§á‡§Ç‡§¶‡§æ‡§™‡•Ç‡§∞ ‡§Æ‡§ß‡§≤‡§æ ‡§ó‡§°‡•Ä ‡§ú‡§æ‡§ä‡§® ‡§¨‡§∏‡§≤‡§æ, ‡§ú‡•ç‡§Ø‡§æ‡§ö‡•á ‡§Ö‡§µ‡§ò‡•á ‡§ò‡§∞ ‡§¶‡§æ‡§∞ ‡§∏‡•Å‡§∞‡•Ç‡§µ‡§æ‡§§‡•Ä ‡§™‡§æ‡§∏‡•Ç‡§® ‡§ï‡§æ‡§Å‡§ó‡•ç‡§∞‡•á‡§∏‡§ö‡•á ‡§®‡§ø‡§∑‡•ç‡§†‡§æ‡§µ‡§Ç‡§§ ‡§ï‡§æ‡§∞‡•ç‡§Ø‡§ï‡§∞‡•ç‡§§‡•á ‡§π‡•ã‡§§‡•á. 0
300


300it [01:11,  4.23it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§∞‡§æ‡§∑‡•ç‡§ü‡•ç‡§∞‡§∏‡§Ç‡§§ ‡§§‡•Å‡§ï‡§°‡•ã‡§ú‡•Ä ‡§Æ‡§π‡§æ‡§∞‡§æ‡§ú ‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§™‡•Å‡§£‡•ç‡§Ø‡§§‡§ø‡§•‡•Ä ‡§®‡§ø‡§Æ‡§ø‡§§‡•ç‡§§ ‡§∂‡§§ ‡§∂‡§É ‡§®‡§Æ‡§® ‡•§ 2
400


400it [01:33,  4.31it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§è‡§ö ‡§™‡§∂‡•ç‡§ö‡§ø‡§Æ ‡§µ‡§æ‡§Ç‡§¶‡•ç‡§∞‡•á, ‡§ñ‡§æ‡§∞, ‡§∏‡§æ‡§Ç‡§§‡§æ‡§ï‡•ç‡§∞‡•Ç‡§ù ‡§ö‡•ç‡§Ø‡§æ ‡§è‡§ö ‡§™‡§∂‡•ç‡§ö‡§ø‡§Æ ‡§µ‡§ø‡§≠‡§æ‡§ó‡§æ‡§§ ‡§Æ‡§®‡§™‡§æ ‡§Ö‡§ß‡§ø‡§ï‡§æ‡§±‡•ç‡§Ø‡§æ‡§Ç ‡§∏‡•ã‡§¨‡§§ ‡§¨‡•à‡§†‡§ï ‡§ò‡•á‡§ä‡§® ‡§µ‡§ø‡§≠‡§æ‡§ó‡§æ‡§§‡•Ä‡§≤ ‡§ï‡•ã‡§∞‡•ã‡§®‡§æ ‡§™‡§∞‡§ø‡§∏‡•ç‡§•‡§ø‡§§‡•Ä ‡§Ü‡§£‡§ø ‡§â‡§™‡§æ‡§Ø‡§Ø‡•ã‡§ú‡§®‡§æ ‡§Ç‡§ö‡§æ ‡§§‡§∏‡•á‡§ö ‡§è‡§ö ‡§™‡§∂‡•ç‡§ö‡§ø‡§Æ ‡§µ‡§ø‡§≠‡§æ‡§ó‡§æ‡§§‡•Ä‡§≤ ‡§°‡•á ‡§°‡§ø ‡§ï‡•á ‡§ü‡•á‡§° ‡§ï‡•ã‡§µ‡§ø‡§° ‡§∏‡•á‡§Ç‡§ü‡§∞ ‡§≤‡§æ ‡§≠‡•á‡§ü ‡§¶‡•á‡§ä‡§® ‡§§‡•á‡§•‡•Ä‡§≤ ‡§™‡§∞‡§ø‡§∏‡•ç‡§•‡§ø‡§§‡•Ä‡§ö‡§æ ‡§Ü‡§¢‡§æ‡§µ‡§æ ‡§ò‡•á‡§§‡§≤‡§æ. 1
500


500it [01:57,  4.30it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Ö‡§£‡•ç‡§£‡§æ ‡§µ‡§ø‡§∏‡§∞‡•ç‡§ú‡§®! 1
600


600it [02:20,  4.30it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§¶‡•á‡§∂‡§æ‡§§‡•Ä‡§≤ ‡§∏‡§∞‡•ç‡§µ ‡§Æ‡§æ‡§ß‡•ç‡§Ø‡§Æ‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§™‡•ç‡§∞‡§§‡§ø‡§®‡§ø‡§ß‡•Ä‡§Ç‡§®‡•Ä ‡§∏‡•ç‡§µ‡§§‡§É ‡§ú‡•ç‡§Ø‡§æ‡§Ç‡§®‡•Ä ‡§™‡•Å‡§∞‡§µ‡§†‡§æ ‡§ï‡•á‡§≤‡•á‡§≤‡§æ ‡§Ü‡§π‡•á ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§®‡•ã‡§Ç‡§¶‡§£‡•Ä‡§ï‡•É‡§§ ‡§ï‡§æ‡§∞‡§ñ‡§æ‡§®‡•ç‡§Ø‡§æ‡§§ ‡§µ‡§æ ‡§ï‡§æ‡§∞‡•ç‡§Ø‡§æ‡§≤‡§Ø‡§æ‡§§ ‡§ú‡§æ‡§ä‡§® ‡§™‡•ç‡§∞‡§§‡•ç‡§Ø‡§ï‡•ç‡§∑ ‡§™‡§æ‡§π‡§£‡•Ä ‡§ï‡§∞‡•Ç‡§® ‡§∞‡§ø‡§™‡•ã‡§∞‡•ç ‡§ü‡•Ä‡§Ç‡§ó ‡§ï‡•á‡§≤‡•á‡§≤‡•á ‡§µ‡•ç‡§π‡§ø‡§°‡•Ä‡§ì ‡§π‡•á ‡§Ö‡§ú‡•Ç‡§®‡§π‡•Ä ‡§Ø‡•Å‡§ü‡•ç‡§Ø‡•Å‡§¨ ‡§µ‡§∞ ‡§Ü‡§π‡•á‡§§. 1
700


700it [02:43,  4.33it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§µ‡•Ä‡§∞ ‡§Ø‡•ã‡§¶‡•ç‡§ß‡§æ, ‡§ß‡§∞‡•ç‡§Æ‡§µ‡•Ä‡§∞ ‡§õ‡§§‡•ç‡§∞‡§™‡§§‡•Ä ‡§∏‡§Ç‡§≠‡§æ‡§ú‡•Ä ‡§∞‡§æ‡§ú‡•á ‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§™‡•Å‡§£‡•ç‡§Ø‡§§‡§ø‡§•‡•Ä ‡§®‡§ø‡§Æ‡§ø‡§§‡•ç‡§§ ‡§ï‡•ã‡§ü‡•Ä ‡§ï‡•ã‡§ü‡•Ä ‡§Ö‡§≠‡§ø‡§µ‡§æ‡§¶‡§®! 2
800


800it [03:06,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§∏‡•ç‡§µ. ‡§Ö‡§∞‡•Å‡§£ ‡§ú‡•á‡§ü‡§≤‡•Ä ‡§ú‡•Ä... ‡§≠‡§æ‡§∞‡§§‡•Ä‡§Ø ‡§∞‡§æ‡§ú‡§ï‡§æ‡§∞‡§£‡§æ‡§§‡•Ä‡§≤ ‡§è‡§ï ‡§™‡•ç‡§∞‡§æ‡§Æ‡§æ‡§£‡§ø‡§ï, ‡§≤‡•ã‡§ï‡§æ‡§≠‡§ø‡§Æ‡•Å‡§ñ ‡§®‡•á‡§§‡§æ! 2
900


900it [03:28,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Ü‡§ú ‡§µ‡§∏‡§Ç‡§§‡§¶‡§æ‡§¶‡§æ ‡§∂‡•Å‡§ó‡§∞ ‡§á‡§®‡•ç‡§∏‡•ç‡§ü‡§ø‡§ü‡•ç‡§Ø‡•Ç‡§ü, ‡§Æ‡§æ‡§Ç‡§ú‡§∞‡•Ä, ‡§™‡•Å‡§£‡•á ‡§Ø‡§æ ‡§∏‡§Ç‡§∏‡•ç‡§•‡•á‡§ö‡§æ ‡§∏‡•ç‡§•‡§æ‡§™‡§®‡§æ ‡§¶‡§ø‡§µ‡§∏. ‡§Ø‡§æ‡§®‡§ø‡§Æ‡§ø‡§§‡•ç‡§§‡§æ‡§®‡•á ‡§∏‡§Ç‡§∏‡•ç‡§•‡•á‡§Æ‡§ß‡•ç‡§Ø‡•á ‡•™‡•™ ‡§µ‡§æ ‡§µ‡§∞‡•ç‡§ß‡§æ‡§™‡§® ‡§¶‡§ø‡§®‡§æ‡§ö‡§æ ‡§ï‡§æ‡§∞‡•ç‡§Ø‡§ï‡•ç‡§∞‡§Æ ‡§Ü‡§Ø‡•ã‡§ú‡§ø‡§§ ‡§ï‡§∞‡§£‡•ç‡§Ø‡§æ‡§§ ‡§Ü‡§≤‡§æ ‡§π‡•ã‡§§‡§æ. ‡§Ø‡§æ ‡§ï‡§æ‡§∞‡•ç‡§Ø‡§ï‡•ç‡§∞‡§Æ‡§æ‡§≤‡§æ ‡§Æ‡§æ. ‡§°‡•â. ‡§∂‡§ø‡§µ‡§æ‡§ú‡•Ä‡§∞‡§æ‡§µ ‡§ï‡§¶‡§Æ, ‡§ï‡•Å‡§≤‡§ó‡•Å‡§∞‡•Ç, ‡§≠‡§æ‡§∞‡§§‡•Ä ‡§µ‡§ø‡§¶‡•ç‡§Ø‡§æ‡§™‡•Ä‡§†, ‡§Æ‡§æ. ‡§™‡•ç‡§∞‡•ã. ‡§µ‡§ø‡§ú‡§Ø ‡§∂‡§∞‡•ç‡§Æ‡§æ - ‡§ö‡•á‡§Ö‡§∞‡§Æ‡§®, ‡§∏‡•Ä. ‡§è. ‡§∏‡•Ä. ‡§™‡•Ä., 1 / 2 1
1000


1000it [03:52,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Æ‡§æ‡§ú‡•Ä ‡§Ü‡§Æ‡§¶‡§æ‡§∞ ‡§ï‡•É‡§∑‡•ç‡§£ ‡§∞‡§æ‡§µ ‡§ú‡§ó‡§¶‡§æ‡§≥‡•á - ‡§™‡§æ‡§ü‡•Ä‡§≤ ‡§Ö‡§∞‡•ç‡§•‡§æ‡§§ ‡§Ü‡§¨ ‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§®‡§ø‡§ß ‡§®‡§æ‡§ö‡•Ä ‡§¨‡§æ‡§§‡§Æ‡•Ä ‡§ï‡§≥‡§≤‡•Ä. ‡§¶‡•å‡§Ç‡§° ‡§§‡§æ‡§≤‡•Å‡§ï‡•ç‡§Ø‡§æ‡§§ ‡§∏‡§ø‡§Ç‡§ö‡§® ‡§Ü‡§£‡§ø ‡§¶‡§≥‡§£‡§µ‡§≥ ‡§£‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§∏‡•Å‡§µ‡§ø‡§ß‡§æ ‡§®‡§ø‡§∞‡•ç‡§Æ‡§æ‡§£ ‡§ï‡§∞‡§£‡•ç‡§Ø‡§æ‡§§ ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡•Ä ‡§Æ‡•ã‡§†‡§Ç ‡§Ø‡•ã‡§ó‡§¶‡§æ‡§® ‡§¶‡§ø‡§≤‡§Ç. ‡§®‡§ø‡§∑‡•ç ‡§ï‡§≤‡§Ç‡§ï ‡§Ü‡§£‡§ø ‡§Ö ‡§ú‡§æ‡§§ ‡§∂‡§§‡•ç‡§∞‡•Ç ‡§µ‡•ç‡§Ø‡§ï‡•ç‡§§‡§ø‡§Æ‡§§‡•ç‡§§‡•ç‡§µ ‡§Ö‡§∂‡•Ä ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•Ä ‡§ì‡§≥‡§ñ ‡§π‡•ã‡§§‡•Ä. ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§≠‡§æ‡§µ‡§™‡•Ç‡§∞‡•ç‡§£ ‡§∂‡•ç‡§∞‡§¶‡•ç‡§ß‡§æ‡§Ç‡§ú‡§≤‡•Ä. 0
1100


1100it [04:15,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Ü‡§ö‡§æ‡§∞‡§∏‡§Ç‡§π‡§ø ‡§§‡•á‡§ö‡•ç‡§Ø‡§æ ‡§Ü‡§ß‡•Ä ‡§Æ‡§Ç‡§§‡•ç‡§∞ ‡•ç‡§Ø‡§æ‡§Ç‡§ï‡§°‡•Ç‡§® ‡§Ö‡§®‡•á‡§ï ‡§µ‡§ø‡§∑‡§Ø ‡§Ü‡§∞‡•ç‡§•‡§ø‡§ï ‡§≤‡§æ‡§ó‡•á ‡§¨‡§æ‡§Ç‡§ß‡•á ‡§™‡§æ‡§π‡•Ç‡§® ‡§µ ‡§≠‡§æ‡§ú‡§™‡§æ‡§ö‡•á ‡§ï‡§æ‡§∞‡•ç‡§Ø‡§ï‡§∞‡•ç‡§§‡•á ‡§™‡§æ‡§π‡•Ç‡§® ‡§ò‡§æ‡§à‡§ò‡§æ‡§à‡§®‡•á ‡§Æ‡§æ‡§∞‡•ç‡§ó‡•Ä ‡§≤‡§æ‡§µ‡§≤‡•á ‡§ú‡§æ‡§§ ‡§Ü‡§π‡•á‡§§. ‡§∏‡§Æ‡§æ‡§ú‡§ï‡§≤‡•ç‡§Ø‡§æ‡§£ ‡§Æ‡§Ç‡§§‡•ç‡§∞‡•Ä ‡§ï‡•Å‡§†‡§≤‡•Ä‡§π‡•Ä ‡§õ‡§æ‡§®‡§®‡•Ä ‡§® ‡§ï‡§∞‡§§‡§æ ‡§∂‡•á‡§µ‡§ü‡§ö‡•ç‡§Ø‡§æ ‡§ï‡•ç‡§∑‡§£‡•Ä ‡§Æ‡§æ‡§ó‡§æ‡§∏‡§µ‡§∞‡•ç‡§ó‡•Ä‡§Ø ‡§µ‡§ø‡§¶‡•ç‡§Ø‡§æ‡§∞‡•ç‡§•‡•ç‡§Ø‡§æ‡§Ç ‡§ï‡§∞‡§ø‡§§‡§æ ‡§µ‡§∏‡§§‡•Ä ‡§ó‡•É‡§π‡•á ‡§π‡§∏‡•ç‡§§‡§æ‡§Ç‡§§‡§∞‡§ø‡§§ ‡§ï‡§∞‡§£‡•ç‡§Ø‡§æ‡§ö‡•á ‡§™‡•ç‡§∞‡§∏‡•ç‡§§‡§æ‡§µ ‡§Æ‡§Ç‡§ú‡•Ç‡§∞ ‡§ï‡§∞‡§£‡•ç‡§Ø‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§§‡§Ø‡§æ‡§∞‡•Ä‡§§ ‡§Ü‡§π‡•á‡§§. 0
1200


1200it [04:38,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ï‡•ã‡§∞‡•ã‡§®‡§æ‡§ö‡§æ ‡§µ‡§æ‡§¢‡§§‡§æ ‡§™‡•ç‡§∞‡§æ‡§¶‡•Å‡§∞‡•ç‡§≠‡§æ‡§µ ‡§≤‡§ï‡•ç‡§∑‡§æ‡§§ ‡§ò‡•á‡§§‡§æ ‡§∏‡§æ‡§Ç‡§ó‡§≤‡•Ä ‡§ú‡§ø‡§≤‡•ç‡§π‡•ç‡§Ø‡§æ‡§§ ‡§≤‡•â‡§ï‡§°‡§æ‡§ä‡§® ‡§ö‡•Ä ‡§ò‡•ã‡§∑‡§£‡§æ ‡§ï‡•á‡§≤‡•Ä ‡§Ü‡§π‡•á. ‡§§‡•ç‡§Ø‡§æ‡§ö ‡§™‡§æ‡§∞‡•ç‡§∂‡•ç‡§µ‡§≠‡•Ç‡§Æ‡•Ä‡§µ‡§∞ ‡§ú‡§ø‡§≤‡•ç‡§π‡•ç‡§Ø‡§æ‡§§‡•Ä‡§≤ ‡§ï‡•ã‡§∞‡•ã‡§®‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§∏‡§¶‡•ç‡§Ø‡§∏‡•ç‡§•‡§ø‡§§‡•Ä ‡§ö‡§æ ‡§Ü‡§¢‡§æ‡§µ‡§æ ‡§ò‡•á‡§£‡•ç‡§Ø‡§æ‡§∏‡§æ‡§†‡•Ä ‡§Ü‡§ú ‡§™‡•ç‡§∞‡§Æ‡•Å‡§ñ ‡§Ö‡§ß‡§ø‡§ï‡§æ‡§±‡•ç‡§Ø‡§æ‡§Ç‡§∏‡§π ‡§¨‡•à‡§†‡§ï ‡§ò‡•á‡§§‡§≤‡•Ä ‡§§‡§∏‡•á‡§ö ‡§Æ‡§ø‡§∞‡§ú ‡§∏‡§ø‡§µ‡•ç‡§π‡§ø‡§≤ ‡§π‡•â‡§∏‡•ç‡§™‡§ø‡§ü‡§≤‡§ö‡•ç‡§Ø‡§æ ‡§Ü‡§Ø‡§∏‡•Ä‡§Ø‡•Ç ‡§Æ‡§ß‡•ç‡§Ø‡•á ‡•®‡•¶‡•¶ ‡§¨‡•á‡§° ‡•ç‡§∏‡§ö‡•Ä ‡§∏‡§Ç‡§ñ‡•ç‡§Ø‡§æ ‡§µ‡§æ‡§¢‡§µ‡§£‡•ç‡§Ø‡§æ‡§ö‡•á ‡§®‡§ø‡§∞‡•ç‡§¶‡•á‡§∂ ‡§¶‡§ø‡§≤‡•á 1
1300


1300it [05:01,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§≠‡§æ‡§ú‡§™‡§æ ‡§∏‡§∞‡§ï‡§æ‡§∞‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§ú‡§≤‡§Ø‡•Å‡§ï‡•ç‡§§ ‡§∂‡§ø‡§µ‡§æ‡§∞ ‡§Ø‡•ã‡§ú‡§®‡•á‡§Æ‡•Å‡§≥‡•á ‡§∞‡§æ‡§ú‡•ç‡§Ø‡§æ‡§§ ‡§è‡§ï‡§æ‡§π‡•Ä ‡§ü‡•Ö‡§Ç‡§ï‡§∞ ‡§ö‡•Ä ‡§ó‡§∞‡§ú ‡§≠‡§æ‡§∏‡§≤‡•Ä ‡§®‡§æ‡§π‡•Ä. 0
1400


1400it [05:24,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§¶‡§§‡•ç‡§§‡•Ç ‡§≠‡•ã ‡§ï‡§® ‡§≥ ‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§Ö‡§∞‡•ç‡§ú‡•Å‡§® ‡§™‡•Å‡§∞‡§∏‡•ç‡§ï‡§æ‡§∞ ‡§ú‡§æ‡§π‡•Ä‡§∞ ‡§ù‡§æ ‡§≤‡•ç‚Äç‡§Ø‡§æ ‡§¨‡§¶‡•ç‡§¶‡§≤ ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•á ‡§Æ‡§® : ‡§™‡•Å‡§∞‡•ç‡§µ‡§ï ‡§Ö‡§≠‡§ø‡§®‡§Ç‡§¶‡§®! ‡§¶‡§§‡•ç‡§§‡•Ç ‡§Ø‡§æ‡§Ç‡§ö‡§æ ‡§Ö‡§∞‡•ç‡§ú‡•Å‡§® ‡§™‡•Å‡§∞‡§∏‡•ç‡§ï‡§æ‡§∞‡§æ ‡§™‡§∞‡•ç‡§Ø‡§Ç‡§§‡§ö‡§æ ‡§™‡•ç‡§∞‡§µ‡§æ‡§∏ ‡§π‡§æ ‡§Ö‡§§‡•ç‡§Ø‡§Ç‡§§ ‡§∏‡§Ç‡§ò‡§∞‡•ç‡§∑ ‡§Æ‡§Ø ‡§Ü‡§£‡§ø ‡§™‡•ç‡§∞‡•á‡§∞‡§£‡§æ‡§¶‡§æ‡§Ø‡•Ä ‡§Ü‡§π‡•á. 2021 ‡§ö‡•ç‡§Ø‡§æ ‡§ë‡§≤‡§ø‡§Æ‡•ç‡§™‡§ø‡§ï ‡§∏‡•ç‡§™‡§∞‡•ç‡§ß‡•á‡§∏‡§æ‡§†‡•Ä ‡§Ü‡§£‡§ø ‡§™‡•Å‡§¢‡•Ä‡§≤ ‡§ï‡§æ‡§∞‡§ï‡•Ä‡§∞‡•ç‡§¶‡•Ä ‡§∏‡§æ‡§†‡•Ä ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§π‡§æ‡§∞‡•ç‡§¶‡§ø‡§ï ‡§∂‡•Å‡§≠‡•á‡§ö‡•ç‡§õ‡§æ.. üíê üíê üíê 2
1500


1500it [05:47,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Æ‡§æ‡§ù‡•á ‡§∏‡§π‡§ï‡§æ‡§∞‡•Ä ‡§µ‡§ø‡§ß‡§æ‡§® ‡§™‡§∞‡§ø‡§∑‡§¶‡•á‡§§‡•Ä‡§≤ ‡§µ‡§ø‡§∞‡•ã‡§ß‡•Ä ‡§™‡§ï‡•ç‡§∑‡§®‡•á‡§§‡•á ‡§™‡•ç‡§∞‡§µ‡•Ä‡§£ ‡§¶‡§∞‡•á‡§ï‡§∞, ‡§Æ‡§æ‡§ú‡•Ä ‡§Æ‡§Ç‡§§‡•ç‡§∞‡•Ä ‡§µ‡§ø‡§®‡•ã‡§¶ ‡§§‡§æ‡§µ‡§°‡•á ‡§ú‡•Ä, ‡§Æ‡•Å‡§Ç‡§¨‡§à ‡§≠‡§æ‡§ú‡§™‡§æ‡§ö‡•á ‡§Ö‡§ß‡•ç‡§Ø‡§ï‡•ç‡§∑ ‡§Æ‡§Ç‡§ó‡§≤ ‡§™‡•ç‡§∞‡§≠‡§æ‡§§ ‡§≤‡•ã‡§¢‡§æ ‡§ú‡•Ä, ‡§ñ‡§æ. ‡§ó‡•ã‡§™‡§æ‡§≤ ‡§∂‡•á‡§ü‡•ç‡§ü‡•Ä ‡§ú‡•Ä, ‡§ñ‡§æ. ‡§Æ‡§®‡•ã‡§ú ‡§ï‡•ã‡§ü‡§ï, ‡§Ø‡•ã‡§ó‡•á‡§∂ ‡§∏‡§æ‡§ó‡§∞ ‡§Ø‡§æ‡§Ç‡§ö‡§æ ‡§Ø‡§æ ‡§∂‡§ø‡§∑‡•ç‡§ü‡§Æ‡§Ç‡§°‡§≥‡§æ‡§§ ‡§∏‡§Æ‡§æ‡§µ‡•á‡§∂ ‡§π‡•ã‡§§‡§æ. 1
1600


1600it [06:10,  4.33it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Æ‡§π‡§æ‡§∞‡§æ‡§∑‡•ç‡§ü‡•ç‡§∞ ‡§ï‡•â‡§Ç‡§ó‡•ç‡§∞‡•á‡§∏‡§ö‡•ç‡§Ø‡§æ ‡§Ø‡•Å‡§µ‡§ï‡§æ‡§Ç‡§ö‡§æ ‡§â‡§§‡•ç‡§∏‡§æ‡§π ‡§™‡§æ‡§π‡•Å‡§® ‡§è‡§ï‡§æ ‡§ó‡•ã‡§∑‡•ç‡§ü ‡§æ‡§ö‡§æ ‡§Ü‡§§‡•ç‡§Æ‡§µ‡§ø‡§∂‡•ç‡§µ‡§æ‡§∏ ‡§Ü‡§≤‡§æ ‡§ï‡•Ä ‡§ï‡•â‡§Ç‡§ó‡•ç‡§∞‡•á‡§∏‡§ö‡•á ‡§≠‡§µ‡§ø‡§∑‡•ç‡§Ø ‡§ö‡§æ‡§Ç‡§ó‡§≤‡•ç‡§Ø‡§æ ‡§π‡§æ‡§§‡•Ä ‡§Ü‡§π‡•á ‡§µ ‡§â‡§ú‡•ç‡§µ‡§≤ ‡§Ü‡§π‡•á. ‡§∏‡§ß‡•ç‡§Ø‡§æ ‡§Ö‡§°‡§ö‡§£‡•Ä‡§ö‡§æ ‡§ï‡§æ‡§≥ ‡§∏‡•Å‡§∞‡•Å ‡§Ü‡§π‡•á ‡§™‡§£ ‡§π‡•á‡§π‡•Ä ‡§µ‡§æ‡§à‡§ü ‡§¶‡§ø‡§µ‡§∏ ‡§ú‡§æ‡§§‡•Ä‡§≤ ‡§µ ‡§™‡•Å‡§®‡•ç‡§π‡§æ ‡§è‡§ï‡§¶‡§æ ‡§¶‡•á‡§∂‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§µ ‡§Æ‡§π‡§æ‡§∞‡§æ‡§∑‡•ç‡§ü‡•ç‡§∞‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§≠‡§≤‡•ç‡§Ø‡§æ‡§∏‡§æ‡§†‡•Ä ‡§ï‡•â‡§Ç‡§ó‡•ç‡§∞‡•á‡§∏‡§ö‡•á ‡§∞‡§æ‡§ú‡•ç‡§Ø ‡§Ø‡•á‡§à‡§≤. 2
1700


1700it [06:33,  4.33it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Ü‡§ú ‡§∏‡§Ç‡§∏‡§¶‡•Ä‡§Ø ‡§Ö‡§ß‡§ø‡§µ‡•á‡§∂ ‡§®‡§æ‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§Ü‡§Ø‡•Å‡§∞‡•ç‡§µ‡•á‡§¶‡§ø‡§ï ‡§î‡§∑‡§ß - ‡§â‡§™‡§ö‡§æ‡§∞ ‡§∏‡§Ç‡§∂‡•ã‡§ß‡§® ‡§¨‡§ø‡§≤‡§æ ‡§µ‡§∞‡•Ä‡§≤ ‡§ö‡§∞‡•ç‡§ö‡•á‡§§ ‡§∏‡§π‡§≠‡§æ‡§ó ‡§ò‡•á‡§§‡§≤‡§æ. 1
1800


1800it [06:56,  4.33it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§∞‡§æ‡§ú‡•ç‡§Ø‡§æ‡§§‡•Ä‡§≤ ‡§¶‡•Å‡§∑‡•ç‡§ï‡§æ‡§≥ ‡§ó‡•ç‡§∞‡§∏‡•ç‡§§‡§æ‡§Ç‡§∏‡§æ‡§†‡•Ä ‡§ê‡§§‡§ø‡§π‡§æ‡§∏‡§ø‡§ï ‡§Ü‡§£‡§ø ‡§µ‡•á‡§≥‡•á‡§§ ‡§Æ‡§¶‡§§ ‡§ï‡•á‡§Ç‡§¶‡•ç‡§∞ ‡§∏‡§∞‡§ï‡§æ‡§∞‡§®‡•á ‡§¶‡§ø‡§≤‡•Ä ‡§Ü‡§π‡•á. ‡§Æ‡•Ä ‡§Æ‡§æ. ‡§™‡§Ç‡§§‡§™‡•ç‡§∞‡§ß‡§æ‡§® ‡§∂‡•ç‡§∞‡•Ä ‡§®‡§∞‡•á‡§Ç‡§¶‡•ç‡§∞ ‡§Æ‡•ã‡§¶‡•Ä‡§ú‡•Ä ‡§Ü‡§£‡§ø ‡§ï‡•á‡§Ç‡§¶‡•ç‡§∞ ‡§∏‡§∞‡§ï‡§æ‡§∞‡§ö‡§æ ‡§Ö‡§§‡§ø‡§∂‡§Ø ‡§Ü‡§≠‡§æ‡§∞‡•Ä ‡§Ü‡§π‡•á...! you t u. be / q 83 Y G H 9 j a J A 2
1900


1900it [07:19,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§â‡§¶‡•ç‡§Ø‡§æ ‡§Ø‡•Å‡§µ‡§æ ‡§ï‡•ç‡§∞‡§æ‡§Ç‡§§‡•Ä ‡§Ø‡§æ‡§§‡•ç‡§∞‡•á‡§ö‡•ç‡§Ø‡§æ ‡§Æ‡§æ‡§ß‡•ç‡§Ø‡§Æ‡§æ‡§§‡•Ç‡§® ‡§Æ‡§π‡§æ‡§∞‡§æ‡§∑‡•ç‡§ü‡•ç‡§∞‡§æ‡§§ ‡§™‡§∞‡§ø‡§µ‡§∞‡•ç‡§§ ‡§®‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§®‡§µ‡•ç‡§Ø‡§æ ‡§™‡§∞‡•ç ‡§µ‡§æ‡§ö‡•Ä ‡§∏‡•Å‡§∞‡§µ‡§æ‡§§ ‡§π‡•ã‡§£‡§æ‡§∞ ‡§Ü‡§π‡•á. ‡§Æ ‡§®‡•ç‡§∏‡§∞, ‡§®‡§æ‡§ó‡§™‡•Ç‡§∞ ‡§Ø‡§æ ‡§†‡§ø‡§ï‡§æ‡§£ ‡§π‡•Ç‡§® ‡§∏‡•Å‡§∞‡•Å ‡§π‡•ã‡§£‡§æ‡§±‡•ç‡§Ø‡§æ ‡§Ø‡•Å‡§µ‡§æ ‡§ï‡•ç‡§∞‡§æ‡§Ç‡§§‡•Ä ‡§Ø‡§æ‡§§‡•ç‡§∞‡•á‡§§ ‡§Ø‡•Å‡§µ‡§æ ‡§∂‡§ï‡•ç‡§§‡•Ä‡§ö‡•ç‡§Ø‡§æ ‡§π‡§ï‡•ç‡§ï‡§æ‡§∏‡§æ‡§†‡•Ä, ‡§∏‡§∞‡§ï‡§æ‡§∞‡§ö‡•ç‡§Ø‡§æ ‡§ö‡•Å‡§ï‡•Ä‡§ö‡•ç‡§Ø‡§æ ‡§ß‡•ã‡§∞‡§£ ‡§æ‡§Ç‡§µ‡§ø‡§∞‡•ã‡§ß‡§æ‡§§ ‡§Ü‡§µ‡§æ‡§ú ‡§â‡§† ‡§µ‡§ø‡§£‡•ç‡§Ø‡§æ‡§∏‡§æ‡§†‡•Ä ‡§Æ‡•ã‡§†‡•ç‡§Ø‡§æ ‡§∏‡§Ç‡§ñ‡•ç‡§Ø‡•á‡§®‡•á ‡§∏‡§π‡§≠‡§æ‡§ó‡•Ä ‡§µ‡•ç‡§π‡§æ! 2
2000


2000it [07:43,  4.27it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Æ‡§π‡§æ‡§∞‡§æ‡§∑‡•ç‡§ü‡•ç‡§∞‡§æ‡§§ ‡§∏‡•ç‡§§‡•ç‡§∞‡•Ä ‡§∂‡§ø‡§ï‡•ç‡§∑‡§£‡§æ‡§ö‡•Ä ‡§Æ‡•Å‡§π‡•Ç‡§∞‡•ç‡§§‡§Æ‡•á‡§¢ ‡§∞‡•ã ‡§µ‡§§ ‡§∏‡•ç‡§µ ‡§ò‡•ã‡§∑‡§ø‡§§ ‡§∏‡§Ç‡§∏‡•ç‡§ï‡•É‡§§‡•Ä ‡§∞‡§ï‡•ç‡§∑ ‡§ï‡§æ‡§Ç‡§ö‡§æ ‡§∞‡•ã‡§∑ ‡§ì‡§¢‡§µ‡•Ç‡§® ‡§ò‡•á‡§£‡§æ‡§±‡•ç‡§Ø‡§æ, ‡§Ö‡§®‡§æ‡§• ‡§æ‡§Ç‡§®‡§æ ‡§Ü‡§∂‡•ç‡§∞‡§Ø ‡§¶‡•á‡§£‡§æ‡§±‡•ç‡§Ø‡§æ, ‡§∏‡•ç‡§µ‡§§‡§É‡§ö‡•ç‡§Ø‡§æ ‡§ú‡•Ä‡§µ‡§æ‡§ö‡•Ä ‡§™‡§∞‡•ç‡§µ‡§æ ‡§® ‡§ï‡§∞‡§§‡§æ ‡§™‡•ç‡§≤‡•á‡§ó ‡§¨‡§æ‡§ß‡§ø‡§§ ‡§∞‡•Å‡§ó‡•ç‡§£‡§æ‡§Ç‡§ö‡•Ä ‡§∏‡•á‡§µ‡§æ ‡§ï‡§∞‡§£‡§æ‡§±‡•ç‡§Ø‡§æ ‡§•‡•ã‡§∞ ‡§∏‡§Æ‡§æ‡§ú ‡§∏‡•á‡§µ‡§ø‡§ï‡§æ ‡§∏‡§æ‡§µ‡§ø‡§§‡•ç‡§∞‡•Ä‡§¨‡§æ‡§à ‡§´‡•Å‡§≤‡•á ‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§ú‡§Ø‡§Ç‡§§‡•Ä ‡§¶‡§ø‡§®‡§æ‡§®‡§ø‡§Æ‡§ø‡§§‡•ç‡§§ ‡§µ‡§ø‡§®‡§Æ‡•ç‡§∞ ‡§Ö‡§≠‡§ø‡§µ‡§æ‡§¶‡§®! 2
2100


2100it [08:06,  4.30it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ú‡•á‡§ú‡•Å‡§∞‡•Ä ‡§Ø‡•á‡§•‡•Ä‡§≤ ‡§ó‡•ç‡§∞‡§æ‡§Æ‡•Ä‡§£ ‡§∞‡•Å‡§ó‡•ç‡§£‡§æ‡§≤‡§Ø‡§æ‡§ö‡•á ‡§ï‡§æ‡§Æ ‡§§‡§æ‡§§‡§°‡•Ä‡§®‡•á ‡§™‡•Ç‡§∞‡•ç‡§£ ‡§ï‡§∞‡§æ‡§µ‡•á, ‡§™‡•Å‡§∞‡§Ç‡§¶‡§∞ ‡§™‡§Ç‡§ö‡§æ‡§Ø‡§§ ‡§∏‡§Æ‡§ø‡§§‡•Ä‡§ö‡•á ‡§®‡§µ‡•Ä‡§® ‡§á‡§Æ‡§æ‡§∞‡§§‡•Ä‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§§‡§æ‡§§‡•ç‡§ï‡§æ‡§≥ ‡§∏‡•ç‡§•‡§≤‡§æ‡§Ç‡§§‡§∞ ‡§ï‡§∞‡§æ‡§µ‡•á, ‡§™‡§æ‡§∞ ‡§ó‡§æ‡§µ - ‡§Æ‡§æ‡§≥‡§∂‡§ø‡§∞‡§∏ ‡§Ü‡§£‡§ø ‡§ß‡§®‡§ï‡§µ‡§°‡•Ä - ‡§Æ‡§æ‡§Ç‡§¢ ‡§∞ ‡§Ø‡§æ ‡§≠‡§æ‡§ó‡§æ‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§§‡§æ‡§§‡•ç‡§ï‡§æ‡§≥ ‡§™‡§æ‡§£‡•ç‡§Ø‡§æ‡§ö‡•á ‡§ü‡§Å‡§ï‡§∞ ‡§∏‡•Å‡§∞‡•Å ‡§ï‡§∞‡§æ‡§µ‡•á‡§§ ‡§§‡§∏‡•á‡§ö ‡§Ø‡•á‡§•‡•Ä‡§≤ ‡§™‡§æ‡§£‡•Ä ‡§™‡•Å‡§∞‡§µ‡§†‡§æ ‡§Ø‡•ã‡§ú‡§®‡§æ ‡§§‡§æ‡§§‡•ç‡§ï‡§æ‡§≥ ‡§∏‡•Å‡§∞‡•Å ‡§ï‡§∞‡§æ‡§µ‡•ç‡§Ø‡§æ‡§§ ( 2 / 3 ) 1
2200


2200it [08:29,  4.32it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ú‡•ç‡§Ø‡•á‡§∑‡•ç‡§† ‡§∏‡§æ‡§π‡§ø‡§§‡•ç‡§Ø‡§ø‡§ï, ‡§®‡§æ‡§ü‡§ï‡§ï‡§æ‡§∞ ‡§∞‡§§‡•ç‡§®‡§æ‡§ï‡§∞ ‡§Æ‡§§‡§ï‡§∞‡•Ä ‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§¶‡•Å‡§É‡§ñ‡§¶ ‡§®‡§ø‡§ß‡§®‡§æ‡§Æ‡•Å‡§≥‡•á ‡§ï‡§≤‡§æ ‡§ï‡•ç‡§∑‡•á‡§§‡•ç‡§∞‡§æ‡§µ‡§∞ ‡§Æ‡•ã‡§†‡•Ä ‡§∂‡•ã‡§ï‡§ï‡§≥‡§æ ‡§™‡§∏‡§∞‡§≤‡•Ä ‡§Ü‡§π‡•á. ‡§µ‡§Ø‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§∏‡§§‡§∞‡§æ‡§µ‡•ç‡§Ø‡§æ ‡§µ‡§∞‡•ç‡§∑‡•Ä ‡§∏‡§æ‡§π‡§ø‡§§‡•ç‡§Ø, ‡§ï‡§≤‡§æ ‡§ï‡•ç‡§∑‡•á‡§§‡•ç‡§∞‡§æ‡§§ ‡§™‡§¶‡§æ‡§∞‡•ç‡§™‡§£ ‡§ï‡•á‡§≤‡•á‡§≤‡•ç‡§Ø‡§æ ‡§∞‡§§‡•ç‡§®‡§æ‡§ï‡§∞ ‡§Æ‡§§‡§ï‡§∞‡•Ä ‡§Ø‡§æ‡§Ç‡§®‡•Ä ‡§Ö‡§ñ‡•á‡§∞‡§ö‡•ç‡§Ø‡§æ ‡§ï‡§æ‡§≥‡§æ‡§™‡§∞‡•ç‡§Ø‡§Ç‡§§ ‡§Ü‡§™‡§≤‡•á ‡§ï‡§æ‡§Æ ‡§Ö‡§µ‡§ø‡§∞‡§§ ‡§∏‡•Å‡§∞‡•Ç ‡§†‡•á‡§µ‡§≤‡•á. ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§ï‡§≤‡§æ ‡§ï‡•ç‡§∑‡•á‡§§‡•ç‡§∞‡§æ‡§§‡•Ä‡§≤ ‡§Ø‡•ã‡§ó‡§¶‡§æ ‡§®‡§æ‡§Æ‡•Å‡§≥‡•á ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡§æ 0
2300


2300it [08:52,  4.32it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§∏‡§µ‡§æ‡§≤ ‡§ú‡§ø‡§∏ ‡§ú‡•Å ‡§¨‡§æ‡§® ‡§Æ‡•á ‡§ï‡§ø‡§Ø‡§æ ‡§ú‡§æ‡§Ø‡•á ‡§ú‡§µ‡§æ‡§¨ ‡§â ‡§∏‡•Ä ‡§ú‡•Å ‡§¨‡§æ‡§® ‡§Æ‡•á ‡§¶‡•á‡§®‡§æ ‡§ö‡§æ‡§π‡§ø‡§è ‡§ï‡§æ‡§Å‡§ó‡•ç‡§∞‡•á‡§∏‡§ö‡•á ‡§®‡•á‡§§‡•á ‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ‡§µ‡§∞ ‡§∏‡•Ç‡§° ‡§¨‡•Å‡§¶‡•ç‡§ß‡•Ä‡§®‡•á ‡§ï‡§æ‡§∞‡§µ‡§æ‡§à ‡§ï‡•á‡§≤‡•Ä ‡§ó‡•á‡§≤‡•Ä. ‡§µ‡§ø‡§∞‡•ã‡§ß‡•Ä ‡§™‡§ï‡•ç‡§∑‡§æ‡§µ‡§∞ ‡§¶‡§¨‡§æ ‡§µ‡§§ ‡§Ç‡§§‡•ç‡§∞‡§æ ‡§ö‡§æ ‡§â‡§™‡§Ø‡•ã‡§ó ‡§ï‡•á‡§≤‡§æ ‡§ú‡§æ‡§§ ‡§Ü‡§π‡•á. ‡§™‡§∞‡§ø‡§∏‡•ç‡§•‡§ø‡§§‡•Ä ‡§¨‡§¶‡§≤‡•á‡§≤ ‡§§‡•á‡§µ‡•ç‡§π‡§æ ‡§®‡•ã‡§ü‡§æ‡§¨‡§Ç‡§¶‡•Ä, ‡§™‡§ø‡§ï ‡§µ‡§ø‡§Æ‡§æ, ‡§ï‡§∞‡•ç‡§ú‡§Æ‡§æ‡§´‡•Ä, ‡§ú‡§≤‡§Ø‡•Å‡§ï‡•ç‡§§ ‡§∂‡§ø‡§µ‡§æ‡§∞ ‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§≠‡•ç‡§∞‡§∑‡•ç‡§ü‡§æ‡§ö‡§æ‡§∞‡§æ‡§ö‡•á ‡§Ü‡§∞‡•ã‡§™‡•Ä ‡§Ü‡§ß‡•Ä ‡§Ü‡§§ ‡§ú‡§æ‡§§‡•Ä‡§≤. 0
2400


2400it [09:15,  4.33it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ö‡§æ‡§∞‡§æ ‡§õ‡§æ‡§µ‡§£‡•ç‡§Ø‡§æ ‡§Ç‡§®‡§æ ‡§≠‡•á‡§ü‡•Ä ‡§¶‡§ø‡§≤‡•ç‡§Ø‡§æ‡§µ‡§∞ ‡§ú‡§®‡§æ‡§µ ‡§∞‡§æ ‡§∏‡§æ‡§†‡•Ä ‡•Ø‡•¶ ‡§∞‡•Å. ‡§Ö‡§®‡•Å‡§¶‡§æ‡§® ‡§™‡•Å‡§∞‡•á‡§∏‡•á ‡§®‡§æ‡§π‡•Ä ‡§π‡•Ä ‡§µ‡§∏‡•ç‡§§‡•Å‡§∏‡•ç‡§•‡§ø‡§§‡•Ä ‡§õ‡§æ‡§µ‡§£‡•Ä ‡§ö‡§æ‡§≤‡§ï‡§æ‡§Ç‡§®‡•Ä ‡§¨‡•ã‡§≤‡•Ç‡§® ‡§¶‡§æ‡§ñ‡§µ‡§≤‡•Ä. ‡•ß‡•®‡•¶ ‡§∞‡•Å. ‡§ú‡§®‡§æ‡§µ ‡§∞‡§æ ‡§Æ‡§æ‡§ó‡•á ‡§Æ‡§ø‡§≥‡§æ‡§µ‡•á‡§§ ‡§Ö‡§∂‡•Ä ‡§Æ‡§æ‡§ó‡§£‡•Ä ‡§Ü‡§π‡•á. ‡§∂‡§æ‡§∏‡§®‡§æ‡§®‡•á ‡§®‡§ø‡§∞‡•ç‡§£‡§Ø ‡§ò‡•á‡§£‡•ç‡§Ø‡§æ‡§ö‡•Ä ‡§ó‡§∞‡§ú ‡§Ü‡§π‡•á. ‡§õ‡§æ‡§µ‡§£‡•Ä‡§§ ‡§∂‡•á‡§§‡§ï‡§∞‡•ç‚Äç‡§Ø‡§æ ‡§Æ‡§æ‡§ó‡•á ‡§™‡§æ‡§ö ‡§ú‡§®‡§æ‡§µ‡§∞‡§æ‡§Ç‡§ö‡•Ä ‡§Ö‡§ü ‡§∂‡§ø‡§•‡§ø‡§≤ ‡§ï‡§∞‡§æ‡§µ‡•Ä ‡§µ ‡§™‡•á ‡§Ç‡§°‡•Ä ‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§µ‡§æ‡§¢ ‡§ï‡§∞‡§æ‡§µ‡•Ä ‡§Ø‡§æ ‡§Æ‡§æ‡§ó‡§£‡•ç‡§Ø‡§æ ‡§π‡•Ä ‡§Ü‡§π‡•á‡§§. 0
2500


2500it [09:38,  4.33it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§¶‡•á‡§µ‡§ó‡§° ‡§Ø‡•á‡§•‡•á ‡§ï‡§£‡§ï‡§µ‡§≤‡•Ä ‡§µ‡§ø‡§ß‡§æ‡§®‡§∏‡§≠‡§æ ‡§Æ‡§§‡§¶‡§æ‡§∞‡§∏‡§Ç‡§ò‡§æ‡§§ ‡§≠‡§æ‡§ú‡§™‡§æ ‡§ï‡§æ‡§∞‡•ç‡§Ø‡§ï‡§∞‡•ç‡§§‡•á ‡§¨‡•Ç‡§• ‡§Æ‡•á‡§≥‡§æ‡§µ‡§æ ‡§ò‡•á‡§ä‡§® ‡§ï‡§æ‡§∞‡•ç‡§Ø‡§ï‡§∞‡•ç‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§Æ‡§æ‡§∞‡•ç‡§ó‡§¶‡§∞‡•ç‡§∂‡§® ‡§ï‡•á‡§≤‡•á! Ad dr ess ed K ank aw ali A ss em b ly Vi j ay S ank al p M el av a! 1
2600


2600it [10:02,  4.33it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Æ‡§≤‡§æ ‡§ñ‡§æ‡§§‡•ç‡§∞‡•Ä ‡§Ü‡§π‡•á ‡§ï‡•Ä ‡§Ø‡§æ ‡§∞‡•Å‡§ó‡•ç‡§£‡§æ‡§≤‡§Ø‡§æ‡§§ ‡§ó‡•ç‡§∞‡§æ‡§Æ‡•Ä‡§£ ‡§≠‡§æ‡§ó‡§æ‡§§‡•Ä‡§≤ ‡§ú‡§®‡§§‡•á‡§∏‡§æ‡§†‡•Ä ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§™‡§∞‡§µ‡§°‡•á‡§≤ ‡§Ö‡§∂‡§æ ‡§ñ‡§∞‡•ç‡§ö‡§æ‡§§ ‡§µ‡•à‡§¶‡•ç‡§Ø‡§ï‡•Ä‡§Ø ‡§∏‡•á‡§µ‡§æ ‡§â‡§™‡§≤‡§¨‡•ç‡§ß ‡§π‡•ã‡§à‡§≤. ‡§ú‡§ø‡§ú‡§æ‡§ä ‡§∂‡•à‡§ï‡•ç‡§∑‡§£‡§ø‡§ï ‡§µ ‡§∏‡§æ‡§Æ‡§æ‡§ú‡§ø‡§ï ‡§∏‡§Ç‡§∏‡•ç‡§•‡•á‡§ö‡•ç‡§Ø‡§æ ‡§Æ‡§æ‡§ß‡•ç‡§Ø‡§Æ‡§æ‡§§‡•Ç‡§® ‡§∂‡•ç‡§∞‡•Ä. ‡§®‡§ø‡§≤‡•á‡§∂ ‡§∏‡§æ ‡§Ç‡§¨‡§∞‡•á ‡§Ö‡§®‡•á‡§ï ‡§≤‡•ã ‡§ï‡•ã‡§™‡§Ø‡•ã‡§ó‡•Ä ‡§â‡§™‡§ï‡•ç‡§∞‡§Æ ‡§∞‡§æ‡§¨‡§µ‡§§ ‡§Ü‡§π‡•á‡§§. ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•á ‡§Æ‡§®‡§æ‡§™‡§æ‡§∏‡•Ç‡§® ‡§ï‡•å‡§§‡•Å‡§ï! 2
2700


2700it [10:25,  4.33it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§î‡§∞‡§Ç‡§ó‡§æ‡§¨‡§æ‡§¶ ‡§ú‡§µ‡§≥ ‡§¨‡§¶ ‡§®‡§æ‡§™‡•Ç‡§∞ ‡§§‡•á ‡§ï‡§∞ ‡§Æ‡§æ‡§° ‡§¶‡§∞‡§Æ‡•ç‡§Ø‡§æ‡§® ‡§∞‡•á‡§≤‡•ç‡§µ‡•á ‡§∞‡•Å‡§≥‡§æ‡§Ç‡§µ‡§∞ ‡§ù‡•ã‡§™‡§≤‡•á‡§≤‡•ç‡§Ø‡§æ ‡•ß‡•¨ ‡§ú‡§£‡§æ‡§Ç‡§ö‡§æ ‡§Æ‡§æ‡§≤ ‡§ó‡§æ‡§°‡•Ä ‡§ñ‡§æ‡§≤‡•Ä ‡§ö‡§ø‡§∞‡§°‡•Ç‡§® ‡§Æ‡•É‡§§‡•ç‡§Ø‡•Ç ‡§ù‡§æ‡§≤‡•ç‡§Ø‡§æ‡§ö‡•Ä ‡§ò‡§ü‡§®‡§æ ‡§Ö‡§§‡•ç‡§Ø‡§Ç‡§§ ‡§¶‡•Å : ‡§ñ‡§¶, ‡§µ‡•á‡§¶‡§®‡§æ ‡§¶‡§æ‡§Ø‡•Ä ‡§Ü‡§π‡•á. ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§≠‡§æ‡§µ‡§™‡•Ç‡§∞‡•ç‡§£ ‡§∂‡•ç‡§∞‡§¶‡•ç‡§ß‡§æ‡§Ç‡§ú‡§≤‡•Ä! ‡§≤‡•â‡§ï‡§°‡§æ‡§ä‡§®‡§Æ‡•Å‡§≥‡•á ‡§Æ‡§π‡§æ‡§∞‡§æ‡§∑‡•ç‡§ü‡•ç‡§∞‡§æ‡§§ ‡§Ö‡§°‡§ï‡•Ç‡§® ‡§™‡§°‡§≤‡•á‡§≤‡•ç‡§Ø‡§æ ‡§Æ‡§ú‡•Å‡§∞‡§æ‡§Ç‡§ö‡•Ä ‡§ò‡§∞‡•Ä ‡§™‡§∞‡§§ ‡§£‡•ç‡§Ø‡§æ‡§ö‡•Ä ‡§Ö‡§ß‡§ø ‡§∞‡§§‡§æ, ‡§§‡§≥‡§Æ‡§≥, ‡§ö‡§æ‡§≤‡§≤‡•á‡§≤‡•Ä ‡§™‡§æ‡§Ø‡§™‡•Ä‡§ü ‡§Æ‡§® ‡§µ‡§ø‡§∑ ‡§£‡•ç‡§£ ‡§ï‡§∞‡§£‡§æ‡§∞‡•Ä ‡§Ü‡§π‡•á. 0
2800


2800it [10:47,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§®‡§æ‡§Ç‡§¶‡•á‡§° ‡§ú‡§ø‡§≤‡•ç‡§π‡§æ ‡§Æ‡§ß‡•ç‡§Ø‡§µ‡§∞‡•ç‡§§‡•Ä ‡§∏‡§π‡§ï‡§æ‡§∞‡•Ä ‡§¨‡§Å‡§ï‡•á‡§ö‡•á ‡§∏‡§Ç‡§∏‡•ç‡§•‡§æ‡§™‡§ï, ‡§∏‡§π‡§ï‡§æ‡§∞ ‡§Æ‡§π‡§∞‡•ç‡§∑‡•Ä ‡§™‡§¶ ‡§∂‡•ç‡§∞‡•Ä ‡§∏‡•ç‡§µ. ‡§∂‡§æ‡§Æ‡§∞‡§æ‡§µ ‡§ú‡•Ä ‡§ï‡§¶‡§Æ ‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§Ö‡§∞‡•ç‡§ß‡§æ ‡§ï‡•É‡§§‡•Ä ‡§™‡•Å‡§§‡§≥ ‡§Ø‡§æ‡§ö‡•á ‡§Ö‡§®‡§æ‡§µ‡§∞‡§£ ‡§Æ‡§æ. ‡§∂‡§∞‡§¶ ‡§ö‡§Ç‡§¶‡•ç‡§∞ ‡§™‡§µ‡§æ‡§∞ ‡§∏‡§æ‡§π‡•á‡§¨ ‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§π‡§∏‡•ç‡§§‡•á ‡§ï‡§∞‡§£‡•ç‡§Ø‡§æ‡§§ ‡§Ü‡§≤‡•á. ‡§Ø‡§æ‡§µ‡•á‡§≥‡•Ä ‡§Ü‡§Ø‡•ã‡§ú‡§ø‡§§ ‡§ï‡§æ‡§∞‡•ç‡§Ø‡§ï‡•ç‡§∞‡§Æ‡§æ‡§§ ‡§á‡§§‡§∞ ‡§™‡•ç‡§∞‡§Æ‡•Å‡§ñ ‡§®‡•á‡§§‡•ç‡§Ø‡§æ‡§Ç‡§∏‡§π ‡§â‡§™‡§∏‡•ç‡§•‡§ø‡§§ ‡§∞‡§æ‡§π‡§ø‡§≤‡•ã. 1
2900


2900it [11:10,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ß‡§æ‡§∞‡§æ‡§µ‡•Ä ‡§™‡•Å‡§®‡§∞‡•ç‡§µ‡§ø‡§ï‡§æ‡§∏ ‡§™‡•ç‡§∞‡§ï‡§≤‡•ç‡§™‡§æ‡§∏‡§æ‡§†‡•Ä ‡§∏‡•ç‡§µ‡§§‡§Ç‡§§‡•ç‡§∞ ‡§Ø‡•ã‡§ú‡§®‡§æ ‡§∞‡§æ‡§ú‡•ç‡§Ø ‡§∏‡§∞‡§ï‡§æ‡§∞‡§ö‡•ç‡§Ø‡§æ ‡§µ‡§ø‡§ö‡§æ‡§∞‡§æ‡§ß‡•Ä‡§®! ‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§∂‡•ç‡§∞‡•Ä ‡§∏‡§Ç‡§ú‡§Ø ‡§∂‡§ø‡§Ç‡§¶‡•á ‡§Ø‡§æ‡§Ç‡§ö‡§æ ‡§™‡•ç‡§∞‡§∂‡•ç‡§® 1
3000


3000it [11:33,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§≠‡•Ä‡§Æ‡§æ - ‡§ï‡•ã‡§∞‡•á‡§ó‡§æ‡§µ ‡§¶‡§Ç‡§ó‡§≤‡•Ä ‡§¨‡§¶‡•ç‡§¶‡§≤ ‡§∞‡§æ‡§ú‡•ç‡§Ø ‡§∏‡§∞‡§ï‡§æ‡§∞‡§®‡•á ‡§®‡§ø‡§Ø‡•Å‡§ï‡•ç‡§§ ‡§ï‡•á‡§≤‡•á‡§≤‡•ç‡§Ø‡§æ ‡§ö‡•å‡§ï‡§∂‡•Ä ‡§Ü‡§Ø‡•ã‡§ó‡§æ‡§≤‡§æ ‡§µ‡§ø‡§∞‡•ã‡§ß ‡§ï‡§∞‡•Ä‡§§ ‡§Ü‡§π‡•á. 0
3100


3100it [11:56,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Ö‡§π‡§ø‡§≤‡•ç‡§Ø‡§æ ‡§¨‡§æ‡§à ‡§π‡•ã‡§≥‡§ï‡§∞ ‡§Ø‡§æ ‡§ï‡•á‡§µ‡§≥ ‡§è‡§ï ‡§Æ‡§π‡§æ‡§® ‡§∂‡§æ‡§∏ ‡§ï, ‡§™‡§∞‡§æ‡§ï‡•ç‡§∞‡§Æ‡•Ä ‡§Ø‡•ã‡§¶‡•ç‡§ß‡§æ ‡§Ü‡§£‡§ø ‡§∏‡§∞‡•ç‡§µ‡§∂‡•ç‡§∞‡•Å‡§§ ‡§ß‡§®‡•Å‡§∞‡•ç ‡§ß‡§∞ ‡§π‡•ã‡§§‡•ç‡§Ø‡§æ. ‡§∏‡§æ‡§π‡§∏‡•Ä ‡§Ø‡•ã ‡§ß‡•ç‡§Ø‡§æ ‡§™‡•ç‡§∞‡§Æ‡§æ‡§£‡•á ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡•Ä ‡§Ø‡•Å‡§¶‡•ç‡§ß‡§æ ‡§ö‡•á ‡§®‡•á‡§§‡•É‡§§‡•ç‡§µ ‡§ï‡§∞‡•Ç‡§® ‡§µ‡§ø‡§ú‡§Ø ‡§∏‡§Ç‡§™‡§æ‡§¶‡§® ‡§ï‡•á‡§≤‡§æ. ‡§∏‡§Ç‡§™‡•Ç‡§∞‡•ç‡§£ ‡§Ü‡§Ø‡•Å‡§∑‡•ç‡§Ø ‡§Æ‡§π‡§ø‡§≤‡§æ‡§Ç‡§ö‡•á ‡§∏ ‡§∂‡§ï‡•ç‡§§‡•Ä ‡§ï‡§∞‡§£ ‡§Ü‡§£‡§ø ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•Ä ‡§™‡§∞‡§ø‡§∏‡•ç‡§•‡§ø‡§§‡•Ä ‡§¨‡§¶‡§≤ ‡§£‡•ç‡§Ø‡§æ ‡§ï‡§∞‡§§‡§æ ‡§µ‡•á‡§ö ‡§≤‡•á‡§≤‡•ç‡§Ø‡§æ ‡§™‡•Å‡§£‡•ç‡§Ø ‡§∂‡•ç‡§≤‡•ã‡§ï ‡§Ö‡§π‡§ø‡§≤‡•ç‡§Ø‡§æ ‡§¨‡§æ‡§à ‡§π‡•ã‡§≥‡§ï‡§∞ ‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§µ‡§ø‡§®‡§Æ‡•ç‡§∞ ‡§Ö‡§≠‡§ø‡§µ‡§æ‡§¶‡§®! 2
3200


3200it [12:19,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ï‡•ç‡§∞‡§æ‡§Ç‡§§‡§ø ‡§ó‡•Å‡§∞‡•Å ‡§≤ ‡§π‡•Å ‡§ú‡•Ä ‡§µ ‡§∏‡•ç‡§§‡§æ‡§¶ ‡§∏‡§æ‡§≥‡§µ‡•á ‡§Ø‡§æ‡§Ç‡§ö‡•Ä ‡§Ü‡§ú ‡§ú‡§Ø‡§Ç‡§§‡•Ä. ‡§Ø‡§æ‡§®‡§ø‡§Æ‡§ø‡§§‡•ç‡§§‡§æ‡§®‡•á ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§µ‡§ø‡§®‡§Æ‡•ç‡§∞ ‡§Ö‡§≠‡§ø‡§µ‡§æ‡§¶‡§®. 2
3300


3300it [12:42,  4.36it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§®‡§æ‡§≤‡•á‡§∏‡§´‡§æ‡§à ‡§ö‡•Ä ‡§ï‡§æ‡§Æ‡•á ‡§Ø‡§æ‡§µ‡§∞‡•ç‡§∑‡•Ä 40 ‚ÑÖ ‡§ü‡§ï‡•ç‡§ï‡•á‡§ö ‡§ù‡§æ‡§≤‡•Ä ‡§Ü‡§π‡•á‡§§. ‡§ï‡§æ‡§π‡•Ä ‡§†‡§ø‡§ï‡§æ‡§£‡•Ä ‡§ó‡§æ‡§≥ ‡§ï‡§æ‡§¢‡§≤‡•á‡§≤‡§æ ‡§®‡§æ‡§π‡•Ä, ‡§ï‡§æ‡§π‡•Ä ‡§†‡§ø‡§ï‡§æ‡§£‡•Ä ‡§ó‡§æ‡§≥ ‡§â‡§ö‡§≤ ‡§≤‡•á‡§≤‡§æ ‡§®‡§æ‡§π‡•Ä. ‡§§‡•ç‡§Ø‡§æ‡§Æ‡•Å‡§≥‡•á‡§ö ‡§µ‡§ú‡§®‡§æ‡§ö‡•Ä ‡§Ü‡§ï‡§°‡•á‡§µ‡§æ‡§∞‡•Ä ‡§™‡§æ‡§≤‡§ø‡§ï‡§æ ‡§ú‡§æ‡§π‡•Ä‡§∞ ‡§ï‡§∞‡•Ä‡§§ ‡§®‡§æ‡§π‡•Ä, ‡§°‡§Æ‡•ç‡§™‡§ø‡§Ç‡§ó ‡§µ‡§∞ ‡§ï‡§ø‡§§‡•Ä ‡§ó‡§æ‡§≥ ‡§ü‡§æ‡§ï‡§≤‡§æ ‡§Ø‡§æ‡§ö‡•Ä ‡§Æ‡§æ‡§π‡§ø‡§§‡•Ä ‡§≤‡§™ ‡§µ‡§≤‡•Ä ‡§ú‡§æ‡§§‡•á‡§Ø, ‡§Ö‡§∏‡•á ‡§®‡§æ‡§≤‡•á‡§∏‡§´‡§æ‡§à ‡§ö‡•á ‡§ö‡§ø‡§§‡•ç‡§∞ ‡§Ü‡§ú ‡§Ü‡§Æ‡•ç‡§π‡•Ä ‡§™‡§æ‡§π‡§£‡•Ä ‡§ï‡•á‡§≤‡•ç‡§Ø‡§æ‡§®‡§Ç‡§§‡§∞ ‡§∏‡§Æ‡•ã‡§∞ ‡§Ü‡§≤‡•á. 0
3400


3400it [13:05,  4.37it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§µ‡§ø‡§ï‡§æ‡§∏ ‡§ï‡§æ‡§Ç‡§®‡§æ ‡§∏‡§ó‡§≥‡•á ‡§≠‡•Ç‡§ñ‡§Ç‡§° ‡§¶‡§æ‡§® ‡§ï‡•á‡§≤‡•á ‡§µ ‡§®‡§æ‡§ó‡§∞‡§ø‡§ï‡§æ‡§Ç‡§®‡§æ ‡§Æ‡§ø‡§≥‡§£‡§æ‡§±‡•ç‡§Ø‡§æ ‡§∏‡•á‡§µ‡§æ ‡§ó‡§ø‡§≥‡§Ç‡§ï‡•É‡§§ ‡§ï‡•á‡§≤‡•ç‡§Ø‡§æ ‡§Ü‡§π‡•á‡§§. 0
3500


3500it [13:28,  4.36it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§µ‡•à‡§≠‡§µ‡§µ‡§æ‡§°‡•Ä ‡§µ ‡§¶‡•á‡§µ‡§ó‡§° ‡§Ø‡•á‡§•‡•Ä‡§≤ ‡§ï‡§æ‡§∞‡•ç‡§Ø‡§ï‡§∞‡•ç‡§§‡§æ ‡§Æ‡•á‡§≥‡§æ‡§µ‡•ç‡§Ø‡§æ‡§§ ‡§ï‡§æ‡§∞‡•ç‡§Ø‡§ï‡§∞‡•ç‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§∏‡§Ç‡§¨‡•ã‡§ß‡§ø‡§§ ‡§ï‡•á‡§≤‡•á. ‡§ï‡•ã‡§ï‡§£‡§ö‡•ç‡§Ø‡§æ ‡§™‡•ç‡§∞‡§ó‡§§‡•Ä ‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§π‡§æ‡§§‡§≠‡§æ‡§∞ ‡§≤‡§æ‡§µ‡§§ ‡§®‡§ø‡§§‡•á‡§∂ ‡§∞‡§æ‡§£‡•á ‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§≠‡§∞‡§ò‡•ã‡§∏ ‡§Æ‡§§‡§æ‡§Ç‡§®‡•Ä ‡§µ‡§ø‡§ú‡§Ø‡•Ä ‡§ï‡§∞‡§æ, ‡§π‡•á ‡§ï‡•ã‡§ï‡§£ ‡§µ‡§æ‡§∏‡§ø‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§Ü‡§µ‡§æ‡§π‡§® ‡§ï‡§∞‡§§‡•ã. 2
3600


3600it [13:51,  4.36it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§™‡§∞‡§≥‡•Ä ‡§®‡§ó‡§∞ ‡§™‡§∞‡§ø‡§∑‡§¶‡•á‡§ö‡•ç‡§Ø‡§æ ‡§∂‡§ø‡§ï‡•ç‡§∑‡§£ ‡§∏‡§Æ‡§ø‡§§‡•Ä, ‡§°‡•â. ‡§≠‡§æ‡§≤‡§ö‡§Ç‡§¶‡•ç‡§∞ ‡§µ‡§æ‡§ö‡§®‡§æ‡§≤‡§Ø ‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§µ‡§ø‡§¶‡•ç‡§Ø‡§Æ‡§æ‡§®‡•á ‡§∂‡§π‡§∞‡§æ‡§§‡•Ä‡§≤ ‡§¶‡§π‡§æ‡§µ‡•Ä, ‡§¨‡§æ‡§∞‡§æ‡§µ‡•Ä ‡§™‡§∞‡§ø‡§ï‡•ç‡§∑‡•á‡§§ ‡§ó‡•Å‡§£‡§µ‡§Ç‡§§ ‡§µ‡§ø‡§¶‡•ç‡§Ø‡§æ‡§∞‡•ç‡§•‡•ç‡§Ø‡§æ‡§Ç‡§ö‡§æ ‡§¨‡§ï‡•ç‡§∑‡§ø‡§∏ ‡§¶‡•á‡§ä‡§® ‡§∏‡§§‡•ç‡§ï‡§æ‡§∞ ‡§ï‡•á‡§≤‡§æ. ‡§§‡§∏‡•á‡§ö ‡§∏‡•ç‡§µ. ‡§™‡§Ç‡§°‡§ø‡§§ ‡§Ö‡§£‡•ç‡§£‡§æ ‡§Æ‡•Å‡§Ç‡§°‡•á ‡§∏‡•ç‡§Æ‡•É‡§§‡•Ä ‡§™‡•Å‡§∞‡§∏‡•ç‡§ï‡§æ‡§∞‡§æ‡§ö‡•á ‡§µ‡§ø‡§§‡§∞‡§£ ‡§ï‡•á‡§≤‡•á. 2
3700


3700it [14:14,  4.36it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§™‡§∞‡§¶‡•á‡§∂‡§æ‡§§ ‡§â‡§≠‡§æ‡§∞‡§≤‡•ç‡§Ø‡§æ ‡§ú‡§æ‡§£‡§æ‡§±‡•ç‡§Ø‡§æ ‡§ü‡§æ‡§ä‡§® ‡§π‡•â ‡§≤‡§ö‡•ç‡§Ø‡§æ ‡§ß‡§∞‡•ç‡§§‡•Ä‡§µ‡§∞ ‡§¨‡§æ‡§∞‡§æ‡§Æ‡§§‡•Ä‡§§ ‡§≤‡•ç‡§Ø‡§æ ‡§§‡•Ä‡§® ‡§π‡§§‡•ç‡§§‡•Ä ‡§ö‡•å ‡§ï‡§æ‡§ö‡§æ ‡§µ‡§ø‡§ï‡§æ‡§∏ ‡§ï‡§∞‡§£‡•ç‡§Ø‡§æ‡§ö‡•á ‡§®‡§ø‡§∞‡•ç‡§¶‡•á‡§∂ ‡§¶‡§ø‡§≤‡•á. ‡§Ø‡§æ‡§ö‡•Ä ‡§ú‡§¨‡§æ‡§¨‡§¶‡§æ‡§∞‡•Ä ‡§™‡•ç‡§∞‡§∏‡§ø‡§¶‡•ç‡§ß ‡§µ‡§æ‡§∏‡•ç‡§§‡•Å ‡§µ‡§ø‡§∂‡§æ‡§∞‡§¶ ‡§™‡•Ä. ‡§ï‡•á. ‡§¶‡§æ‡§∏ ‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ‡§ï‡§°‡•á ‡§∏‡•ã‡§™‡§µ‡§£‡•ç‡§Ø‡§æ‡§§ ‡§Ü‡§≤‡•Ä. ‡§Ø‡§æ‡§∏‡§Ç‡§¶‡§∞‡•ç‡§≠‡§æ‡§§ ‡§≤‡§æ ‡§∏‡§Ç‡§™‡•Ç‡§∞‡•ç‡§£ ‡§Ü‡§∞‡§æ‡§ñ‡§°‡§æ ‡§§‡§Ø‡§æ‡§∞ ‡§ï‡§∞‡§£‡•ç‡§Ø‡§æ‡§∏ ‡§∏‡§æ‡§Ç‡§ó‡§ø‡§§‡§≤‡•á. ‡§Ø‡§æ‡§∏‡§π ‡§ï‡•Ö ‡§®‡§≤ ‡§∏‡•Å‡§∂‡•ã‡§≠‡•Ä ‡§ï‡§∞‡§£‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§∏‡•Ç‡§ö‡§®‡§æ ‡§ï‡•á‡§≤‡•ç‡§Ø‡§æ. 1
3800


3800it [14:37,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§™‡§ø‡§ï‡§æ‡§µ‡§∞ ‡§µ‡§§‡§® ‡§¶‡§æ‡§∞ ‡§æ‡§Ç‡§ö‡§æ ‡§π‡§ï‡•ç‡§ï ‡§ï‡§æ‡§¢‡•Ç‡§® ‡§ò‡•á‡§§‡§≤‡§æ ‡§Ö‡§®‡•ç ‡§™‡•ç‡§∞‡§§‡•ç‡§Ø‡•á‡§ï‡§æ‡§≤‡§æ ‡§ï‡§∏‡§æ ‡§Ø‡§≤‡§æ ‡§ú‡§Æ‡•Ä‡§® ‡§Æ‡§ø‡§≥‡•á‡§≤ ‡§Ö‡§∂‡§æ ‡§∏‡•Å‡§ß‡§æ‡§∞‡§£‡§æ ‡§ï‡•á‡§≤‡•ç‡§Ø‡§æ. ‡§â‡§¶‡•ç‡§ß‡•ç‡§µ‡§∏‡•ç‡§§ ‡§ó‡§æ‡§µ‡§Ç ‡§™‡•Å‡§®‡•ç‡§π‡§æ ‡§µ‡§∏ ‡§µ‡§≤‡•Ä. ‡§ú‡§Æ‡•Ä‡§® ‡§ï‡§∏‡§æ ‡§Ø‡§≤‡§æ ‡§¨‡•Ä - ‡§¨‡§ø‡§Ø‡§æ ‡§£‡§Ç ‡§¶‡•á‡§§ ‡§∂‡•á‡§§‡•Ä‡§∏‡§æ‡§†‡•Ä ‡§™‡•ç‡§∞‡•ã‡§§‡•ç‡§∏‡§æ‡§π‡§® ‡§¶‡§ø‡§≤‡•á. ‡§∂‡§ø‡§µ‡§æ‡§ú‡•Ä ‡§Æ‡§π‡§æ‡§∞‡§æ‡§ú‡§æ‡§Ç‡§®‡§æ ‡§∞‡§Ø ‡§§‡•á‡§ö‡•ç‡§Ø‡§æ ‡§Æ‡§®‡§æ‡§§ ‡§∏‡•ç‡§•‡§æ‡§® ‡§ï‡§æ ‡§Æ‡§ø‡§≥‡§æ‡§≤‡§Ç, ‡§Ø‡§æ‡§ö‡•Ä ‡§ï‡§æ‡§∞‡§£‡§Ç ‡§Ø‡§æ ‡§¶‡•Ç‡§∞‡§ó‡§æ‡§Æ‡•Ä ‡§®‡§ø‡§∞‡•ç‡§£ ‡§Ø‡§æ‡§Ç‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§Ü‡§π‡•á. 0
3900


3900it [15:00,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Æ‡§æ‡§ü‡•Å‡§Ç‡§ó‡§æ ‡§Ø‡•á‡§•‡•Ä‡§≤ ‡§∞‡•á‡§≤‡•ç‡§µ‡•á ‡§ú‡§æ‡§ó‡•á‡§µ‡§∞‡•Ä‡§≤ ‡§ù‡•ã‡§™‡§° ‡§º ‡§™‡§ü‡•ç‡§ü‡•Ä ‡§µ‡§æ‡§∏‡•Ä ‡§Ø‡§æ‡§Ç‡§∂‡•Ä ‡§∏‡§Ç‡§µ‡§æ‡§¶ ‡§∏‡§æ‡§ß‡§≤‡§æ! 1
4000


4000it [15:23,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§•‡•ã‡§∞ ‡§∏‡§Æ‡§æ‡§ú ‡§∏‡•Å‡§ß‡§æ‡§∞‡§ï, ‡§ï‡•ç‡§∞‡§æ‡§Ç‡§§‡§ø‡§ï‡§æ‡§∞‡§ï, ‡§∂‡§ø‡§ï‡•ç‡§∑‡§£ ‡§§‡§ú‡•ç‡§û, ‡§µ‡§ø‡§ö‡§æ‡§∞‡§µ‡§Ç‡§§ ‡§ó‡•ã‡§™‡§æ‡§≥ ‡§ó‡§£‡•á‡§∂ ‡§Ü‡§ó‡§∞‡§ï‡§∞ ‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§ú‡§Ø‡§Ç‡§§ ‡§ø ‡§¶‡§ø‡§®‡•Ä ‡§∂‡§§ ‡§∂ : ‡§Ö‡§≠‡§ø‡§µ‡§æ‡§¶‡§®..! 2
4100


4100it [15:46,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ú‡§≤‡§Ø‡•Å‡§ï‡•ç‡§§ ‡§∂‡§ø‡§µ‡§æ‡§∞ ‡§∏‡§æ‡§†‡•Ä ‡§∏‡§∞‡•ç‡§µ‡§æ‡§Ç‡§®‡•Ä‡§ö ‡§â‡§§‡•ç‡§§‡§Æ ‡§ï‡§æ‡§Æ ‡§ï‡•á‡§≤‡•á. ‡§Ü‡§ó‡§æ‡§Æ‡•Ä 2 ‡§µ‡§∞‡•ç‡§∑‡•á ‡§Ü‡§£‡§ñ‡•Ä ‡§ó‡§§‡•Ä‡§®‡•á ‡§ï‡§æ‡§Æ ‡§ï‡§∞‡•Ç. ‡§Ø‡§æ ‡§∏‡§æ‡§Æ‡•Ç‡§π‡§ø‡§ï ‡§™‡•ç‡§∞‡§Ø‡§§‡•ç‡§®‡§æ ‡§Ç‡§®‡•Ä ‡§¶‡•Å‡§∑‡•ç‡§ï‡§æ‡§≥ ‡§π‡§æ ‡§≤‡§µ‡§ï‡§∞‡§ö ‡§≠‡•Å‡§§ ‡§ï‡§æ‡§≥ ‡§Ö‡§∏‡•á‡§≤! ‡§ö‡§≤‡§æ ‡§Ü‡§™‡§≤‡•ç‡§Ø‡§æ ‡§∂‡•á‡§§‡§ï‡§∞‡•Ä ‡§¨‡§æ‡§Ç‡§ß‡§µ‡§æ‡§Ç‡§®‡§æ, ‡§≠‡§æ‡§µ‡•Ä ‡§™‡§ø‡§¢ ‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§∂‡§æ‡§∂‡•ç‡§µ‡§§ ‡§∂‡•á‡§§‡•Ä‡§ö‡•á ‡§Ü‡§®‡§Ç‡§¶‡§¶‡§æ‡§Ø‡•Ä ‡§µ‡§∞‡•ç‡§§‡§Æ‡§æ‡§® ‡§™‡§æ‡§π‡§§‡§æ ‡§Ø‡§æ‡§µ‡•á, ‡§Ø‡§æ‡§∏‡§æ‡§†‡•Ä ‡§è‡§ï ‡§¶‡§ø‡§≤‡§æ‡§®‡•á ‡§ï‡§æ‡§Æ ‡§ï‡§∞‡•Å! 2
4200


4200it [16:09,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Æ‡•Å‡§Ç‡§¨‡§à‡§ö‡•ç‡§Ø‡§æ ‡§µ‡§ø‡§ï‡§æ‡§∏ ‡§Ü‡§∞‡§æ‡§ñ‡§° ‡•ç‡§Ø‡§æ‡§§‡•Ç‡§® 10 ‡§≤‡§æ‡§ñ ‡§™‡§∞‡§µ‡§°‡§£‡§æ‡§∞‡•Ä ‡§ò‡§∞‡•á ‡§®‡§ø‡§∞‡•ç‡§Æ‡§æ‡§£ ‡§π‡•ã‡§£‡§æ‡§∞ ‡§Ü‡§π‡•á‡§§. ‡§π‡•Ä ‡§ò‡§∞‡•á ‡§™‡§∞‡§µ‡§°‡§£‡§æ‡§∞‡•Ä ‡§Ö‡§∏‡§§‡•Ä‡§≤ ‡§Ü‡§£‡§ø ‡§∏‡§æ‡§Æ‡§æ‡§®‡•ç‡§Ø ‡§Æ‡§æ‡§£‡§∏‡§æ ‡§≤‡§æ‡§ö ‡§Æ‡§ø‡§≥‡§§‡•Ä‡§≤, ‡§Ø‡§æ‡§ö‡•Ä ‡§ï‡§æ‡§≥‡§ú‡•Ä ‡§Ü‡§™‡§£ ‡§∏‡§æ‡§∞‡•á ‡§Æ‡§ø‡§≥‡•Ç‡§® ‡§ò‡•á‡§ä! 2
4300


4300it [16:32,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Ö‡§≠‡•ç‡§Ø‡§æ‡§∏‡§ï‡§æ‡§Ç‡§®‡•Ä ‡§ò‡§æ‡§¨‡§∞ ‡§£‡•ç‡§Ø‡§æ‡§ö‡•Ä ‡§ó‡§∞‡§ú ‡§®‡§æ‡§π‡•Ä, ‡§™‡§£ ‡§¶‡•á‡§∂ ‡§µ‡§ø‡§ò‡§æ‡§§‡§ï ‡§ï‡§æ‡§∞‡•ç‡§Ø ‡§ï‡§∞‡§£‡§æ‡§∞‡•ç‚Äç‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§∏‡•ã‡§°‡§£‡§æ‡§∞ ‡§®‡§æ‡§π‡•Ä. ‡§§‡•á ‡§∏‡§Ç‡§µ‡§ø‡§ß‡§æ ‡§®‡§æ‡§®‡•á ‡§Ü‡§™‡§≤‡•ç‡§Ø‡§æ‡§µ‡§∞ ‡§∏‡•ã‡§™ ‡§µ‡§ø‡§≤‡•á‡§≤‡•á ‡§¶‡§æ‡§Ø ‡§ø ‡§§‡•ç‡§§‡•ç‡§µ! 0
4400


4400it [16:55,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Ü‡§ú ‡§ó‡§°‡§ö‡§ø‡§∞‡•ã‡§≤‡•Ä ‡§§‡•Ä‡§≤ ‡§Ö‡§§‡•ç‡§Ø‡§Ç‡§§ ‡§™‡•ç‡§∞‡§æ‡§ö‡•Ä‡§® ‡§Ö‡§∂‡§æ ‡§∂‡§ø‡§µ ‡§Æ‡§Ç‡§¶‡§ø‡§∞‡§æ ‡§∏ ‡§≠‡•á‡§ü ‡§¶‡•á‡§ä‡§® ‡§∂‡§Ç‡§ï‡§∞‡§æ ‡§ö‡•á ‡§¶‡§∞‡•ç‡§∂‡§® ‡§ò‡•á‡§§‡§≤‡•á. 1
4500


4500it [17:18,  4.36it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ó‡§°‡§ö‡§ø‡§∞‡•ã‡§≤‡•Ä ‡§ú‡§ø‡§≤‡•ç‡§π‡§æ ‡§™‡§∞‡§ø‡§∑‡§¶‡•á‡§µ‡§∞ ‡§Æ‡§π‡§æ‡§∞‡§æ‡§∑‡•ç‡§ü‡•ç‡§∞ ‡§µ‡§ø‡§ï‡§æ‡§∏ ‡§Ü‡§ò‡§æ‡§°‡•Ä‡§ö‡•Ä ‡§∏‡§§‡•ç‡§§‡§æ. ‡§Ü‡§¶‡§ø‡§µ‡§æ‡§∏‡•Ä ‡§µ‡§ø‡§¶‡•ç‡§Ø‡§æ‡§∞‡•ç‡§•‡•Ä ‡§∏‡§Ç‡§ò‡§æ‡§ö‡•á ‡§®‡•á‡§§‡•á ‡§Ö‡§ú‡§Ø ‡§ï‡§Ç ‡§ï‡§°‡§æ ‡§≤ ‡§µ‡§æ‡§∞ ‡§Ø‡§æ‡§Ç‡§ö‡•Ä ‡§Ö‡§ß‡•ç‡§Ø‡§ï‡•ç‡§∑‡§™‡§¶‡•Ä ‡§§‡§∞ ‡§ï‡§æ‡§Å‡§ó‡•ç‡§∞‡•á‡§∏‡§ö‡•á ‡§Æ‡§®‡•ã‡§π‡§∞ ‡§ï‡•ã‡§∞‡•á ‡§ü‡•Ä ‡§Ø‡§æ‡§Ç‡§ö‡•Ä ‡§â‡§™‡§æ‡§ß‡•ç‡§Ø‡§ï‡•ç‡§∑‡§™‡§¶‡•Ä ‡§®‡§ø‡§µ‡§° ‡§ù‡§æ‡§≤‡•ç‡§Ø‡§æ‡§¨‡§¶‡•ç‡§¶‡§≤ ‡§π‡§æ‡§∞‡•ç‡§¶‡§ø‡§ï ‡§Ö‡§≠‡§ø‡§®‡§Ç‡§¶‡§® ‡§µ ‡§∂‡•Å‡§≠‡•á‡§ö‡•ç‡§õ‡§æ! 2
4600


4600it [17:40,  4.37it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ï‡•ã‡§∞‡•á‡§ó‡§æ‡§µ ‡§Ø‡•á‡§•‡•á ‡§≠‡•á‡§ü.... 1
4700


4700it [18:04,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§µ‡•à‡§¶‡•ç‡§Ø‡§ï‡•Ä‡§Ø ‡§™‡§¶‡§µ‡•ç‡§Ø‡•Å‡§§‡•ç‡§§‡§∞ ‡§Ö‡§≠‡•ç‡§Ø‡§æ‡§∏‡§ï‡•ç‡§∞‡§Æ‡§æ‡§§ ‡§Æ‡§∞‡§æ‡§†‡§æ ‡§Ü‡§∞‡§ï‡•ç‡§∑‡§£‡§æ ‡§∏‡§Ç‡§¶‡§∞‡•ç‡§≠‡§æ‡§§ ‡§≤‡•Ä ‡§∞‡§æ‡§ú‡•ç‡§Ø ‡§∏‡§∞‡§ï‡§æ‡§∞‡§ö‡•Ä ‡§Ø‡§æ‡§ö‡§ø‡§ï‡§æ ‡§∏‡•Å‡§™‡•ç‡§∞‡•Ä‡§Æ ‡§ï‡•ã‡§∞‡•ç‡§ü‡§æ ‡§®‡•á‡§π‡•Ä ‡§´‡•á‡§ü‡§æ‡§≥‡§≤‡•Ä ‡§Ü‡§π‡•á. ‡§Ø‡§æ‡§µ‡§∞‡•ç‡§∑‡•Ä ‡§ö‡•Ä ‡§™‡•ç‡§∞‡§µ‡•á‡§∂ ‡§™‡•ç‡§∞‡§ï‡•ç‡§∞‡§ø‡§Ø‡§æ ‡§Æ‡§∞‡§æ‡§†‡§æ ‡§Ü‡§∞‡§ï‡•ç‡§∑‡§£‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§ï‡§æ‡§Ø‡§¶‡•ç‡§Ø‡§æ‡§®‡•Å‡§∏‡§æ‡§∞ ‡§π‡•ã‡§£‡§æ‡§∞ ‡§®‡§æ‡§π‡•Ä. ‡§Æ‡§§‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§Æ‡•ã‡§π‡§æ ‡§™‡§æ‡§Ø‡•Ä ‡§∏‡§∞‡§ï‡§æ‡§∞‡§®‡•á ‡§µ‡§ø‡§¶‡•ç‡§Ø‡§æ‡§∞‡•ç‡§•‡•ç‡§Ø‡§æ‡§Ç‡§ö‡§æ ‡§π‡•Ä ‡§¨‡§≥‡•Ä ‡§¶‡§ø‡§≤‡§æ ‡§Ü‡§π‡•á. 0
4800


4800it [18:27,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Ö‡§π‡§Æ‡§¶‡§®‡§ó‡§∞ ‡§ú‡§ø‡§≤‡•ç‡§π‡•ç‡§Ø‡§æ‡§§‡•Ä‡§≤ ‡§ò‡§æ‡§ü ‡§ò‡§∞ ‡§â‡§∞‡•ç ‡§ß‡•ç‡§µ ‡§ß‡§∞‡§£ ‡§ï‡•ç‡§∑‡•á‡§§‡•ç‡§∞‡§æ‡§§‡•Ä‡§≤ ‡§™‡•ç‡§∞‡§ï‡§≤‡•ç‡§™‡§ó‡•ç‡§∞‡§∏‡•ç‡§§ ‡§Ü‡§Ç‡§¶‡•ã‡§≤‡§®‡§ï‡§∞‡•ç ‡§§‡•ç‡§Ø‡§æ ‡§Ü‡§¶‡§ø‡§µ‡§æ‡§∏‡•Ä ‡§∂‡•á‡§§‡§ï‡§±‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•Ä ‡§Ü‡§ú ‡§Æ‡§Ç‡§§‡•ç‡§∞‡§æ‡§≤‡§Ø‡§æ‡§§ ‡§≠‡•á‡§ü ‡§ò‡•á‡§§‡§≤‡•Ä. ‡§ó‡•á‡§≤‡•ç‡§Ø‡§æ ‡•®‡•¶ ‡§µ‡§∞‡•ç‡§∑‡§æ‡§Ç‡§™‡§æ‡§∏‡•Ç‡§® ‡§Ü‡§Ç‡§¶‡•ã‡§≤‡§® ‡§ï‡§∞‡§£‡§æ‡§±‡•ç‡§Ø‡§æ ‡§Ø‡§æ ‡§∂‡•á‡§§‡§ï‡§±‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§∏‡§Æ‡§∏‡•ç‡§Ø‡§æ ‡§ú‡§æ‡§£‡•Ç‡§® ‡§ò‡•á‡§§‡§≤‡•ç‡§Ø‡§æ. ‡§Ø‡§æ ‡§µ‡•á‡§≥‡•Ä ‡§Ü‡§Æ‡§¶‡§æ‡§∞ ‡§â‡§™‡§∏‡•ç‡§•‡§ø‡§§ ‡§π‡•ã‡§§‡•á. 1
4900


4900it [18:50,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Ü‡§Æ‡§ö‡•á ‡§Æ‡§æ‡§∞‡•ç‡§ó‡§¶‡§∞‡•ç‡§∂‡§ï, ‡§≤‡•ã‡§ï‡§®‡•á‡§§‡•á ‡§Æ‡§æ. ‡§∂‡•ç‡§∞‡•Ä ‡§ó‡•ã‡§™‡•Ä‡§®‡§æ‡§• ‡§ú‡•Ä ‡§Æ‡•Å‡§Ç‡§°‡•á ‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§ú‡§Ø‡§Ç‡§§ ‡§ø ‡§¶‡§ø‡§®‡•Ä ‡§µ‡§ø‡§®‡§Æ‡•ç‡§∞ ‡§Ö‡§≠‡§ø‡§µ‡§æ‡§¶‡§®..! 2
5000


5000it [19:13,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ñ‡§æ‡§∞ ‡§Æ ‡§∞‡•Å ‡§Ü‡§à ‡§Æ‡§Ç‡§¶‡§ø‡§∞ ‡§Ø‡§ú‡•ç‡§û ‡§¶‡§∞‡•ç‡§∂‡§® ‡§ò‡•á‡§§‡§≤‡•á! 1
5100


5100it [19:36,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ú‡•ç‡§Ø‡•á‡§∑‡•ç‡§† ‡§∏‡§æ‡§π‡§ø‡§§‡•ç‡§Ø‡§ø‡§ï ‡§µ ‡§∞‡§Ç‡§ó‡§ï‡§∞‡•ç‡§Æ‡•Ä ‡§∞‡§§‡•ç‡§®‡§æ‡§ï‡§∞ ‡§Æ‡§§‡§ï‡§∞‡•Ä ‡§Ø‡§æ‡§Ç‡§ö‡§Ç ‡§®‡§ø‡§ß‡§® ‡§ö‡§ü‡§ï‡§æ ‡§≤‡§æ‡§µ‡•Ç‡§® ‡§ú‡§æ‡§£‡§æ‡§∞‡§Ç ‡§Ü‡§π‡•á. ‡§®‡§æ‡§ü‡§ï‡§ï‡§æ‡§∞ ‡§Æ‡•ç‡§π‡§£‡•Ç‡§®, ‡§µ‡§ø‡§∂‡•á‡§∑‡§§‡§É ‡§¨‡§æ‡§≤ ‡§∞‡§Ç‡§ó‡§≠‡•Ç‡§Æ‡•Ä ‡§∏‡§æ‡§†‡•Ä ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•á ‡§Ø‡•ã‡§ó‡§¶‡§æ‡§® ‡§Æ‡•ã‡§†‡•á ‡§Ü‡§π‡•á. ‡§Æ‡§∞‡§æ‡§†‡•Ä ‡§∏‡§æ‡§π‡§ø‡§§‡•ç‡§Ø‡§æ‡§§‡•Ä‡§≤ ‡§ï‡§•‡§æ ‡§µ ‡§≤‡§≤‡§ø‡§§ ‡§™‡•ç‡§∞‡§æ‡§Ç‡§§ ‡§æ‡§§‡§π‡•Ä ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡•Ä ‡§Ö‡§µ‡•ç‡§Ø‡§æ‡§π‡§§ ‡§¶‡§∞‡•ç‡§ú‡•á‡§¶‡§æ‡§∞ ‡§≤‡•á‡§ñ‡§® ‡§ï‡•á‡§≤‡•á. ‡§∞‡§§‡•ç‡§®‡§æ‡§ï‡§∞ ‡§Æ‡§§‡§ï‡§∞‡•Ä ‡§Ø‡§æ‡§Ç‡§®‡§æ ‡§µ‡§ø‡§®‡§Æ‡•ç‡§∞ ‡§Ü‡§¶‡§∞‡§æ‡§Ç‡§ú‡§≤‡•Ä! 0
5200


5200it [19:59,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§∏‡•ç‡§µ‡§∞‡§æ‡§ú‡•ç‡§Ø ‡§∏‡§Ç‡§∏‡•ç‡§•‡§æ‡§™‡§ï ‡§õ‡§§‡•ç‡§∞‡§™‡§§‡•Ä ‡§∂‡§ø‡§µ‡§æ‡§ú‡•Ä ‡§Æ‡§π‡§æ‡§∞‡§æ‡§ú ‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§∏‡•ç‡§Æ‡§æ‡§∞ ‡§ï‡§æ‡§≤‡§æ ‡§µ‡§Ç‡§¶‡§® ‡§ï‡§∞‡•Ç‡§® ‡§™‡§∞‡§ø‡§µ‡§∞‡•ç‡§§‡§® ‡§Ø‡§æ‡§§‡•ç‡§∞ ‡•á‡§∏ ‡§∂‡•Å‡§≠‡§æ‡§∞‡§Ç‡§≠ ‡§ï‡•á‡§≤‡§æ. 2
5300


5300it [20:22,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§§‡§æ. ‡§Ü‡§Ç‡§¨‡•á‡§ó‡§æ‡§µ ‡§ú‡§ø. ‡§™‡•Å‡§£‡•á ‡§Ø‡•á‡§•‡•Ä‡§≤ ‡§Æ‡•á‡§≥‡§æ‡§µ‡•ç‡§Ø‡§æ‡§§ ‡§¨‡•ã‡§≤‡§§‡§æ‡§®‡§æ ‡§ñ‡§æ‡§∏‡§¶‡§æ‡§∞ ‡§∞‡§æ‡§ú‡•Ç ‡§∂‡•á‡§ü‡•ç‡§ü‡•Ä 1
5400


5400it [20:45,  4.34it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


üí• ‡§¶‡•á‡§∂‡§µ‡•ç‡§Ø‡§æ‡§™‡•Ä ‡§∂‡•á‡§§‡§ï‡§∞‡•Ä ‡§®‡•á‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•Ä ‡§ó‡§æ‡§Ç‡§ß‡•Ä ‡§™‡•Ä‡§∏ ‡§´‡§æ‡§ä‡§Ç‡§°‡•á‡§∂‡§® ‡§¶‡§ø‡§≤‡•ç‡§≤‡•Ä ‡§Ø‡•á‡§•‡•á ‡§¨‡•à‡§†‡§ï ‡§∏‡§Ç‡§™‡§®‡•ç‡§®... üí• ‡§Ü‡§ñ ‡§º ‡§ø‡§≤ ‡§≠‡§æ‡§∞‡§§‡•Ä‡§Ø ‡§ï‡§ø‡§∏‡§æ‡§® ‡§∏‡§Æ‡§®‡•ç‡§µ‡§Ø... 1
5500


5500it [21:08,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§≠‡§ø‡§µ‡§Ç‡§°‡•Ä ‡§Æ‡§®‡§™‡§æ ‡§®‡§ø‡§µ‡§°‡§£‡•Ç‡§ï ‡§ú‡§µ‡§≥ ‡§Ü‡§≤‡•Ä. ‡§®‡§µ‡•Ä‡§® ‡§´‡•á ‡§ï‡§Æ ‡§´‡§æ ‡§ï‡•Ä ‡§∏‡•Å‡§∞‡•Ç! ‡§Æ‡§æ. ‡§Æ‡•Å‡§ñ‡•ç‡§Ø‡§Æ‡§Ç‡§§‡•ç‡§∞‡•Ä ‡§¶‡•á‡§µ‡•á‡§Ç‡§¶‡•ç‡§∞ ‡§´‡§°‡§£‡§µ‡•Ä‡§∏ ‡§Æ‡•ã‡§¶‡•Ä‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§™‡§æ‡§µ‡§≤‡§æ‡§µ‡§∞ ‡§™‡§æ‡§ä‡§≤ ‡§†‡•á‡§µ‡•Ç‡§® ‡§ö‡§æ‡§≤‡§§ ‡§Ü‡§π‡•á‡§§ ‚Äã. ‡§ú‡•à ‡§∏‡§æ ‡§ó‡•Å‡§∞‡•Ç ‡§µ‡•à ‡§∏‡§æ ‡§ö‡•á ‡§≤‡§æ 0
5600


5600it [21:31,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Ø‡§æ ‡§¨‡•à‡§†‡§ï‡•Ä‡§§ ‡§µ‡§æ‡§¶‡§≥‡§æ‡§Æ‡•Å‡§≥‡•á ‡§ù‡§æ‡§≤‡•á‡§≤‡•ç‡§Ø‡§æ ‡§®‡•Å‡§ï‡§∏‡§æ‡§®‡•Ä‡§ö‡§æ ‡§™‡•Å‡§£‡•á ‡§ú‡§ø‡§≤‡•ç‡§π‡•ç‡§Ø‡§æ‡§ö‡§æ ‡§Ü‡§¢‡§æ‡§µ‡§æ ‡§ò‡•á‡§£‡•ç‡§Ø‡§æ‡§§ ‡§Ø‡•á‡§ä‡§® ‡§Æ‡§¶‡§§ ‡§Ü‡§£‡§ø ‡§™‡•Å‡§®‡§∞‡•ç‡§µ‡§∏‡§® ‡§∏‡§Ç‡§¶‡§∞‡•ç‡§≠‡§æ‡§§ ‡§ö‡§∞‡•ç‡§ö‡§æ ‡§ï‡§∞‡§£‡•ç‡§Ø‡§æ‡§§ ‡§Ü‡§≤‡•Ä. ‡§™‡•Å‡§£‡•á ‡§ú‡§ø‡§≤‡•ç‡§π‡•ç‡§Ø‡§æ‡§§‡•Ä‡§≤ ‡§ñ‡§æ‡§∏‡§¶‡§æ‡§∞, ‡§Ü‡§Æ‡§¶‡§æ‡§∞ ‡§µ ‡§Ö‡§ß‡§ø‡§ï‡§æ‡§∞‡•Ä ‡§Ø‡§æ‡§µ‡•á‡§≥‡•Ä ‡§â‡§™‡§∏‡•ç‡§•‡§ø‡§§ ‡§π‡•ã‡§§‡•á. 2 / 2 1
5700


5700it [21:54,  4.35it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ï‡•Å‡§£‡•Ä‡§§‡§∞‡•Ä ‡§Ö‡§∂‡•Ä ‡§™‡§ü‡§æ‡§™‡§ü ‡§ó‡§Ç‡§Æ‡§§ ‡§Ü‡§Æ‡•ç‡§π‡§æ ‡§∏‡§æ‡§Ç‡§ó ‡•Ä‡§≤ ‡§ï‡§æ? ‡§Ø‡§æ ‡§™‡•á‡§ü‡•Ä ‡§Ç‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§¶‡§° ‡§≤‡§Ç‡§Ø ‡§ï‡§æ‡§Ø? ‡§Æ‡•ã‡§¶‡•Ä ‡§™‡•ç‡§∞‡§≠‡•Ç ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§µ‡§ø‡§Æ‡§æ‡§®‡§æ ‡§Ç‡§§‡•Ç‡§® ‡§≠‡§æ‡§ú‡§™‡§æ ‡§Ü‡§£ ‡§§‡§Ç‡§Ø ‡§ï‡§æ‡§Ø? 0
5800


5800it [22:17,  4.36it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§Æ‡•Ä ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡§æ ‡§™‡•Å‡§§‡§£‡•ç‡§Ø‡§æ ‡§Æ‡•ç‡§π‡§£‡•Ç‡§® ‡§ï‡§æ ‡§ï‡§æ‡§Ç‡§ö‡•á ‡§Ü‡§≤‡•á ‡§®‡§æ‡§µ? ‡§Æ‡•ç‡§π‡§£‡•Ç‡§®.. ‡§Æ‡§æ‡§ù‡•ç‡§Ø‡§æ ‡§≤‡•á ‡§ï‡§∞‡§æ‡§Ç‡§®‡§æ ‡§∏‡§æ‡§Ç‡§ó‡§§‡•ã‡§Ø ‡§ó‡§°‡•ç‡§Ø‡§æ ‡§∂‡•á‡§§‡•Ä.. ‡§¨‡§∞‡§æ ‡§Ü‡§™‡§≤‡§æ ‡§ó‡§æ‡§µ ‡§≠‡§æ‡§µ‡•Å‡§ï ‡§¨‡§æ ‡§™‡§æ‡§ö‡§æ ‡§™‡•ã ‡§∞‡§æ‡§≤‡§æ ‡§∏‡§≤‡•ç‡§≤‡§æ! ‡§π‡•á ‡§∏‡§ó‡§≥‡•á ‡§ñ‡§∞‡•á ‡§µ‡§æ‡§ü‡§≤‡•á ‡§§‡§∞‡•Ä‡§π‡•Ä ‡§è‡§ï ‡§∏‡§µ‡§æ‡§≤ ‡§â‡§∞‡§≤‡§æ ‡§†‡•á‡§µ‡•Ä‡§¶‡§æ‡§∞ ‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ ‡§™‡•à‡§∂‡§æ ‡§µ‡§∞ ‡§Æ‡§ó ‡§®‡•á‡§Æ‡§ï‡§æ ‡§ï‡•Å‡§£‡•Ä ‡§Æ‡§æ‡§∞‡§≤‡§æ ‡§°‡§≤‡•ç‡§≤‡§æ? ‡§ú‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•á ‡§™‡•à‡§∏‡•á ‡§¨‡•Å‡§°‡§æ‡§≤‡•á ‡§§‡•ç‡§Ø‡§æ ‡§∏‡§æ‡§Æ‡§æ‡§®‡•ç‡§Ø ‡§Æ‡§æ‡§£‡§∏‡§æ‡§≤‡§æ ‡§™‡§£ ‡§¶‡•ç‡§Ø‡§æ ‡§ï‡•Ä ‡§Ö‡§∏‡§æ‡§ö ‡§è‡§ñ‡§æ‡§¶‡§æ ‡§∏‡§≤‡•ç‡§≤‡§æ! 0
5900


5900it [22:40,  4.36it/s]Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§™‡§§‡•ç‡§∞‡§ï‡§æ‡§∞‡§æ‡§Ç‡§®‡§æ ‡§¨‡§æ‡§ú‡§æ‡§∞ ‡•Ç ‡§Æ‡•ç‡§π‡§£‡§æ‡§≤‡•á ‡§Ü‡§§‡§æ ‡§¶‡•Å‡§ï‡§æ‡§®‡§¶‡§æ‡§∞ ‡§Æ‡•ç‡§π‡§£‡§æ‡§≤‡•á. ‡§≤‡•ã‡§ï‡§∂‡§æ‡§π‡•Ä ‡§ö‡§æ‡§∞ ‡§ö‡•å‡§•‡§æ ‡§∏‡•ç‡§§‡§Ç‡§≠ ‡§π‡•Ä ‡§∏‡•Å‡§ü‡§≤‡§æ ‡§®‡§æ‡§π‡•Ä 0
6000


6057it [23:03,  4.38it/s]
Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


‡§ö‡§ø‡§™‡§≥‡•Ç‡§£ ‡§Ø‡•á‡§•‡•Ä‡§≤ ‡§ß‡§∞‡§£ ‡§´‡•Å‡§ü ‡•Å‡§® ‡§Ö‡§®‡•á‡§ï‡§ú‡§£ ‡§¨‡•á‡§™‡§§‡•ç‡§§‡§æ ‡§ù‡§æ‡§≤‡•ç‡§Ø‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§Ö‡§§‡•ç‡§Ø‡§Ç‡§§ ‡§ï‡•ç‡§≤‡•á‡§∂ ‡§¶‡§æ‡§Ø‡§ï ‡§™‡•ç‡§∞‡§ï‡§æ‡§∞‡§æ‡§ö‡•Ä ‡§â‡§ö‡•ç‡§ö‡§∏‡•ç‡§§‡§∞‡•Ä‡§Ø ‡§ö‡•å‡§ï‡§∂‡•Ä ‡§ù‡§æ‡§≤‡•Ä ‡§™‡§æ‡§π‡§ø‡§ú‡•á. ‡§µ‡§ø‡§≠‡§æ‡§ó‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§Æ‡§Ç‡§§‡•ç‡§∞‡•ç‡§Ø‡§æ‡§®‡•á ‡§®‡•à‡§§‡§ø‡§ï ‡§ú‡§¨‡§æ‡§¨‡§¶‡§æ‡§∞‡•Ä ‡§∏‡•ç‡§µ‡•Ä‡§ï‡§æ‡§∞‡•Ç‡§® ‡§∞‡§æ‡§ú‡•Ä‡§®‡§æ‡§Æ‡§æ ‡§¶‡§ø‡§≤‡§æ ‡§™‡§æ‡§π‡§ø‡§ú‡•á. ‡§π‡§æ‡§ö ‡§§‡•ã ‡§®‡§µ ‡§Æ‡§π‡§æ‡§∞‡§æ‡§∑‡•ç‡§ü‡•ç‡§∞ ‡§ï‡§æ? ‡§ú‡•ç‡§Ø‡§æ ‡§ï‡§∞‡§§‡§æ ‡§™‡•Å‡§®‡•ç‡§π‡§æ ‡§Ø‡•á‡§à‡§® ‡§Æ‡•ç‡§π‡§£‡§§‡§æ. ‡§ú‡§æ‡§π‡•Ä‡§∞ ‡§®‡§ø‡§∑‡•á‡§ß! 0


In [22]:
len(final)

12501

In [23]:
len(goed_test[0])

12501

In [28]:
y=goed_test[1].reset_index(drop=True)

In [29]:
x=goed_test[0].reset_index(drop=True)

In [30]:
len(test_dataset[0])

6056

In [31]:
kai=pd.DataFrame({'label':y,'original':x,'generated':final})    

In [32]:
kai.to_csv("Approach2_preds.csv")

In [33]:
len(goed_test[0])

12501

In [20]:
preds=pd.read_csv('/kaggle/input/goemotions/Predictions2.csv')

In [21]:
preds

Unnamed: 0.1,Unnamed: 0,original_text,predicted_text
0,0,‡§Æ‡•Ä ‡§Ü‡§ß‡•Ä ‡§ï‡•á‡§≤‡•á ‡§Ü‡§π‡•á.,‡§Æ‡•Ä ‡§Ü‡§ß‡•Ä ‡§ï‡•á‡§≤‡•á ‡§Ü‡§π‡•á. 1
1,1,‡§ï‡•Ç‡§≤-‡§è‡§° ‡§™‡•ç‡§Ø‡§æ! ‡§Æ‡•ã‡§†‡•ç‡§Ø‡§æ‡§®‡•á ‡§π‡§∏‡§£‡•á,‡§ï‡•Ç‡§≤ - ‡§è‡§° ‡§™‡•ç‡§Ø‡§æ! ‡§Æ‡•ã‡§†‡•ç‡§Ø‡§æ‡§®‡•á ‡§π‡§∏ ‡§£‡•á 1
2,2,‡§§‡§∞‡•Ä‡§π‡•Ä ‡§§‡•á ‡§≤‡§π‡§æ‡§® ‡§®‡§æ‡§π‡•Ä‡§§. ‡§π‡•â‡§≤‡•Ä‡§µ‡•Ç‡§°‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§Ö‡§∏‡§æ ‡§ï‡•ã‡§£‡§§‡§æ‡§π‡•Ä ...,‡§§‡§∞‡•Ä‡§π‡•Ä ‡§§‡•á ‡§≤‡§π‡§æ‡§® ‡§®‡§æ‡§π‡•Ä‡§§. ‡§π‡•â‡§≤‡•Ä‡§µ‡•Ç‡§° ‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§Ö‡§∏‡§æ ‡§ï‡•ã‡§£‡§§‡§æ‡§π‡•Ä...
3,3,"‡§ñ‡•Ç‡§™ ‡§ñ‡•Ç‡§™ ‡§ß‡§®‡•ç‡§Ø‡§µ‡§æ‡§¶, ‡§Æ‡•Ä ‡§Ö‡§≠‡§ø‡§™‡•ç‡§∞‡§æ‡§Ø‡§æ‡§ö‡•Ä ‡§™‡•ç‡§∞‡§∂‡§Ç‡§∏‡§æ ‡§ï‡§∞‡§§‡•ã ‡§Ü...","‡§ñ‡•Ç‡§™ ‡§ñ‡•Ç‡§™ ‡§ß‡§®‡•ç‡§Ø‡§µ‡§æ‡§¶, ‡§Æ‡•Ä ‡§Ö‡§≠‡§ø‡§™‡•ç‡§∞‡§æ ‡§Ø‡§æ‡§ö‡•Ä ‡§™‡•ç‡§∞‡§∂‡§Ç‡§∏‡§æ ‡§ï‡§∞‡§§‡•ã ..."
4,4,‡§®‡§µ‡•Ä‡§® ‡§ï‡§æ‡§π‡•Ä ‡§ò‡§°‡§§ ‡§®‡§æ‡§π‡•Ä. ‡§∏‡§Æ‡§æ‡§ú‡§æ‡§®‡•á ‡§ï‡§ß‡•Ä‡§ö ‡§§‡•Å‡§ü‡§≤‡•á‡§≤‡•ç‡§Ø‡§æ ‡§Æ‡§æ‡§£...,‡§®‡§µ‡•Ä‡§® ‡§ï‡§æ‡§π‡•Ä ‡§ò‡§°‡§§ ‡§®‡§æ‡§π‡•Ä. ‡§∏‡§Æ‡§æ‡§ú‡§æ‡§®‡•á ‡§ï‡§ß‡•Ä‡§ö ‡§§‡•Å‡§ü‡§≤‡•á‡§≤‡•ç‡§Ø‡§æ ‡§Æ‡§æ‡§£...
...,...,...,...
14295,14295,No the whippet sound is WUBWUBWUBWUBWUBWUBWUBW...,No the w hi pp et s ound is W U B W U B W U B ...
14296,14296,"‡§™‡§£ ‡§Ö‡§π‡•ã, ‡§®‡§ø‡§¶‡§æ‡§® ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ‡§∂‡•Ä ‡§∏‡§Ç‡§™‡§∞‡•ç‡§ï ‡§∏‡§æ‡§ß‡§£‡•ç‡§Ø‡§æ‡§ö‡§æ ‡§§‡•ç‡§∞...","‡§™‡§£ ‡§Ö‡§π‡•ã, ‡§®‡§ø‡§¶‡§æ‡§® ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ‡§∂‡•Ä ‡§∏‡§Ç‡§™‡§∞‡•ç‡§ï ‡§∏‡§æ‡§ß‡§£‡•ç‡§Ø‡§æ‡§ö‡§æ ‡§§‡•ç‡§∞..."
14297,14297,‡§ï‡•ã‡§£‡•Ä‡§§‡§∞‡•Ä ‡§°‡§ø‡§∏‡•ç‡§®‡•á‡§≤‡§æ ‡§∏‡§æ‡§Ç‡§ó‡§æ. ‡§¶‡•Å‡§∑‡•ç‡§ü ‡§Æ‡§æ‡§ä‡§∏‡§®‡•á ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•ç‡§Ø‡§æ...,‡§ï‡•ã‡§£‡•Ä‡§§‡§∞‡•Ä ‡§°‡§ø‡§∏‡•ç ‡§®‡•á‡§≤‡§æ ‡§∏‡§æ‡§Ç‡§ó‡§æ. ‡§¶‡•Å‡§∑‡•ç‡§ü ‡§Æ‡§æ‡§ä‡§∏ ‡§®‡•á ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§ö‡•ç...
14298,14298,‡§®‡•ç‡§Ø‡§æ‡§Ø‡•ç‡§Ø ‡§µ‡§æ‡§ü‡§§‡•á. ‡§µ‡§∞‡•ç‡§ö‡§∏‡•ç‡§µ ‡§™‡•Å‡§∞‡•á‡§∏‡•á ‡§Æ‡•ã‡§†‡•á ‡§π‡•ã‡§§‡•á. ‡§ñ‡§∞‡§Ç ‡§§...,‡§®‡•ç‡§Ø‡§æ‡§Ø‡•ç‡§Ø ‡§µ‡§æ‡§ü‡§§‡•á. ‡§µ‡§∞‡•ç‡§ö‡§∏‡•ç‡§µ ‡§™‡•Å‡§∞‡•á‡§∏‡•á ‡§Æ‡•ã‡§†‡•á ‡§π‡•ã‡§§‡•á. ‡§ñ‡§∞‡§Ç ‡§§...


In [23]:
new_text=list(preds['original_text'])+original_text

In [26]:
len(new_pred_text)

25002

In [25]:
new_pred_text=list(preds['predicted_text'])+final

In [None]:
# pd.read_csv('')

In [27]:
kai=pd.DataFrame({"original_text":new_text,"predicted_text":new_pred_text})
kai.to_csv("Predictions3.csv")

In [None]:
df1 = pd.DataFrame({
    'original_text':original_text,
    'original_label':original_label,
    'predicted_label': predicted_label,
    'predicted_text': final
})
df1.to_csv('myCsv.csv', index=False)

In [35]:
ll=[]
gg=[]
for i in range(len(new_pred_text)):
    try:
        ll.append(int(new_pred_text[i].split()[-1]))
        gg.append(new_text[i])
    except:
        print(new_pred_text[i])

‡§π‡•ã‡§Ø, ‡§Æ‡•Ä ‡§Æ‡•ç‡§π‡§£‡§æ‡§Ø‡§≤‡§æ ‡§π‡§µ‡•á ‡§π‡•ã‡§§‡•á'‡§§‡•á ‡§â‡§™‡§∞‡•ã‡§ß‡§ø‡§ï ‡§®‡§æ‡§π‡•Ä ‡§ï‡§æ'0
' ‡§Æ‡§æ‡§ù‡•Ä ‡§¶‡•á‡§µ‡•Ä ‡§§‡•Å‡§∞‡•Å‡§Ç‡§ó‡§æ‡§§ ‡§ó‡•á‡§≤‡•Ä ‡§Ü‡§£‡§ø ‡§Æ‡§≤‡§æ ‡§´‡§ï‡•ç‡§§ ‡§π‡§æ ‡§≠‡§°‡§ï ‡§ü‡•Ä - ‡§∂‡§∞‡•ç‡§ü ‡§Æ‡§ø‡§≥‡§æ‡§≤‡§æ'0
‡§§‡•á ‡§§‡•Å‡§Æ‡§ö‡•ç‡§Ø‡§æ‡§∏‡§æ‡§†‡•Ä [ N AM E ] ‡§Ü‡§π‡•á'1
‡§ú‡§∞ ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡•Ä ‡§Ö‡§∏‡•á ‡§ï‡•á‡§≤‡•á ‡§§‡§∞ ‡§§‡•á ‡§≤‡•Å ‡§∞‡•ç ‡§ï‡§∞‡•ç‡§∏ ‡§≤‡•Å ‡§∞‡•ç ‡§ï‡§ø‡§® ‡§®‡§∏‡§§‡•Ä‡§≤'0
‡§µ‡§ø‡§∏‡•ç‡§Æ‡§Ø ‡§ï‡§æ‡§∞‡§ï ‡§Æ‡§æ‡§£‡•Ç‡§∏ ‡§ß‡§®‡•ç‡§Ø‡§µ‡§æ‡§¶ ‚ô• Ô∏è ‚ô• Ô∏è 2 ‡§Æ‡§æ‡§∞‡•ç‡§ó ‡§∂‡•Ä‡§∞‡•ç‡§∑
‡§§‡•ã ‡§Æ‡•ç‡§π‡§£‡§æ‡§≤‡§æ ‡§ï‡•Ä ‡§ú‡•á ‡§¨‡§≥‡•Ä ‡§µ‡§æ‡§ö‡§≤‡•á ‡§§‡•ç‡§Ø‡§æ‡§Ç‡§®‡•Ä " ‡§è‡§ï‡§æ ‡§ú‡§æ‡§° ‡§Æ‡§æ‡§£‡§∏‡§æ‡§≤‡§æ ‡§®‡•á‡§Æ ‡§¨‡§æ ‡§ú‡§æ‡§ö‡•ç‡§Ø‡§æ ‡§∏‡§Æ‡•ã‡§∞ ‡§¢‡§ï‡§≤‡§≤‡•á " ‡§π‡•ã‡§Ø ‡§§‡•á ‡§ñ‡§∞‡•ã‡§ñ‡§∞‡§ö'‡§µ‡§æ‡§à‡§ü ‡§ï‡§≤‡•ç‡§™‡§®‡§æ ‡§Ç‡§ö‡•Ä ‡§ö‡•á‡§∑‡•ç‡§ü‡§æ ‡§ï‡§∞‡§§ ‡§Ü‡§π‡•á'0
‡§Æ‡§æ‡§ù‡•á ‡§¨‡§æ‡§Ø‡•ã ‡§ñ‡•Ç‡§™‡§ö ‡§Æ‡§ú‡•á‡§¶‡§æ‡§∞ ‡§Ü‡§π‡•á... ‡§Æ‡§≤‡§æ ‡§Æ

In [36]:
gg[:5]

['‡§Æ‡•Ä ‡§Ü‡§ß‡•Ä ‡§ï‡•á‡§≤‡•á ‡§Ü‡§π‡•á.',
 '‡§ï‡•Ç‡§≤-‡§è‡§° ‡§™‡•ç‡§Ø‡§æ! ‡§Æ‡•ã‡§†‡•ç‡§Ø‡§æ‡§®‡•á ‡§π‡§∏‡§£‡•á',
 "‡§§‡§∞‡•Ä‡§π‡•Ä ‡§§‡•á ‡§≤‡§π‡§æ‡§® ‡§®‡§æ‡§π‡•Ä‡§§. ‡§π‡•â‡§≤‡•Ä‡§µ‡•Ç‡§°‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§Ö‡§∏‡§æ ‡§ï‡•ã‡§£‡§§‡§æ‡§π‡•Ä ‡§π‡•â‡§ü 5'4 ‡§Æ‡§æ‡§£‡•Ç‡§∏ ‡§®‡§æ‡§π‡•Ä ‡§ú‡•ç‡§Ø‡§æ‡§∏‡§æ‡§†‡•Ä ‡§¨‡§π‡•Å‡§§‡•á‡§ï ‡§∏‡•ç‡§§‡•ç‡§∞‡§ø‡§Ø‡§æ ‡§π‡§∏‡§§‡•Ä‡§≤.",
 '‡§ñ‡•Ç‡§™ ‡§ñ‡•Ç‡§™ ‡§ß‡§®‡•ç‡§Ø‡§µ‡§æ‡§¶, ‡§Æ‡•Ä ‡§Ö‡§≠‡§ø‡§™‡•ç‡§∞‡§æ‡§Ø‡§æ‡§ö‡•Ä ‡§™‡•ç‡§∞‡§∂‡§Ç‡§∏‡§æ ‡§ï‡§∞‡§§‡•ã ‡§Ü‡§£‡§ø ‡§§‡•ã ‡§Æ‡§æ‡§∞‡•ç‡§ó‡§æ‡§§ ‡§™‡§æ‡§†‡§µ‡•Ä‡§®.',
 '‡§®‡§µ‡•Ä‡§® ‡§ï‡§æ‡§π‡•Ä ‡§ò‡§°‡§§ ‡§®‡§æ‡§π‡•Ä. ‡§∏‡§Æ‡§æ‡§ú‡§æ‡§®‡•á ‡§ï‡§ß‡•Ä‡§ö ‡§§‡•Å‡§ü‡§≤‡•á‡§≤‡•ç‡§Ø‡§æ ‡§Æ‡§æ‡§£‡§∏‡§æ‡§Ç‡§¨‡§¶‡•ç‡§¶‡§≤ ‡§≠‡§æ‡§® ‡§¶‡§ø‡§≤‡•á ‡§®‡§æ‡§π‡•Ä. ‡§§‡•ç‡§Ø‡§æ‡§Æ‡•Å‡§≥‡•á ‡§§‡•á ‡§®‡•à‡§∏‡§∞‡•ç‡§ó‡§ø‡§ï ‡§Ü‡§π‡•á.']

In [34]:
new_text[:5]

['‡§Æ‡•Ä ‡§Ü‡§ß‡•Ä ‡§ï‡•á‡§≤‡•á ‡§Ü‡§π‡•á.',
 '‡§ï‡•Ç‡§≤-‡§è‡§° ‡§™‡•ç‡§Ø‡§æ! ‡§Æ‡•ã‡§†‡•ç‡§Ø‡§æ‡§®‡•á ‡§π‡§∏‡§£‡•á',
 "‡§§‡§∞‡•Ä‡§π‡•Ä ‡§§‡•á ‡§≤‡§π‡§æ‡§® ‡§®‡§æ‡§π‡•Ä‡§§. ‡§π‡•â‡§≤‡•Ä‡§µ‡•Ç‡§°‡§Æ‡§ß‡•ç‡§Ø‡•á ‡§Ö‡§∏‡§æ ‡§ï‡•ã‡§£‡§§‡§æ‡§π‡•Ä ‡§π‡•â‡§ü 5'4 ‡§Æ‡§æ‡§£‡•Ç‡§∏ ‡§®‡§æ‡§π‡•Ä ‡§ú‡•ç‡§Ø‡§æ‡§∏‡§æ‡§†‡•Ä ‡§¨‡§π‡•Å‡§§‡•á‡§ï ‡§∏‡•ç‡§§‡•ç‡§∞‡§ø‡§Ø‡§æ ‡§π‡§∏‡§§‡•Ä‡§≤.",
 '‡§ñ‡•Ç‡§™ ‡§ñ‡•Ç‡§™ ‡§ß‡§®‡•ç‡§Ø‡§µ‡§æ‡§¶, ‡§Æ‡•Ä ‡§Ö‡§≠‡§ø‡§™‡•ç‡§∞‡§æ‡§Ø‡§æ‡§ö‡•Ä ‡§™‡•ç‡§∞‡§∂‡§Ç‡§∏‡§æ ‡§ï‡§∞‡§§‡•ã ‡§Ü‡§£‡§ø ‡§§‡•ã ‡§Æ‡§æ‡§∞‡•ç‡§ó‡§æ‡§§ ‡§™‡§æ‡§†‡§µ‡•Ä‡§®.',
 '‡§®‡§µ‡•Ä‡§® ‡§ï‡§æ‡§π‡•Ä ‡§ò‡§°‡§§ ‡§®‡§æ‡§π‡•Ä. ‡§∏‡§Æ‡§æ‡§ú‡§æ‡§®‡•á ‡§ï‡§ß‡•Ä‡§ö ‡§§‡•Å‡§ü‡§≤‡•á‡§≤‡•ç‡§Ø‡§æ ‡§Æ‡§æ‡§£‡§∏‡§æ‡§Ç‡§¨‡§¶‡•ç‡§¶‡§≤ ‡§≠‡§æ‡§® ‡§¶‡§ø‡§≤‡•á ‡§®‡§æ‡§π‡•Ä. ‡§§‡•ç‡§Ø‡§æ‡§Æ‡•Å‡§≥‡•á ‡§§‡•á ‡§®‡•à‡§∏‡§∞‡•ç‡§ó‡§ø‡§ï ‡§Ü‡§π‡•á.']

In [37]:
kai=pd.DataFrame({"tweet":gg,"label":ll})
kai.to_csv("GoEmotions_pred.csv")

In [None]:
df1 = pd.DataFrame({
    'original_text':original_text,
    'original_label':original_label,
    'predicted_label': predicted_label,
    'predicted_text': predicted_text
})

In [None]:
df1.to_csv('myCsv.csv', index=False)

In [None]:
# prepare and load dataset
valid_dataset = load_goed_sentiment_dataset(tokenizer)

In [27]:
# prompt = '<startoftext>'+goed_test[0][3]+'<sep>'
#   # generate tokens
# generated = tokenizer(f"{prompt}", return_tensors="pt").input_ids.cuda()
#   # perform prediction
# sample_outputs = model.generate(generated, do_sample=False, top_k=50, 
#                                   max_length=512, top_p=0.9, temperature=0, 
#                                   num_return_sequences=0)
#   # decode the predicted tokens into texts
# pred_text = tokenizer.decode(sample_outputs[0], skip_special_tokens=True)
# pred_text

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


## Step 2) Training BERT

In [None]:
!pip install transformers
!wandb off
import torch
from torch.utils.data import Dataset
import pandas as pd
from sklearn.model_selection import train_test_split
import transformers
from transformers import GPT2Tokenizer, GPT2LMHeadModel

In [None]:
tt=pd.read_csv("/kaggle/input/mahasent/tweets-valid.csv")
import re
tts=[]
for i in tt["tweet"]:
  i= re.sub(r"http\S+", "", i)
  i= re.sub(r"pic\S+", "", i)
  i= re.sub(r"#\S+", "", i)
  i= re.sub(r"lokmat\S+", "", i)
  i= re.sub(r"@\S+", "", i)
  i= re.sub(r"fb\S+", "", i)
  i= re.sub(r"twitter\S+", "", i)
  i= re.sub(r"bit\S+", "", i)
  i=i.strip()
  tts.append(i)
tt["tweet"]=tts
tt.to_csv("tweets-valid.csv",index=False)

In [None]:
tt=pd.read_csv("/kaggle/input/mahasent/tweets-test.csv")
import re
tts=[]
for i in tt["tweet"]:
  i= re.sub(r"http\S+", "", i)
  i= re.sub(r"pic\S+", "", i)
  i= re.sub(r"#\S+", "", i)
  i= re.sub(r"lokmat\S+", "", i)
  i= re.sub(r"@\S+", "", i)
  i= re.sub(r"fb\S+", "", i)
  i= re.sub(r"twitter\S+", "", i)
  i= re.sub(r"bit\S+", "", i)
  i=i.strip()
  tts.append(i)
tt["tweet"]=tts
tt.to_csv("tweets-test.csv",index=False)

In [None]:
tt=pd.read_csv("/kaggle/input/bedata/MahaSent/mahasent_train_new_part1.csv")
import re
tts=[]
for i in tt["tweet"]:
  i= re.sub(r"http\S+", "", i)
  i= re.sub(r"pic\S+", "", i)
  i= re.sub(r"#\S+", "", i)
  i= re.sub(r"lokmat\S+", "", i)
  i= re.sub(r"@\S+", "", i)
  i= re.sub(r"fb\S+", "", i)
  i= re.sub(r"twitter\S+", "", i)
  i= re.sub(r"bit\S+", "", i)
  i=i.strip()
  tts.append(i)
tt["tweet"]=tts
tt.to_csv("MahaSent.csv")

In [None]:
from numpy.random import seed
seed(1)
import tensorflow as tf
tf.random.set_seed(2)
import pandas as pd
import numpy as np
from numpy import array
import sklearn
!pip install simpletransformers

In [None]:
import pandas as pd
train_df=pd.read_csv("/kaggle/working/MahaSent.csv")
gen=pd.read_csv("/kaggle/input/bedata/Output_one_dash.csv")
valid_df=pd.read_csv("/kaggle/working/tweets-valid.csv")
test_df=pd.read_csv("/kaggle/working/tweets-test.csv")

In [None]:
train_df=train_df.iloc[:,2:]
gen=pd.DataFrame({'label':gen['label'],'tweet':gen['generated']})
tweet=[]
label=[]
for i in range(len(gen['tweet'])):
    dic={}
    for j in gen['tweet'][i].split():
        dic[j]=0
    for j in gen['tweet'][i].split():
        dic[j]+=1
#     dic=sorted(dic)
    if dic[max(dic,key=dic.get)]<7:
        tweet.append(gen['tweet'][i])
        label.append(gen['label'][i])
gen=pd.DataFrame({'label':label,'tweet':tweet})
train_df=pd.concat([train_df,gen]).reset_index(drop=True)

In [None]:
train_df['label'] = train_df['label'].replace(1,2)
test_df['label'] = test_df['label'].replace(1,2)
valid_df['label'] = valid_df['label'].replace(1,2)

train_df['label'] = train_df['label'].replace(0,1)
test_df['label'] = test_df['label'].replace(0,1)
valid_df['label'] = valid_df['label'].replace(0,1)

train_df['label'] = train_df['label'].replace(-1,0)
test_df['label'] = test_df['label'].replace(-1,0)
valid_df['label'] = valid_df['label'].replace(-1,0)

In [None]:
%mkdir new_data
%cd new_data
train_df.to_csv('tweets-train.csv')
test_df.to_csv('tweets-test.csv')
valid_df.to_csv('tweets-valid.csv')
%cd ..

In [None]:
!pip install --no-cache-dir transformers sentencepiece
!pip install datasets

In [None]:
from datasets import load_dataset
data_files={"train":"tweets-train.csv","test":"tweets-test.csv","validation":"tweets-valid.csv"}
dataset = load_dataset('new_data',data_files=data_files)
import numpy as np
from datasets import load_metric
metric = load_metric("accuracy")
from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("l3cube-pune/marathi-bert-v2")

def tokenize_function(examples):
    return tokenizer(examples["tweet"], padding="max_length", truncation=True)

tokenized_datasets = dataset.map(tokenize_function, batched=True)

from transformers import AutoModelForSequenceClassification

model = AutoModelForSequenceClassification.from_pretrained("l3cube-pune/marathi-bert-v2", num_labels=3)

from transformers import TrainingArguments

training_args = TrainingArguments(output_dir="test_trainer")

def compute_metrics(eval_pred):
    logits, labels = eval_pred
    predictions = np.argmax(logits, axis=-1)
    return metric.compute(predictions=predictions, references=labels)

In [None]:
from transformers import TrainingArguments, Trainer

training_args = TrainingArguments(output_dir="test_trainer", evaluation_strategy="epoch",num_train_epochs=3)

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tokenized_datasets["train"],
    eval_dataset=tokenized_datasets["validation"],
    compute_metrics=compute_metrics,
)
trainer.train()

In [None]:
predictions = trainer.predict(tokenized_datasets["validation"])
preds = np.argmax(predictions.predictions, axis=-1)
metric.compute(predictions=preds, references=predictions.label_ids)

In [None]:
predictions = trainer.predict(tokenized_datasets["test"])
preds = np.argmax(predictions.predictions, axis=-1)
metric.compute(predictions=preds, references=predictions.label_ids)

In [None]:
import pandas as pd
goe_valid_df=pd.read_csv("/kaggle/input/goemotions/goemotions_subset_val_new.csv")
goe_test_df=pd.read_csv("/kaggle/input/goemotions/goemotions_subset_test_new.csv")
goe_test_df=goe_test_df.iloc[:,3:]
goe_valid_df=goe_valid_df.iloc[:,3:]
goe_test_df=pd.DataFrame({'label':goe_test_df['three_point'],'tweet':goe_test_df['marathi_text']})
goe_valid_df=pd.DataFrame({'label':goe_valid_df['three_point'],'tweet':goe_valid_df['marathi_text']})

In [None]:
tt=goe_test_df.iloc[:,:]
import re
tts=[]
for i in tt["tweet"]:
  i= re.sub(r"http\S+", "", i)
  i= re.sub(r"pic\S+", "", i)
  i= re.sub(r"#\S+", "", i)
  i= re.sub(r"lokmat\S+", "", i)
  i= re.sub(r"@\S+", "", i)
  i= re.sub(r"fb\S+", "", i)
  i= re.sub(r"twitter\S+", "", i)
  i= re.sub(r"bit\S+", "", i)
  i=re.sub(r"\[NAME]+", "", i)
  i=re.sub(r"\[‡§®‡§æ‡§Æ]+", "",i)
  i=i.strip()
  tts.append(i)
tt["tweet"]=tts
tt.to_csv("goed_test.csv")

In [None]:
tt=goe_valid_df.iloc[:,:]
import re
tts=[]
for i in tt["tweet"]:
  i= re.sub(r"http\S+", "", i)
  i= re.sub(r"pic\S+", "", i)
  i= re.sub(r"#\S+", "", i)
  i= re.sub(r"lokmat\S+", "", i)
  i= re.sub(r"@\S+", "", i)
  i= re.sub(r"fb\S+", "", i)
  i= re.sub(r"twitter\S+", "", i)
  i= re.sub(r"bit\S+", "", i)
  i=re.sub(r"\[NAME]+", "", i)
  i=re.sub(r"\[‡§®‡§æ‡§Æ]+", "",i)
  i=i.strip()
  tts.append(i)
tt["tweet"]=tts
tt.to_csv("goed_valid.csv")

In [None]:
goe_valid_df=pd.read_csv("goed_valid.csv")
goe_test_df=pd.read_csv("goed_test.csv")

In [None]:
goe_test_df=goe_test_df.iloc[:,1:]
goe_valid_df=goe_valid_df.iloc[:,1:]
goe_test_df=goe_test_df.drop(4294).reset_index(drop=True)
goe_valid_df=goe_valid_df.drop(1742).reset_index(drop=True)
# train_df['label'] = train_df['label'].replace(1,2)
goe_test_df['label'] = goe_test_df['label'].replace(1,2)
goe_valid_df['label'] = goe_valid_df['label'].replace(1,2)

# train_df['label'] = train_df['label'].replace(0,1)
goe_test_df['label'] = goe_test_df['label'].replace(0,1)
goe_valid_df['label'] = goe_valid_df['label'].replace(0,1)

# train_df['label'] = train_df['label'].replace(-1,0)
goe_test_df['label'] = goe_test_df['label'].replace(-1,0)
goe_valid_df['label'] = goe_valid_df['label'].replace(-1,0)

In [None]:
%mkdir new_data2
%cd new_data2
# train_df.to_csv('tweets-train.csv')
goe_test_df.to_csv('tweets-test.csv')
goe_valid_df.to_csv('tweets-valid.csv')
%cd ..

In [None]:
from datasets import load_dataset
data_files={"test":"tweets-test.csv","validation":"tweets-valid.csv"}
dataset2 = load_dataset('new_data2',data_files=data_files)

def tokenize_function(examples):
    return tokenizer(examples["tweet"], padding="max_length", truncation=True)

tokenized_datasets2 = dataset2.map(tokenize_function, batched=True)


In [None]:
predictions = trainer.predict(tokenized_datasets2["validation"])
preds = np.argmax(predictions.predictions, axis=-1)
metric.compute(predictions=preds, references=predictions.label_ids)

In [None]:
predictions = trainer.predict(tokenized_datasets2["test"])
preds = np.argmax(predictions.predictions, axis=-1)
metric.compute(predictions=preds, references=predictions.label_ids)