<a href="https://colab.research.google.com/github/MiladPezeshkian/GrandMasterGuide/blob/main/Untitled0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [6]:
!pip install transformers torch sentencepiece accelerate bitsandbytes -q

In [9]:
import torch
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, pipeline

SEED = 42
torch.manual_seed(SEED)
if torch.cuda.is_available():
    torch.cuda.manual_seed_all(SEED)

DEVICE = 0 if torch.cuda.is_available() else -1
DTYPE = torch.float16 if torch.cuda.is_available() else torch.float32
print(f"Using DEVICE={DEVICE}, DTYPE={DTYPE}")

# مدل‌های خلاصه‌سازی (انتخاب یک مدل کم‌وزن)
SUMMARIZATION_MODEL_IDS = [
    "google/mt5-base", # A relatively smaller base model
]

summ_pipelines = {}
for mid in SUMMARIZATION_MODEL_IDS:
    print(f"Loading summarization model: {mid}")
    tok = AutoTokenizer.from_pretrained(mid)
    mdl = AutoModelForSeq2SeqLM.from_pretrained(mid, torch_dtype=DTYPE, device_map="auto")
    pipe = pipeline("summarization", model=mdl, tokenizer=tok)
    summ_pipelines[mid] = pipe

# مدل‌های ترجمه (انتخاب یک مدل کم‌وزن)
TRANSLATION_MODEL_IDS = [
    "facebook/m2m100_418M", # The smaller of the original translation models
]

translation_pipelines = {}
for mid in TRANSLATION_MODEL_IDS:
    print(f"Loading translation model: {mid}")
    tok = AutoTokenizer.from_pretrained(mid)
    mdl = AutoModelForSeq2SeqLM.from_pretrained(mid, torch_dtype=DTYPE, device_map="auto")
    pipe = pipeline("translation", model=mdl, tokenizer=tok)
    translation_pipelines[mid] = pipe

print("Loaded all models successfully.")

Using DEVICE=0, DTYPE=torch.float16
Loading summarization model: google/mt5-base


Device set to use cuda:0


Loading translation model: facebook/m2m100_418M


Device set to use cuda:0


Loaded all models successfully.


In [10]:
persian_dialogue = """
علی: سلام، داداش! چطوری؟
محمد: سلام علی! خوبم، تو چطوری؟
علی: منم خوبم. این هفته قرار هست بریم فوتبال؟
محمد: آره، می‌خوام برم. ساعت چند؟ تو پارک محل. بیا با هم بریم.
علی: ساعت ۵. اوکی، منتظرتم می‌مونم.
علی: بعد بازی می‌خوای بریم بستنی؟
محمد: آره، خیلی خوب می‌شه!
علی: پس شنبه همدیگه رو می‌بینیم.
محمد: حتماً، خداحافظ!
"""

In [11]:
for model_id, pipe in summ_pipelines.items():
    print(f"\n--- خلاصه با مدل {model_id} ---")
    if "summarization" in pipe.task:
        summary = pipe(persian_dialogue, max_length=50, min_length=10)[0]['summary_text']
    else:
        prompt = "خلاصه کن گفتگوی زیر به فارسی: " + persian_dialogue
        summary = pipe(prompt, max_length=50)[0]['generated_text']
    print(summary)


--- خلاصه با مدل google/mt5-base ---


Both `max_new_tokens` (=256) and `max_length`(=50) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


<extra_id_0>! خوبم، خداحافظ!


In [12]:
for model_id, pipe in translation_pipelines.items():
    print(f"\n--- ترجمه با مدل {model_id} ---")
    tok = pipe.tokenizer
    mdl = pipe.model

    if "m2m100" in model_id:
        tok.src_lang = "fa"
        inputs = tok(persian_dialogue, return_tensors="pt").to(mdl.device)
        generated = mdl.generate(**inputs, forced_bos_token_id=tok.get_lang_id("en"), max_length=200)
        translation = tok.batch_decode(generated, skip_special_tokens=True)[0]
    elif "nllb" in model_id:
        tok.src_lang = "fas_Arab"
        inputs = tok(persian_dialogue, return_tensors="pt").to(mdl.device)
        generated = mdl.generate(**inputs, forced_bos_token_id=tok.lang_code_to_id["eng_Latn"], max_length=200)
        translation = tok.batch_decode(generated, skip_special_tokens=True)[0]
    else:
        translation = pipe(persian_dialogue)[0]['translation_text']

    print(translation)


--- ترجمه با مدل facebook/m2m100_418M ---
Ali: Hello, brother! how do you? Muhammad: Hello Ali! well, how do you? Ali: I'm well. this week we're going to football? Muhammad: yes, I'm going to go. at how much? at the park place. come together. Ali: at 5 a. Okay, I'm waiting for you. Ali: then you're going to ice cream? Muhammad: yes, it's going very well. Ali: then Saturday we'll see each other. Muhammad: definitely, goodbye!


In [13]:
from transformers import BitsAndBytesConfig

quant_config = BitsAndBytesConfig(load_in_4bit=True)
model_id = "mistralai/Mistral-7B-Instruct-v0.3"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=quant_config, device_map="auto")
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)

# خلاصه
prompt_summ = f"[INST] خلاصه کن گفتگوی زیر به فارسی: {persian_dialogue} [/INST]"
output_summ = pipe(prompt_summ, max_new_tokens=100)[0]['generated_text']
print("\n--- خلاصه با Mistral ---")
print(output_summ)

# ترجمه
prompt_trans = f"[INST] ترجمه کن گفتگوی زیر به انگلیسی: {persian_dialogue} [/INST]"
output_trans = pipe(prompt_trans, max_new_tokens=200)[0]['generated_text']
print("\n--- ترجمه با Mistral ---")
print(output_trans)

tokenizer_config.json: 0.00B [00:00, ?B/s]

tokenizer.model:   0%|          | 0.00/587k [00:00<?, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/414 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/601 [00:00<?, ?B/s]

model.safetensors.index.json: 0.00B [00:00, ?B/s]

Fetching 3 files:   0%|          | 0/3 [00:00<?, ?it/s]

model-00001-of-00003.safetensors:   0%|          | 0.00/4.95G [00:00<?, ?B/s]

model-00002-of-00003.safetensors:   0%|          | 0.00/5.00G [00:00<?, ?B/s]

model-00003-of-00003.safetensors:   0%|          | 0.00/4.55G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

Device set to use cuda:0
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



--- خلاصه با Mistral ---
[INST] خلاصه کن گفتگوی زیر به فارسی: 
علی: سلام، داداش! چطوری؟
محمد: سلام علی! خوبم، تو چطوری؟
علی: منم خوبم. این هفته قرار هست بریم فوتبال؟
محمد: آره، می‌خوام برم. ساعت چند؟ تو پارک محل. بیا با هم بریم.
علی: ساعت ۵. اوکی، منتظرتم می‌مونم.
علی: بعد بازی می‌خوای بریم بستنی؟
محمد: آره، خیلی خوب می‌شه!
علی: پس شنبه همدیگه رو می‌بینیم.
محمد: حتماً، خداحافظ!
 [/INST] علی: سلام، محمد بلاقبل! تو خوبه؟
محمد: سلام علی، خوب شما؟
علی: خوبم. هفته اینجا قرار هست بریم فوتبال؟

--- ترجمه با Mistral ---
[INST] ترجمه کن گفتگوی زیر به انگلیسی: 
علی: سلام، داداش! چطوری؟
محمد: سلام علی! خوبم، تو چطوری؟
علی: منم خوبم. این هفته قرار هست بریم فوتبال؟
محمد: آره، می‌خوام برم. ساعت چند؟ تو پارک محل. بیا با هم بریم.
علی: ساعت ۵. اوکی، منتظرتم می‌مونم.
علی: بعد بازی می‌خوای بریم بستنی؟
محمد: آره، خیلی خوب می‌شه!
علی: پس شنبه همدیگه رو می‌بینیم.
محمد: حتماً، خداحافظ!
 [/INST] Ali: Peace be upon you, Dadash! How are you?
Muhammad: Peace be upon you, Ali! I'm good, and you?
Ali: I'm good. T