In [1]:
from transformers import pipeline, T5ForConditionalGeneration, T5Tokenizer

In [2]:
# Parameters
model_name = "t5-sl-small_05-07T15:26"
tokenizer_type = "cjvt/t5-sl-small" # original tokenizer
device = "cuda"

model_loc = "/d/hpc/projects/FRI/team9/models/" + model_name

model = T5ForConditionalGeneration.from_pretrained(model_loc, local_files_only=True)
model = model.to(device)
tokenizer = T5Tokenizer.from_pretrained(tokenizer_type)
paraphraser = pipeline(
    "text2text-generation",
    model=model,
    tokenizer=tokenizer,
    framework="pt",
    max_length=512,
    device=0 # means cuda:0
)

In [3]:
sample_phrases = [
    "Najbolj je upadla prodaja v segmentu domačih uporabnikov, ki se je skrčil za 65 odstotkov.",
    "Applova ponudba varčevalnega računa s 4,15-odstotno obrestno mero za svoje uporabnike je naletela na dober odziv. V samo štirih dneh so nabrali približno milijardo dolarjev depozitov.",
    "V okviru laboratorijskih vaj znanje povežemo s praktično rabo in ga utrdimo z uporabo odprtokodnih sistemov za obdelavo naravnega jezika. Študenti rešujejo naloge, ki temeljijo na realnih raziskovalnih in praktičnih problemih, pretežno v slovenskem in angleškem jeziku.",
    "Prosim, govorite počasneje.",
    "Do you speak any other languages?",
    "V šolskem letu 1994/1995 poskusno izvedli šolsko tekmovanje z nalogami Evropskega matematičnega kenguruja in ga razširili na učence 3. in 4. razreda. V naslednjem letu smo sklenili šolsko tekmovanje z nalogami Evropskega matematičnega kenguruja razširiti še na učence 2. razreda, od šolskega leta 2003/2004 dalje pa so take naloge na voljo za vse razrede osem- in devetletne OŠ.",
    "Čimprej se pozdravi.",
    "Pleničke je prala pri mrzlem studenc, en fantič k njej pride, korajžen mladenč.",
    "Prav milo jo vpraša: Oj deklica ti, zakaj maš tak solzne oči.",
    "Pleničke je prala pri mrzlem studenc, en fantič k njej pride, korajžen mladenč. Prav milo jo vpraša: Oj deklica ti, zakaj maš tak solzne oči.",
]

In [4]:
phrase_pairs = []
for phrase in sample_phrases:
    pphrase = paraphraser(phrase)[0]["generated_text"]
    pphrase = pphrase[0].upper() + pphrase[1:]
    phrase_pairs.append((phrase, pphrase))
    
    print(f"{phrase}\n{pphrase}\n\n{'-'*30}\n")

Najbolj je upadla prodaja v segmentu domačih uporabnikov, ki se je skrčil za 65 odstotkov.
Najbolj je upadla prodaja na segmentu domačih uporabnikov, ki se je skrčila za 65 odstotkov.

------------------------------

Applova ponudba varčevalnega računa s 4,15-odstotno obrestno mero za svoje uporabnike je naletela na dober odziv. V samo štirih dneh so nabrali približno milijardo dolarjev depozitov.
Applova ponudba za varčevanje s 4,15% obrestno mero za svoje uporabnike je naletela na dober odziv. V samo štirih dneh so zbrali približno milijardo dolarjev depozitov.

------------------------------

V okviru laboratorijskih vaj znanje povežemo s praktično rabo in ga utrdimo z uporabo odprtokodnih sistemov za obdelavo naravnega jezika. Študenti rešujejo naloge, ki temeljijo na realnih raziskovalnih in praktičnih problemih, pretežno v slovenskem in angleškem jeziku.
V okviru laboratorijskih vaj se znanje povezuje s praktično uporabo in ga nadgrajuje z uporabo odprtokodnih sistemov za obdelav

In [5]:
base_model = T5ForConditionalGeneration.from_pretrained("cjvt/t5-sl-small").to("cuda:0")
tokenizer = T5Tokenizer.from_pretrained(tokenizer_type)
base_paraphraser = pipeline(
    "text2text-generation",
    model=base_model,
    tokenizer=tokenizer,
    framework="pt",
    max_length=512,
    device=0 # means cuda:0
)

In [6]:
for phrase in sample_phrases:
    pphrase = base_paraphraser(phrase)[0]["generated_text"]
    pphrase = pphrase[0].upper() + pphrase[1:]
    # phrase_pairs.append((phrase, pphrase))
    
    print(f"{phrase}\n{pphrase}\n\n{'-'*30}\n")

Najbolj je upadla prodaja v segmentu domačih uporabnikov, ki se je skrčil za 65 odstotkov.
݄

------------------------------

Applova ponudba varčevalnega računa s 4,15-odstotno obrestno mero za svoje uporabnike je naletela na dober odziv. V samo štirih dneh so nabrali približno milijardo dolarjev depozitov.
݄

------------------------------

V okviru laboratorijskih vaj znanje povežemo s praktično rabo in ga utrdimo z uporabo odprtokodnih sistemov za obdelavo naravnega jezika. Študenti rešujejo naloge, ki temeljijo na realnih raziskovalnih in praktičnih problemih, pretežno v slovenskem in angleškem jeziku.
݄

------------------------------

Prosim, govorite počasneje.
݄

------------------------------

Do you speak any other languages?
݄

------------------------------

V šolskem letu 1994/1995 poskusno izvedli šolsko tekmovanje z nalogami Evropskega matematičnega kenguruja in ga razširili na učence 3. in 4. razreda. V naslednjem letu smo sklenili šolsko tekmovanje z nalogami Evropske

In [7]:
summ = pipeline(
    "summarization",
    model=model,
    tokenizer=tokenizer,
    framework="pt",
    max_length=60,
    device=0 # means cuda:0
)