In [1]:
import os
from dotenv import load_dotenv  
import torch
from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
import time


load_dotenv()  # take environment variables from .env.

# Get the API key from the environment variable and store it in a variable.
HF_AUTH_KEY_1 = os.getenv("HF_AUTH_KEY_1")
HF_AUTH_KEY_2 = os.getenv("HF_AUTH_KEY_2")

  from .autonotebook import tqdm as notebook_tqdm


In [2]:

# Initialize Variables
model_size = "gpt-sw3-6.7b-v2-instruct"
model_name = "AI-Sweden-Models/" + model_size
device = "cpu" # "cpu" or "cuda" or "mps"

# Initialize Tokenizer & Model
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
model.eval()
model.to(device)

Loading checkpoint shards: 100%|██████████| 3/3 [00:24<00:00,  8.15s/it]


GPT2LMHeadModel(
  (transformer): GPT2Model(
    (wte): Embedding(64000, 4096)
    (wpe): Embedding(2048, 4096)
    (drop): Dropout(p=0.1, inplace=False)
    (h): ModuleList(
      (0-31): 32 x GPT2Block(
        (ln_1): LayerNorm((4096,), eps=1e-05, elementwise_affine=True)
        (attn): GPT2Attention(
          (c_attn): Conv1D()
          (c_proj): Conv1D()
          (attn_dropout): Dropout(p=0.1, inplace=False)
          (resid_dropout): Dropout(p=0.1, inplace=False)
        )
        (ln_2): LayerNorm((4096,), eps=1e-05, elementwise_affine=True)
        (mlp): GPT2MLP(
          (c_fc): Conv1D()
          (c_proj): Conv1D()
          (act): GELUActivation()
          (dropout): Dropout(p=0.1, inplace=False)
        )
      )
    )
    (ln_f): LayerNorm((4096,), eps=1e-05, elementwise_affine=True)
  )
  (lm_head): Linear(in_features=4096, out_features=64000, bias=False)
)

In [3]:
prompt = "Vad innebär klarspråk inom myndighetssvenska?"

input_ids = tokenizer(prompt, return_tensors="pt")["input_ids"].to(device)

do_sample = True
max_new_tokens = 200
temperature = 0.5
top_p = 0.95

generated_token_ids = model.generate(
    inputs=input_ids,
    max_new_tokens=max_new_tokens,
    do_sample=do_sample,
    temperature=temperature,
    top_p=top_p,
)[0]

generated_text = tokenizer.decode(generated_token_ids)  

generated_text

'Vad innebär klarspråk inom myndighetssvenska?\n\nKlarspråk innebär att man skriver på ett sätt som är lätt att förstå. Det innebär bland annat att man använder ett tydligt och enkelt språk, att man undviker långa och komplicerade meningar och att man använder ett vårdat språk.\n\nKlarspråk syftar till att göra myndighetstexter mer tillgängliga för allmänheten, så att alla ska kunna ta del av den information som myndigheterna tillhandahåller. Genom klarspråk kan myndigheterna också öka sin trovärdighet och sitt förtroende hos allmänheten.\n\nHur kan man se till att myndighetstexter är skrivna på ett klarspråkligt sätt?\n\nFör att se till att myndighetstexter är skrivna på ett klarspråkligt sätt kan du följa dessa steg:\n\n1. Använd ett enkelt och tydligt språk: Använd ett enkelt och tydligt språk som är lätt att förstå. Undvik att använda svåra ord och uttryck, och var noga med att stava och grammatik korrekt.\n\n2. Använd korta meningar: Använd korta, tydliga meningar som är lätta att

In [6]:
file_name = f"do_sample_{do_sample}_max_new_tokens_{max_new_tokens}_temperature_{temperature}_top_p_{top_p}.txt"

folder_path = os.path.join("outputs", model_size, prompt)
if not os.path.isdir(folder_path):
    os.makedirs(folder_path)
with open(os.path.join(folder_path, file_name), "w") as f:
    f.write(generated_text)
    
for line in generated_text.split("\n"):
    print(line)


Vad innebär klarspråk inom myndighetssvenska?

Klarspråk innebär att man skriver på ett sätt som är lätt att förstå. Det innebär bland annat att man använder ett tydligt och enkelt språk, att man undviker långa och komplicerade meningar och att man använder ett vårdat språk.

Klarspråk syftar till att göra myndighetstexter mer tillgängliga för allmänheten, så att alla ska kunna ta del av den information som myndigheterna tillhandahåller. Genom klarspråk kan myndigheterna också öka sin trovärdighet och sitt förtroende hos allmänheten.

Hur kan man se till att myndighetstexter är skrivna på ett klarspråkligt sätt?

För att se till att myndighetstexter är skrivna på ett klarspråkligt sätt kan du följa dessa steg:

1. Använd ett enkelt och tydligt språk: Använd ett enkelt och tydligt språk som är lätt att förstå. Undvik att använda svåra ord och uttryck, och var noga med att stava och grammatik korrekt.

2. Använd korta meningar: Använd korta, tydliga meningar som är lätta att följa.
