# <a id='toc1_'></a>[NorMistral-7b-warm-instruct](#toc0_)
- Description: NorMistral-7b-warm-instruct is a large Norwegian language model initialized from Mistral-7b-v0.1 and continuously pretrained on a total of 260 billion subword tokens (using six repetitions of open Norwegian texts). [Read more here...](https://huggingface.co/norallm/normistral-7b-warm-instruct)
- Model Developers: Language Technology Group at the University of Oslo.
- Model Architecture: NorMistral is an auto-regressive language model that uses an optimized transformer architecture based on the Mistral/Llama language models.
- License: [apache-2.0](https://huggingface.co/datasets/choosealicense/licenses/blob/main/markdown/apache-2.0.md)
- Code Repository: [GitHub](norallm/NorMistral-7b-warm-instruct.ipynb)

**Table of contents**<a id='toc0_'></a>    
- [NorMistral-7b-warm-instruct](#toc1_)    
  - [Install libraries](#toc1_1_)    
  - [Load libraries](#toc1_2_)    
  - [Load tokenizer and model](#toc1_3_)    
  - [Generate parameters](#toc1_4_)    
  - [Generate text](#toc1_5_)    

<!-- vscode-jupyter-toc-config
	numbering=false
	anchor=true
	flat=false
	minLevel=1
	maxLevel=6
	/vscode-jupyter-toc-config -->
<!-- THIS CELL WILL BE REPLACED ON TOC UPDATE. DO NOT WRITE YOUR TEXT IN THIS CELL -->

## <a id='toc1_1_'></a>[Install libraries](#toc0_)

In [None]:
!pip install transformers bitsandbytes accelerate datasets torch --upgrade

## <a id='toc1_2_'></a>[Load libraries](#toc0_)

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM

## <a id='toc1_3_'></a>[Load tokenizer and model](#toc0_)

In [None]:
tokenizer = AutoTokenizer.from_pretrained("norallm/normistral-7b-warm-instruct")
model = AutoModelForCausalLM.from_pretrained("norallm/normistral-7b-warm-instruct", torch_dtype=torch.bfloat16)

## <a id='toc1_4_'></a>[Generate parameters](#toc0_)

In [None]:
messages = [
    {"role": "user", "content": "Hva er hovedstaden i Norge?"},
    {"role": "assistant", "content": "Hovedstaden i Norge er Oslo. Denne byen ligger i den sørøstlige delen av landet, ved Oslofjorden. Oslo er en av de raskest voksende byene i Europa, og den er kjent for sin rike historie, kultur og moderne arkitektur. Noen populære turistattraksjoner i Oslo inkluderer Vigelandsparken, som viser mer enn 200 skulpturer laget av den berømte norske skulptøren Gustav Vigeland, og det kongelige slott, som er den offisielle residensen til Norges kongefamilie. Oslo er også hjemsted for mange museer, gallerier og teatre, samt mange restauranter og barer som tilbyr et bredt utvalg av kulinariske og kulturelle opplevelser."},
    {"role": "user", "content": "Gi meg en liste over de beste stedene å besøke i hovedstaden"}
]

gen_input = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")

## <a id='toc1_5_'></a>[Generate text](#toc0_)

In [None]:
model.generate(
    gen_input,
    max_new_tokens=1024,
    top_k=64,  # top-k sampling
    top_p=0.9,  # nucleus sampling
    temperature=0.3,  # a low temparature to make the outputs less chaotic
    repetition_penalty=1.0,  # turn the repetition penalty off, having it on can lead to very bad outputs
    do_sample=True,  # randomly sample the outputs
    use_cache=True  # speed-up generation
)