# Installs
Only needed once after setting up the runpod:
- pip
- Hugging Face

## Pip

In [None]:
import time
start_time = time.time()
!pip install --upgrade transformers

!pip install accelerate                 # Necessary for llama model
!pip install bitsandbytes
!pip install langdetect
!pip install google-cloud-translate
!pip install -U huggingface-hub

# T5 needs the following package:
try:
    import sentencepiece
except ImportError:
    print("SentencePiece is not installed. Installing...")
    !pip install sentencepiece
    print("SentencePiece installed successfully.")

end_time = time.time()
elapsed_time = end_time - start_time
print(f"Pip install: {elapsed_time} seconds")

## Hugging Face

In [1]:
# add this token in the Token user-input: "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"
#!pip install huggingface_hub
from huggingface_hub import login
login(token="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")

Token will not been saved to git credential helper. Pass `add_to_git_credential=True` if you want to set the git credential as well.
Token is valid (permission: write).
Your token has been saved to /root/.cache/huggingface/token
Login successful


# Code

## Single execution

In [2]:
import re
import time
from transformers import pipeline, Conversation, AutoTokenizer
from langdetect import detect

model_name_options = {
    1: "meta-llama/Llama-2-7b-chat-hf",
    2: "BramVanroy/Llama-2-13b-chat-dutch"
}


my_config = {'model_name': model_name_options[2], 'do_sample': True, 'temperature': 0.1, 'repetition_penalty': 1.1, 'max_new_tokens': 500, }
print(f"Selected model: {my_config['model_name']}")
print(f"Parameters are: {my_config}")

def count_words(text):
    # Use a simple regular expression to count words
    words = re.findall(r'\b\w+\b', text)
    return len(words)

def generate_with_llama_english(my_config):    
    # get the parameters from the config dict
    do_sample = my_config.get('do_sample', True)
    temperature = my_config.get('temperature', 0.1)
    repetition_penalty = my_config.get('repetition_penalty', 1.1)
    max_new_tokens = my_config.get('max_new_tokens', 500)
    
    start_time = time.time()
    model = my_config['model_name']
    tokenizer = AutoTokenizer.from_pretrained(model)
    
    # Language code for Dutch
    #lang_code = "nl_XX"
    #forced_bos_token_id = tokenizer.lang_code_to_id["nl_XX"] # Error lang_code_to_id not know
    
    #potential usful parameters to tweak: ,"do_sample": True, "max_lengt
    chatbot = pipeline("conversational",model=model, 
                       tokenizer=tokenizer,
                       do_sample=do_sample, 
                       temperature=temperature, 
                       repetition_penalty=repetition_penalty,
                       #max_length=2000,
                       max_new_tokens=max_new_tokens, 
                       model_kwargs={"device_map": "auto","load_in_8bit": True})  #, "src_lang": "en", "tgt_lang": "nl"})  does not work!
    end_time = time.time()
    elapsed_time = end_time - start_time
    print(f"Loading the model: {elapsed_time} seconds")
    return chatbot
    
def get_answer(input_text):
    start_time = time.time()
    print(f"Processing the input\n {input_text}\n")
    print('Processing the answer....')
    conversation = Conversation(input_text)
    output = (chatbot(conversation))[1]['content']
    output_language = detect(output)
    print(f"{output}\n")
    print(f"output language detected is {output_language}\n")
    end_time = time.time()
    elapsed_time = end_time - start_time
    print(f"Answered in {elapsed_time:.1f} seconds, Nr generated words: {count_words(output)}\n")

    # Perform translation to dutch (catch in case it is needed (prompt engineering does not always works)
    if output_language == 'en':
        print("----------------------------------------------------")
        print("Need extra time to make the translation to Dutch....")
        start_time = time.time()
        conversation = Conversation(f"Translate the following text to Dutch: {output}")
        output = (chatbot(conversation))[1]['content']
        end_time = time.time()
        elapsed_time = end_time - start_time
        print(f"translated output is: {output}\n")
        print(f"Translation time: {elapsed_time:.1f}, Nr generated words: {count_words(output)}")


chatbot = generate_with_llama_english(my_config)

Selected model: BramVanroy/Llama-2-13b-chat-dutch
Parameters are: {'model_name': 'BramVanroy/Llama-2-13b-chat-dutch', 'do_sample': True, 'temperature': 0.1, 'repetition_penalty': 1.1, 'max_new_tokens': 500}


Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

Loading the model: 15.757340431213379 seconds


## Vraag: Stel je vraag hier
example: 

input_text = "Geef je complete prompt hier. Vraag en context" 

# UI command
input_text = input("Geef je prompt hier.")

In [3]:
input_text = '''Wat beschrijft deze text over kunstmatige intelligentie?, based on the following input text, translate your output answer into Dutch: 'Medewerkers gaan we verder ontwikkelen in het toepassen van de menselijke maat in onze dienstverlening. Met ondersteuning van kunstmatige intelligentie gaan we onze brieven leesbaarder en begrijpelijker maken. De benadering is van buiten naar binnen: knelpunten die onze cliënten ervaren worden in kaart gebracht op basis van verschillende vormen van (klant)onderzoek en analyses. Het programma Innovatie ondersteunt initiatieven en oplosteams in het effectief organiseren van verbetertrajecten en het bedenken van vernieuwende oplossingen, met kennis over de laatste (technologische) ontwikkelingen en trends. Zo wordt onderzocht hoe kunstmatige intelligentie (zoals ChatGPT) ingezet kan worden, bijvoorbeeld bij het herschrijven van algemene teksten in tientallen brieven om de leesbaarheid te verbeteren. Aandacht voor innovatie en design thinking draagt ook bij aan de gewenste ontwikkeling van een lerende organisatie.'''

In [4]:
print(input_text)

Wat beschrijft deze text over kunstmatige intelligentie?, based on the following input text, translate your output answer into Dutch: 'Medewerkers gaan we verder ontwikkelen in het toepassen van de menselijke maat in onze dienstverlening. Met ondersteuning van kunstmatige intelligentie gaan we onze brieven leesbaarder en begrijpelijker maken. De benadering is van buiten naar binnen: knelpunten die onze cliënten ervaren worden in kaart gebracht op basis van verschillende vormen van (klant)onderzoek en analyses. Het programma Innovatie ondersteunt initiatieven en oplosteams in het effectief organiseren van verbetertrajecten en het bedenken van vernieuwende oplossingen, met kennis over de laatste (technologische) ontwikkelingen en trends. Zo wordt onderzocht hoe kunstmatige intelligentie (zoals ChatGPT) ingezet kan worden, bijvoorbeeld bij het herschrijven van algemene teksten in tientallen brieven om de leesbaarheid te verbeteren. Aandacht voor innovatie en design thinking draagt ook bij

In [5]:
get_answer(input_text)

Processing the input
 Wat beschrijft deze text over kunstmatige intelligentie?, based on the following input text, translate your output answer into Dutch: 'Medewerkers gaan we verder ontwikkelen in het toepassen van de menselijke maat in onze dienstverlening. Met ondersteuning van kunstmatige intelligentie gaan we onze brieven leesbaarder en begrijpelijker maken. De benadering is van buiten naar binnen: knelpunten die onze cliënten ervaren worden in kaart gebracht op basis van verschillende vormen van (klant)onderzoek en analyses. Het programma Innovatie ondersteunt initiatieven en oplosteams in het effectief organiseren van verbetertrajecten en het bedenken van vernieuwende oplossingen, met kennis over de laatste (technologische) ontwikkelingen en trends. Zo wordt onderzocht hoe kunstmatige intelligentie (zoals ChatGPT) ingezet kan worden, bijvoorbeeld bij het herschrijven van algemene teksten in tientallen brieven om de leesbaarheid te verbeteren. Aandacht voor innovatie en design t