### Example of using another LLM than OpenAI

In [13]:
HUGGINGFACEHUB_API_TOKEN = os.environ.get("HUGGINGFACEHUB_API_TOKEN")

In [7]:
from langchain import PromptTemplate

template = """Question: {question}

Answer: """
prompt = PromptTemplate(
    template=template,
    input_variables=['question']
)

# user question
question = "What is the capital city of France?"

In [14]:
from langchain import HuggingFaceHub, LLMChain

# initialize Hub LLM
hub_llm = HuggingFaceHub(
        repo_id='google/flan-t5-large',
    model_kwargs={'temperature':0}
)

# create prompt template > LLM chain
llm_chain = LLMChain(
    prompt=prompt,
    llm=hub_llm
)



paris


In [15]:
# ask the user question about the capital of France
print(llm_chain.run(question))

paris


### Setting up APIs

In [95]:
import os
from dotenv import load_dotenv

load_dotenv(override=True)

OPENAI_API_KEY = os.environ.get("OPENAI_API_KEY")
ACTIVELOOP_TOKEN = os.environ.get('ACTIVELOOP_TOKEN')
GOOGLE_CSE_ID = os.environ.get('GOOGLE_CSE_ID')
GOOGLE_API_KEY = os.environ.get('GOOGLE_API_KEY')

## Prompts in LangChain

**ChatPromptTemplate** is used to create a structured conversation with the AI model, making it easier to manage the flow and content of the conversation. In LangChain, message prompt templates are used to construct and work with prompts, allowing us to exploit the underlying chat model's potential fully.

System and Human prompts differ in their roles and purposes when interacting with chat models. 

- SystemMessagePromptTemplate provides initial instructions, context, or data for the AI model, while
- HumanMessagePromptTemplate are messages from the user that the AI model responds to.

In [7]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts.chat import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
)

# Before executing the following code, make sure to have
# your OpenAI key saved in the “OPENAI_API_KEY” environment variable.
chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

template = "You are an assistant that helps users find information about movies."
system_message_prompt = SystemMessagePromptTemplate.from_template(template)
human_template = "Find information about the movie {movie_title}."
human_message_prompt = HumanMessagePromptTemplate.from_template(human_template)

chat_prompt = ChatPromptTemplate.from_messages([system_message_prompt, human_message_prompt])

formated_prompt = chat_prompt.format_prompt(movie_title="Inception").to_messages()
print(formated_prompt)

[SystemMessage(content='You are an assistant that helps users find information about movies.', additional_kwargs={}), HumanMessage(content='Find information about the movie Inception.', additional_kwargs={}, example=False)]


In [9]:
response = chat(formated_prompt)

print(response.content)

"Inception" is a science fiction action film directed by Christopher Nolan. It was released in 2010 and stars Leonardo DiCaprio, Joseph Gordon-Levitt, Ellen Page, Tom Hardy, and Marion Cotillard.

The movie follows Dom Cobb (played by DiCaprio), a skilled thief who specializes in extracting valuable information from the subconscious of his targets by entering their dreams. Cobb is given a chance to redeem himself by performing the opposite task of "inception" – planting an idea in someone's mind instead of stealing it.

The film explores the concept of shared dreaming and delves into the complexities of the human mind. It takes the audience on a thrilling journey through various dream levels, blurring the lines between reality and the dream world.

"Inception" received critical acclaim for its originality, visual effects, and thought-provoking storyline. It was praised for its complex narrative structure and the performances of its cast. The film was a commercial success, grossing over

## Summarization Chain

- **load_summarize_chain** function accepts an instance of the language model and returns a pre-built summarization chain.
- PyPDFLoader class is responsible for loading PDF files and converting them into a format suitable for processing by LangChain. 

In [28]:
# Import necessary modules
from langchain import OpenAI, PromptTemplate
from langchain.chains.summarize import load_summarize_chain
from langchain.document_loaders import PyPDFLoader


# Initialize language model
llm = OpenAI(model_name="gpt-3.5-turbo-16k", temperature=0)

# Load the summarization chain
summarize_chain = load_summarize_chain(llm)

# Load the document using PyPDFLoader
document_loader = PyPDFLoader(file_path="data/ny-i-dagpengesystemet-DK-2023.pdf")

document = document_loader.load()

# Summarize the document
summary = summarize_chain(document)
print(summary['output_text'])



This document is a guide for members of an unemployment insurance system. It provides information on key concepts, job search strategies, and important terms related to unemployment benefits. It also includes information on meetings with the employment agency, job applications, and the process of receiving unemployment benefits. The guide emphasizes the importance of being actively job seeking and available for work. It also provides resources for further learning and support.


In [33]:
document[4]

Document(page_content='5MA\nJobcenter\nMA/\njobcenterVelkomst-\nsamtaleRådigheds-\nsamtale\nFællessamtaleRådigheds-\nsamtale\n1 samtale om \nmåneden\nFællessamtaleRådighedssamtale \nefter behov\n1 samtale \ni kvartalet\nFællessamtale \nefter 16 mdr. – \nintensiveret \nindsatsDu skal uploade en ansøgning og et cv i jobloggen. \nTil velkomstsamtalen vil vi nemlig bruge så meget tid \nsom muligt på at tale om dine jobmuligheder og dit \nansøgningsmateriale, så du hurtigt kommer i gang.\nHusk! Du skal selv booke mødet, når du bliver indkaldt \ntil møder. Vær derfor opmærksom på indkaldelser fra \nMA i selvbetjeningen på Mit MA og fra dit jobcenter i e-Boks.\n1. måned 1.-3. måned 4.-6. måned 7.-24. måned', metadata={'source': 'data/ny-i-dagpengesystemet-DK-2023.pdf', 'page': 4})

In [None]:
# Summarize the document
summary = summarize_chain(documents[5])
print(summary['output_text'])

In [17]:
document[2]

Document(page_content='3Indhold\nDu bor i København, Frederiksberg, Aarhus eller Odense Kommune 4- 5\nDu bor ikke i København, Frederiksberg, Aarhus eller Odense Kommune 6-7\nMit MA og selvbetjeningen 8-9\nAt stå til rådighed – hvad betyder det? 10-11\nHvad tæller med i jobsøgningen? 12-13\nNøglebegreber  14\nNår du går i job 15\nDin joblog  16-17\nSelvstudie: Digital introduktion til dagpengesystemet 18 -19\nFå målrettet inspiration og gode råd til din jobjagt  20\nTilbud til MA’s medlemmer  21\nDit dagpengeoverblik  22-23\nHvad må du, når du er på dagpenge?  24-25\nDagpengekortet (ydelseskortet)  26-28\nSygdom, ferie og barsel  29\nUdbetaling af dagpenge  30-31\nSamkøring – hvad er det?  32\nEksklusivt værktøj: MA Personprofil  33\nBrug hjemmesiden  34-35\nSøg – og du skal finde  Bagsiden', metadata={'source': 'data/ny-i-dagpengesystemet-DK-2023.pdf', 'page': 2})

## Saving and loading prompts externally

In [42]:
from langchain.prompts import load_prompt

tekst = "Når du skal på ferie, skal du registrere ferien på Min side på jobnet.dk under menupunktet ”Giv besked” senest 14 dage før din første feriedag, og gerne tidligere. Derved får jobcentret og vi besked om dine ferieplaner, så du ikke bliver indkaldt til møder og lignende. Hvis du ikke husker at registrere ferien, har du pligt til komme til møder og samtaler, som vi eller jobcentret indkalder til. Møder du ikke op på grund af ferie, vil det påvirke dine dagpenge. Fremgår ferien ikke af dit ydelseskort, skal du huske selv at skrive det på. 14-dages-fristen gælder ikke for ferie på enkeltdage. Du kan dog ikke meddele ferie på en dag, hvor vi eller jobcentret allerede har indkaldt dig."

prompt = load_prompt("prompt_DK_opsummering_40tokens.yaml")
formated_prompt = prompt.format(tekst=tekst, tone="Ordenlig, neutral og informativ")
print(formated_prompt)

Opsummer følgende tekst og sørg for at svaret er givet i en Ordenlig, neutral og informativ tone og max er 40 tokens langt. Teksten er nedenfor Når du skal på ferie, skal du registrere ferien på Min side på jobnet.dk under menupunktet ”Giv besked” senest 14 dage før din første feriedag, og gerne tidligere. Derved får jobcentret og vi besked om dine ferieplaner, så du ikke bliver indkaldt til møder og lignende. Hvis du ikke husker at registrere ferien, har du pligt til komme til møder og samtaler, som vi eller jobcentret indkalder til. Møder du ikke op på grund af ferie, vil det påvirke dine dagpenge. Fremgår ferien ikke af dit ydelseskort, skal du huske selv at skrive det på. 14-dages-fristen gælder ikke for ferie på enkeltdage. Du kan dog ikke meddele ferie på en dag, hvor vi eller jobcentret allerede har indkaldt dig. \n


In [41]:
llm = OpenAI(model="text-davinci-003", temperature=0)
llm(formated_prompt)

'\n\nDu skal registrere din ferie på Min side på jobnet.dk senest 14 dage før din første feriedag. Hvis du ikke gør det, skal du stadig møde op til møder og samtaler, som du er blevet indkaldt til. Det kan påvirke dine dagpenge, hvis du ikke møder op. Ferie på enkeltdage skal ikke registreres, men skal stadig skrives på dit ydelseskort. Du kan ikke meddele ferie på en dag, hvor du allerede er blevet indkaldt.'

## FewShotPromptTemplate & loading external prompts

Består af 
- prefix: Første del af prompten, der f.eks. beskriver bottens rolle, og indsættes før eksemplerne
- example_promt: Skabelonen for hvordan eksemplerne skal se ud, f.eks. "Borger: {Spørgsmål} \n Bot: {Svar}"
- examples: En liste af eksempler af {Spørgsmål} og {Svar} som ved prompt generering indsættes i skabelonen
- suffix: Sidste del af prompten, der f.eks. minder botten om at den ikke skal svare, hvis den ikke kendte svaret
- input_variables: En eller flere variable der kan indsættes i prompten (prefix / suffix) ved generering, f.eks. inputtet fra bruger eller variabel der bestemmer længden på svaret
- example_seperator: Den seperator som skal indsættes imellem de forskellige eksempler, f.eks. "\n" for at indsætte et linjeskift


In [None]:
"""
few_shot_prompt_template = FewShotPromptTemplate(
    examples=,
    example_prompt=,
    prefix=,
    suffix=,
    input_variables=,
    example_separator="\n\n"
    
"""

**Prefix**

In [112]:
jobcenter_prefix = load_prompt("jobcenter_prefix.yaml")
print(jobcenter_prefix)

input_variables=['tone'] output_parser=None partial_variables={} template='Du er en professionel sagsbehandler som arbejder på jobcentret. Du hjælper borgere med spørgsmål til arbejdsløshed og svarer altid i en {tone} tone og holder dit svar under 80 tokens langt. Hvis du ikke kender svaret, skal du sige at du ikke kender svaret \\n' template_format='f-string' validate_template=True


In [114]:
jobcenter_prefix.template

'Du er en professionel sagsbehandler som arbejder på jobcentret. Du hjælper borgere med spørgsmål til arbejdsløshed og svarer altid i en {tone} tone og holder dit svar under 80 tokens langt. Hvis du ikke kender svaret, skal du sige at du ikke kender svaret \\n'

**Definer eksempel skabelon - example_prompt**

In [82]:
FAQ_template = """
Spørgsmål: {spørgsmål}
Svar: {svar}
"""

FAQ_prompt = PromptTemplate(
    input_variables=["spørgsmål", "svar"],
    template=FAQ_template
)

FAQ_prompt

PromptTemplate(input_variables=['spørgsmål', 'svar'], output_parser=None, partial_variables={}, template='\nSpørgsmål: {spørgsmål}\nSvar: {svar}\n', template_format='f-string', validate_template=True)

**Load eksempler - examples**
There is no function to load examples directly in LangChain hence we have to use a regular yaml reader

In [102]:
import yaml
examples_file = 'examples_jobcenter_FAQ.yaml'

FAQ_eksempler = []
with open(examples_file, 'r') as f:
    FAQ_eksempler = yaml.safe_load(f)

FAQ_eksempler[0]

{'spørgsmål': 'Hvor lang tid kan jeg få dagpenge?',
 'svar': 'Dagpengeperioden opgøres i timer. Du kan få dagpenge i 3.848 timer. Du kan bruge timerne inden for en periode på 36 måneder. Dagpengeperioden er en slags klippekort med 3.848 klip, og du bruger et klip hver gang du får udbetalt dagpenge i 1 time. Du bruger også af dine klip, hvis du f.eks. arbejder i et job, hvor arbejdsgiveren får løntilskud.'}

**(Optional) Dynamic example selector**
Vælg antal eksempler ud fra en max længde på eksemplerne

In [120]:
from langchain.prompts.example_selector import LengthBasedExampleSelector

example_selector = LengthBasedExampleSelector(
    examples=FAQ_eksempler,
    example_prompt=FAQ_prompt,
    max_length=100  
)

**Definer FewShotPromptTemplate**

In [115]:

from langchain import LLMChain, FewShotPromptTemplate, PromptTemplate


few_shot_prompt_template = FewShotPromptTemplate(
    examples=FAQ_eksempler,
    example_prompt=FAQ_prompt,
    prefix=jobcenter_prefix.template,
    suffix="Spørgsmål: {spørgsmål}\nSvar:",
    input_variables=["tone", "spørgsmål"],
    example_separator="\n\n"
)

**Definer input og generer prompt**

In [116]:
input_eks = "Kan jeg få dagpenge som nyuddannet?"

In [118]:
print(few_shot_prompt_template.format(spørgsmål=input_eks, tone="neutral"))

Du er en professionel sagsbehandler som arbejder på jobcentret. Du hjælper borgere med spørgsmål til arbejdsløshed og svarer altid i en neutral tone og holder dit svar under 80 tokens langt. Hvis du ikke kender svaret, skal du sige at du ikke kender svaret \n


Spørgsmål: Hvor lang tid kan jeg få dagpenge?
Svar: Dagpengeperioden opgøres i timer. Du kan få dagpenge i 3.848 timer. Du kan bruge timerne inden for en periode på 36 måneder. Dagpengeperioden er en slags klippekort med 3.848 klip, og du bruger et klip hver gang du får udbetalt dagpenge i 1 time. Du bruger også af dine klip, hvis du f.eks. arbejder i et job, hvor arbejdsgiveren får løntilskud.



Spørgsmål: Hvad er en dagpengeperiode?
Svar: Første gang du bliver ledig som lønmodtager får du ret til dagpenge i 3.848 timer. Det svarer til 2 år. Perioden kaldes dagpengeperioden



Spørgsmål: Hvad kræves for at have ret til dagpenge som lønmodtager?
Svar: Du skal være medlem i a-kassen, og have været det i mindst 1 år. Du skal også

**Opret LLM chain og spørg LLM**

In [119]:
chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)
chain = LLMChain(llm=chat, prompt=few_shot_prompt_template)
chain.run({'spørgsmål': input_eks, 'tone': 'neutral'})

'Som nyuddannet kan du have ret til dagpenge, hvis du opfylder visse betingelser. Du skal have været medlem af a-kassen i mindst 1 år, have haft en samlet indkomst på mindst 228.348 kr. i de sidste 3 år og være tilmeldt som ledig på jobnet.dk. Derudover skal du have afsluttet en uddannelse, der giver ret til dagpenge. Det er vigtigt at bemærke, at der kan være forskellige regler og betingelser afhængigt af din situation og a-kasse.'