# Implementing an LLM-powered recommendation system
Enhancing recommendation systems with Large Language Models.

## Data Preprocessing

In [5]:
import os
os.environ["OPENAI_API_KEY"] = "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"


In [42]:
import pandas as pd

recipes = pd.read_csv("data/all_recipe_details.csv")
recipes.head()

Unnamed: 0,ID,Title,Description,Ingredients
0,7d9a6e4e-9d34-4715-bf08-5b65f709d664,Klassisk minestronesuppe,"Oppskrift på italiensk minestronesuppe, med go...","rødløk, hvitløk, stangselleri, gulrøtter, chil..."
1,d1ba9cfb-d048-9475-ddb9-1f1aa3cf33f1,Kremet pasta med laks,"Pasta med kremet saus, stekt laks og erter er ...","pasta, frosne grønne erter, smør, creme fraiche"
2,9f4eac12-2edf-ad9c-14d9-90bb92bcc3d8,Kyllingfilet med soppsaus,Oppskrift på god og enkel hverdagsmiddag med k...,"løk, sjampinjong, crême fraiche, soyasaus, kyl..."
3,8bec3976-7837-420d-b94f-d078b2ac6ae3,Klassisk risotto,"Slik lager du klassisk italiensk risotto, med ...","risottoris, olivenolje, gul løk, hvitvin, kyll..."
4,328e4786-f496-4dde-a5f5-8675668a1c89,Lammeburger med kantareller og tyttebærkrem,Oppskrift på en saftig høstburger med sesongen...,"MENY lammeburgere, smør, burgerbrød, ferske ka..."


In [43]:
recipes["combined_info"] = recipes.apply(
    lambda row: f"Title: {row['Title']}. Description: {row['Description']}. Ingredients: {row['Ingredients']}",
    axis=1,
)
recipes.head(2)


Unnamed: 0,ID,Title,Description,Ingredients,combined_info
0,7d9a6e4e-9d34-4715-bf08-5b65f709d664,Klassisk minestronesuppe,"Oppskrift på italiensk minestronesuppe, med go...","rødløk, hvitløk, stangselleri, gulrøtter, chil...",Title: Klassisk minestronesuppe. Description: ...
1,d1ba9cfb-d048-9475-ddb9-1f1aa3cf33f1,Kremet pasta med laks,"Pasta med kremet saus, stekt laks og erter er ...","pasta, frosne grønne erter, smør, creme fraiche",Title: Kremet pasta med laks. Description: Pas...


## Embeddings

In [44]:
import tiktoken

embedding_model = "text-embedding-ada-002"
embedding_encoding = "cl100k_base"  # this the encoding for text-embedding-ada-002
max_tokens = 8000  # the maximum for text-embedding-ada-002 is 8191

encoding = tiktoken.get_encoding(embedding_encoding)

# omit descriptions that are too long to embed
recipes["n_tokens"] = recipes.combined_info.apply(lambda x: len(encoding.encode(x)))
recipes = recipes[recipes.n_tokens <= max_tokens]


In [46]:
from openai.embeddings_utils import get_embedding

recipes["embedding"] = recipes.combined_info.apply(
    lambda x: get_embedding(x, engine=embedding_model),
)
recipes.head()

Unnamed: 0,ID,Title,Description,Ingredients,combined_info,n_tokens,embedding
0,7d9a6e4e-9d34-4715-bf08-5b65f709d664,Klassisk minestronesuppe,"Oppskrift på italiensk minestronesuppe, med go...","rødløk, hvitløk, stangselleri, gulrøtter, chil...",Title: Klassisk minestronesuppe. Description: ...,128,"[0.024726679548621178, -0.02019410766661167, 0..."
1,d1ba9cfb-d048-9475-ddb9-1f1aa3cf33f1,Kremet pasta med laks,"Pasta med kremet saus, stekt laks og erter er ...","pasta, frosne grønne erter, smør, creme fraiche",Title: Kremet pasta med laks. Description: Pas...,90,"[0.02845609188079834, 0.0024084942415356636, 0..."
2,9f4eac12-2edf-ad9c-14d9-90bb92bcc3d8,Kyllingfilet med soppsaus,Oppskrift på god og enkel hverdagsmiddag med k...,"løk, sjampinjong, crême fraiche, soyasaus, kyl...",Title: Kyllingfilet med soppsaus. Description:...,124,"[0.004993893671780825, -0.008940117433667183, ..."
3,8bec3976-7837-420d-b94f-d078b2ac6ae3,Klassisk risotto,"Slik lager du klassisk italiensk risotto, med ...","risottoris, olivenolje, gul løk, hvitvin, kyll...",Title: Klassisk risotto. Description: Slik lag...,86,"[0.01944032497704029, -0.037856124341487885, -..."
4,328e4786-f496-4dde-a5f5-8675668a1c89,Lammeburger med kantareller og tyttebærkrem,Oppskrift på en saftig høstburger med sesongen...,"MENY lammeburgere, smør, burgerbrød, ferske ka...",Title: Lammeburger med kantareller og tyttebær...,162,"[-0.010145499370992184, -0.020918555557727814,..."


In [48]:
recipes.rename(columns={"embedding": "vector"}, inplace=True)
recipes.rename(columns={"combined_info": "text"}, inplace=True)
recipes.to_pickle("data/recipies.pkl")

## Start working with LLMs

In [12]:
import pandas as pd 

recipes = pd.read_pickle("data/recipies.pkl")

In [37]:
import lancedb
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import LanceDB
from langchain.chains import RetrievalQA

uri = "dataset/sample-recipes-lancedb"
db = lancedb.connect(uri)
table = db.create_table("recipes", recipes, mode="overwrite")

In [15]:
embeddings = OpenAIEmbeddings()

docsearch = LanceDB(connection = table, embedding = embeddings)

In [62]:
query = "I'm looking for a recipie with pasta as an ingredient. What could you suggest to me?"
docs = docsearch.similarity_search(query, k=1)
docs

  builder = builder.nearest(**nearest)


[Document(page_content='Title: Kremet pasta med kylling. Description: Oppskrift på enkel pastarett med kremet, fyldig saus, sopp og saftige kyllingbiter. Dette er rask hverdagsmiddag, som lages enkelt og virkelig er hverdagsluksus. Dryss gjerne parmesan over før servering. Ingredients: tagliatelle, kylling, sopp, finhakket bladpersille', metadata={'ID': '3af39934-3bed-4b48-9b6f-bb6e4c4cb384', 'Title': 'Kremet pasta med kylling', 'Description': 'Oppskrift på enkel pastarett med kremet, fyldig saus, sopp og saftige kyllingbiter. Dette er rask hverdagsmiddag, som lages enkelt og virkelig er hverdagsluksus. Dryss gjerne parmesan over før servering.', 'Ingredients': 'tagliatelle, kylling, sopp, finhakket bladpersille', 'n_tokens': 107, 'vector': array([ 0.01034346, -0.00917154, -0.00821617, ...,  0.00945815,
        -0.00228333, -0.01635592], dtype=float32), '_distance': 0.3671666979789734})]

In [77]:
# Import Azure OpenAI
# from langchain.llms import AzureOpenAI
from langchain.llms import OpenAI

qa = RetrievalQA.from_chain_type(llm=OpenAI(), chain_type="stuff", retriever=docsearch.as_retriever(), return_source_documents=True)

query = "I'm looking for a recepe perfect for friday night. What could you suggest to me?"
result = qa({"query": query})
result['result']

  builder = builder.nearest(**nearest)


" You could try the Lam i pita recipe. It's a quick dinner for the whole family and it's made of pitabread, lamb meat, red and yellow peppers, sweet potatoes, squash, crispi salad, tempura mix, and frying oil. It's topped with a fresh and mild yogurt dressing with mint."

In [72]:
result['source_documents'][0]

Document(page_content='Title: Lam i pita. Description: Om du har rester av lammekjøtt, er denne enkle middagen verdt å prøve! Oppskrift på frityrstekt lam i pitabrød, eller lammekebab, med paprika, søtpotet og squash. Topp det hele med en frisk og mild yoghurtdressing med mynte. Rask middag for hele familien til både hverdag og helg! Ingredients: pitabrød, lammekjøtt, rød paprika, gul paprika, søtpotet, grønn squash, crispi salat, tempura mix, frityrolje', metadata={'ID': 'fca7b8ac-6337-4f36-9349-086e08b47ee5', 'Title': 'Lam i pita', 'Description': 'Om du har rester av lammekjøtt, er denne enkle middagen verdt å prøve! Oppskrift på frityrstekt lam i pitabrød, eller lammekebab, med paprika, søtpotet og squash. Topp det hele med en frisk og mild yoghurtdressing med mynte. Rask middag for hele familien til både hverdag og helg!', 'Ingredients': 'pitabrød, lammekjøtt, rød paprika, gul paprika, søtpotet, grønn squash, crispi salat, tempura mix, frityrolje', 'n_tokens': 146, 'vector': array(

In [75]:
df_filtered = recipes[recipes['Ingredients'].apply(lambda x: 'Lam' in x.lower())]
qa = RetrievalQA.from_chain_type(llm=OpenAI(), chain_type="stuff", 
    retriever=docsearch.as_retriever(search_kwargs={'data': df_filtered}), return_source_documents=True)

query = "I'm looking for a recipie suitable in the fall."
result = qa({"query": query})
result['result']

  builder = builder.nearest(**nearest)


' You could try the Vegetarisk høstgryte, the Oksehalesuppe, the Klassisk kjøttsuppe, or the Stroganoff med sopp. All of these recipes use seasonal ingredients and are suitable for a cold autumn evening.'

In [76]:
qa = RetrievalQA.from_chain_type(llm=OpenAI(), chain_type="stuff", 
    retriever=docsearch.as_retriever(search_kwargs={'filter': {'score__gt':7}}), return_source_documents=True)

## Prompt Engineering

In [104]:
from langchain.prompts import PromptTemplate

template = """You are a recipe recommender system that help users to find weekly menus that match their preferences. 
Use the following pieces of context to answer the question at the end. 
For each question, suggest 7 recipies for a weekly menu, with a short description of the dish and the reason why the user might like it. Use the names of the week days to refer to the days of the week.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

{context}

Question: {question}
Your response:"""


PROMPT = PromptTemplate(
    template=template, input_variables=["context", "question"])

chain_type_kwargs = {"prompt": PROMPT}

llm=OpenAI()

qa = RetrievalQA.from_chain_type(llm=llm, 
    chain_type="stuff", 
    retriever=docsearch.as_retriever(),
    return_source_documents=True, 
    chain_type_kwargs=chain_type_kwargs)

query = "I'm looking for a weekly menu with short and fast recipes, any suggestions?"
result = qa({'query':query})
print(result['result'])

  builder = builder.nearest(**nearest)


 
Monday: Rask Fiskegryte - This is a quick and flavorful fish stew recipe with our popular fish soup and fish wok. Serve with fresh baguette or a coarse roll. Dinner for two in less than 20 minutes. 
Tuesday: Pasta with Meat Sauce - This week's dinner in under 20 minutes! Family-friendly dinner favorite with fresh tagliatelle with whole grain, and ready-made tomato sauce with extra vegetables. Both minced meat and diced meat can be used. 
Wednesday: Enkel Gryte med Kjøttkaker - Quick dinner tip with meatballs in pieces, mushrooms, broccoli and cream. Vary the vegetables according to taste and use leftovers. 
Thursday: Kjøttboller med poteter - Delicious meatballs with mashed potatoes and gravy. Serve with a simple side salad for a complete dinner. 
Friday: Laks i ovn - Oven-baked salmon with creamy dill sauce and boiled potatoes. Serve with some extra vegetables like carrots or green beans. 
Saturday: Aubergineruller - Oven baked eggplant rolls filled with a tasty mix of minced meat, 

In [81]:
from langchain.prompts import PromptTemplate

template_prefix = """You are a recipe recommender system that help users to find weekly menus that match their preferences.
Use the following pieces of context to answer the question at the end. 
For each question, take into account the context and the personal information provided by the user.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

{context}"""

user_info = """This is what we know about the user, and you can use this information to better tune your research:
Age: {age}
Gender: {gender}"""

template_suffix= """Question: {question}
Your response:"""

user_info = user_info.format(age = 18, gender = 'female')

COMBINED_PROMPT = template_prefix +'\n'+ user_info +'\n'+ template_suffix
print(COMBINED_PROMPT)

ROMPT = PromptTemplate(
    template=COMBINED_PROMPT, input_variables=["context", "question"])

chain_type_kwargs = {"prompt": PROMPT}
qa = RetrievalQA.from_chain_type(llm=OpenAI(), 
    chain_type="stuff", 
    retriever=docsearch.as_retriever(),
    return_source_documents=True, 
    chain_type_kwargs=chain_type_kwargs)

query = "Can you suggest me a weekly menu?"
result = qa({'query':query})
print(result['result'])

You are a recipe recommender system that help users to find weekly menus that match their preferences. 
Use the following pieces of context to answer the question at the end. 
For each question, take into account the context and the personal information provided by the user.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

{context}
This is what we know about the user, and you can use this information to better tune your research:
Age: 18
Gender: female
Question: {question}
Your response:


  builder = builder.nearest(**nearest)


 
Monday: Asiatisk laks med mangosalat - This dish is a healthy source of fiber and protein, topped with chili, ginger and cilantro and teriyaki sauce, served with fresh mango, avocado and bulgur. 
Tuesday: Pasta med kjøttsaus - An easy and family-friendly dinner that can be prepared in under 20 minutes. Made with fresh tagliatelle with whole grains and ready-made tomato sauce with additional vegetables. 
Wednesday: Oksestek med stekte grønnsaker - A classic Sunday dinner that can be enjoyed any other day of the week. Slow-cooked oxtail served with roasted potatoes, fried vegetables and ramson butter. 
Thursday: Ribbe med brokkolisalat og saltkokte poteter - A great Christmas dinner that practically cooks itself. With MENY's ready-cooked oxtail, salt-cooked potatoes and broccoli salad, you can be sure to get some crispy crackling. 
Friday: Wok med kylling og grønnsaker - This spicy and flavorful dish is an easy way to enjoy a delicious dinner. With chicken, vegetables and a sesame-soy 

## Conversation history

In [83]:
from langchain.llms import OpenAI
from langchain.chains import ConversationalRetrievalChain

In [101]:
from langchain.memory import ConversationBufferMemory
memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
qa = ConversationalRetrievalChain.from_llm(OpenAI(), docsearch.as_retriever(), memory=memory)

query = "I'm looking for a recipie suitable in the fall."
result = qa({"question": query})

print(result['answer'])

  builder = builder.nearest(**nearest)


 Based on the information provided, it looks like you could try Vegetarisk høstgryte, Oksehalesuppe, Klassisk kjøttsuppe, or Stroganoff med sopp. All of these recipes use ingredients that are typically available in the fall, and are great for cold weather.


In [None]:
query = "I do not like oksehalesupper, can you recommend something else?"
result = qa({"question": query})
result['answer']

In [102]:
qa = ConversationalRetrievalChain.from_llm(OpenAI(), docsearch.as_retriever(), return_source_documents=True)
chat_history = []

query = "I'm looking for a recipie suitable in the fall."
result = qa({"question": query, "chat_history": chat_history})

print(result['answer'])
print(result["source_documents"])

  builder = builder.nearest(**nearest)


 You could try Vegetarisk høstgryte, Oksehalesuppe, Klassisk kjøttsuppe, or Stroganoff med sopp. They all use ingredients that are typically available in the fall season.
[Document(page_content='Title: Vegetarisk høstgryte. Description: Oppskrift på vegetarisk, varmende høstgryte med norske grønnsaker i sesong, som sopp, løk, gulrøtter og poteter fra [MENYs vegetarentusiast, Hanne-Lene](/tema/vegetar/hanne-lene). En herlig kombinasjon av næringsrike grønnsaker og deilig krydder. Ingredients: olivenolje, løk, gulrot, stangselleri, aromasopp, hvitløksfedd, timian, oregano, salvie, mel, balsamicoeddik, soyasaus, små poteter, røde linser, hermetiske tomater, vann, grønnsaksbuljongterninger, laurbærblad, salt, pepper, chiliflak', metadata={'ID': 'fa101a91-fecc-43e6-a69a-c581dd5bebf7', 'Title': 'Vegetarisk høstgryte', 'Description': 'Oppskrift på vegetarisk, varmende høstgryte med norske grønnsaker i sesong, som sopp, løk, gulrøtter og poteter fra [MENYs vegetarentusiast, Hanne-Lene](/tema/v

In [92]:
chat_history = [(query, result["answer"])]
query = "I do not like oksehalesupper, can you recommend something else?"
result = qa({"question": query, "chat_history": chat_history})

result['answer']

  builder = builder.nearest(**nearest)


' Ja, en klassisk kjøttsuppe eller en salat med kylling og ovnsbakte grønnsaker er gode alternativer som passer til høstsesongen.'

## Testing

### Trying Chroma vector store to use MMR search for diversity
Maximal marginal relevance optimizes for similarity to query AND diversity

In [129]:
!pip install -q chromadb

Collecting chromadb
  Obtaining dependency information for chromadb from https://files.pythonhosted.org/packages/27/58/7bf23f206b8ad9507295067f08b7cc42d4a91d9877301abf0807df8fbe67/chromadb-0.4.13-py3-none-any.whl.metadata
  Downloading chromadb-0.4.13-py3-none-any.whl.metadata (7.0 kB)
Collecting chroma-hnswlib==0.7.3 (from chromadb)
  Obtaining dependency information for chroma-hnswlib==0.7.3 from https://files.pythonhosted.org/packages/f0/f0/e197039fa81a122544fceccda4e6a2d08bdd4a70638f0a88b6b16dbc4adc/chroma_hnswlib-0.7.3-cp39-cp39-win_amd64.whl.metadata
  Downloading chroma_hnswlib-0.7.3-cp39-cp39-win_amd64.whl.metadata (262 bytes)
Collecting posthog>=2.4.0 (from chromadb)
  Obtaining dependency information for posthog>=2.4.0 from https://files.pythonhosted.org/packages/a7/73/35758818228c70348be4c3c66a76653c62e894e0e3c3461453c5341ca926/posthog-3.0.2-py2.py3-none-any.whl.metadata
  Downloading posthog-3.0.2-py2.py3-none-any.whl.metadata (2.0 kB)
Collecting pulsar-client>=3.1.0 (from 

In [128]:
from langchain.chains import RetrievalQA
from langchain.document_loaders import TextLoader
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.llms import OpenAI
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import Chroma
from langchain.document_loaders import DataFrameLoader

In [143]:
recipes = pd.read_pickle("data/recipies.pkl")
documents = recipes["text"].tolist() 
ids = [str(x) for x in recipes.index.tolist()]
embeddings = recipes["vector"].tolist()

In [144]:
import chromadb

chroma_client = chromadb.Client()
collection = chroma_client.get_or_create_collection(name="recipes")
collection.add(
    embeddings=embeddings,
    documents=documents,
    ids=ids,
)

embedding_function = OpenAIEmbeddings()
chroma_docsearch = Chroma(client=chroma_client, collection_name="recipes", embedding_function=embedding_function)

Add of existing embedding ID: 0
Add of existing embedding ID: 1
Add of existing embedding ID: 2
Add of existing embedding ID: 3
Add of existing embedding ID: 4
Add of existing embedding ID: 5
Add of existing embedding ID: 6
Add of existing embedding ID: 7
Add of existing embedding ID: 8
Add of existing embedding ID: 9
Add of existing embedding ID: 10
Add of existing embedding ID: 11
Add of existing embedding ID: 12
Add of existing embedding ID: 13
Add of existing embedding ID: 14
Add of existing embedding ID: 15
Add of existing embedding ID: 16
Add of existing embedding ID: 17
Add of existing embedding ID: 18
Add of existing embedding ID: 19
Add of existing embedding ID: 20
Add of existing embedding ID: 21
Add of existing embedding ID: 22
Add of existing embedding ID: 23
Add of existing embedding ID: 24
Add of existing embedding ID: 25
Add of existing embedding ID: 26
Add of existing embedding ID: 27
Add of existing embedding ID: 28
Add of existing embedding ID: 29
Add of existing embe

In [162]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts import PromptTemplate

template = """Du er et anbefalingssystem av oppskrifter. Gitt brukerens preferanser, anbefal en ukentlig middagsmeny bestående av 7 oppskrifter.
For hver dag i uken, gi oppskriften i formatet: 'Navn på dag: Oppskriftsnavn - Kort beskrivelse - Grunn'.
Hvis du ikke vet svaret, prøv å finne andre oppskrifter du tror gir variasjon til de andre oppskriftene.
Hvis du fortsatt ikke vet svaret, ikke prøv å finne på et svar.

{context}

Spørsmål: {question}
Ditt svar:"""


PROMPT = PromptTemplate(
    template=template, input_variables=["context", "question"])

chain_type_kwargs = {"prompt": PROMPT}

llm=ChatOpenAI(model="gpt-4") # temperature=0

qa = RetrievalQA.from_chain_type(llm=llm, 
    chain_type="stuff", 
    retriever=chroma_docsearch.as_retriever(search_type="mmr", search_kwargs={"k": 7}),  # use mmr for variation in the search results: 
    return_source_documents=True, 
    chain_type_kwargs=chain_type_kwargs)

query = "Foreslå en ukesmeny med varierte oppskrifter"
result = qa({'query':query})
print(result['result'])

ValidationError: 1 validation error for RetrievalQA
return_intermediate_steps
  extra fields not permitted (type=value_error.extra)

In [158]:
for r in result['source_documents']:
    print(r.page_content)
# print(len(result['source_documents']))

Title: Rask fiskegryte. Description: Oppskrift på smaksrik fiskegryte, som du lager enkelt og raskt med vår populære fiskesuppe og fiskewok. Server gjerne med fersk baguette eller et grovt rundstykke. Middag for to på under 20 minutter. Ingredients: MENY Anbefaler fiskesuppe, fiskewok, nystekt baguette, aioli
Title: Hjemmelaget fiskegrateng med makaroni. Description: Fiskegrateng med makaroni og torsk er en super måte å utnytte restene etter gårsdagens fiskemiddag på og en fiskemiddag som barn ofte liker. Server med råkostsalat, kokt potet og litt smeltet smør. Du kan også bruke skrei eller annen hvit fisk som kolje. Ingredients: smør, hvetemel, melk, salt, revet muskatnøtt
Title: Fisk og skalldyrsuppe med safran. Description: Varmende suppe med mye god smak. Velg helst fiskeslag som er faste i kjøttet, slik som laks, sei, skrei eller torsk. Server gjerne med grovt brød. Ingredients: sjalottløk, hvitløk, sellerirot, fennikel, olivenolje, safran, fiskebuljong, hvitvin, vann, hele tomate

#### Limitations
Negated queries are not well-supported. Although the answer often is correct and includes at most 1 recipe with fish, the source documents are not - they all contain fish. This is likely because the query embedding is close to those of the source documents of recipes with fish.

In [161]:
query = "Foreslå en ukesmeny med varierte oppskrifter. Inkluder maks 1 oppskrift med fisk i menyen"
result = qa({'query':query})
print(result['result'])

Mandag: Rask fiskegryte - Oppskrift på smaksrik fiskegryte, som du lager enkelt og raskt med vår populære fiskesuppe og fiskewok. Server gjerne med fersk baguette eller et grovt rundstykke. Middag for to på under 20 minutter. Grunn: Dette er en god start på uken med en rask og sunn fiskerett.

Tirsdag: Hjemmelaget fiskegrateng med makaroni - Fiskegrateng med makaroni og torsk er en super måte å utnytte restene etter gårsdagens fiskemiddag på og en fiskemiddag som barn ofte liker. Server med råkostsalat, kokt potet og litt smeltet smør. Du kan også bruke skrei eller annen hvit fisk som kolje. Grunn: Dette gir variasjon fra gårsdagen ved å bruke rester på en kreativ måte.

Onsdag: Fisk og skalldyrsuppe med safran - Varmende suppe med mye god smak. Velg helst fiskeslag som er faste i kjøttet, slik som laks, sei, skrei eller torsk. Server gjerne med grovt brød. Grunn: Denne retten gir variasjon ved å introdusere skalldyr til menyen.

Torsdag: Asiatisk laks med mangosalat - Ovnsbakt laks to

In [None]:
for r in result['source_documents']:
    print(r.page_content)

In [167]:
query = "Hvor mange oppskrifter finnes med fisk som ingrediens?"
result = qa({'query':query})
print(result['result'])

7


## Weekly menus

In [2]:
import pandas as pd 

recipes = pd.read_csv("data/all_recipe_details.csv")
recipes.head()

Unnamed: 0,ID,Title,Description,Ingredients
0,7d9a6e4e-9d34-4715-bf08-5b65f709d664,Klassisk minestronesuppe,"Oppskrift på italiensk minestronesuppe, med go...","rødløk, hvitløk, stangselleri, gulrøtter, chil..."
1,d1ba9cfb-d048-9475-ddb9-1f1aa3cf33f1,Kremet pasta med laks,"Pasta med kremet saus, stekt laks og erter er ...","pasta, frosne grønne erter, smør, creme fraiche"
2,9f4eac12-2edf-ad9c-14d9-90bb92bcc3d8,Kyllingfilet med soppsaus,Oppskrift på god og enkel hverdagsmiddag med k...,"løk, sjampinjong, crême fraiche, soyasaus, kyl..."
3,8bec3976-7837-420d-b94f-d078b2ac6ae3,Klassisk risotto,"Slik lager du klassisk italiensk risotto, med ...","risottoris, olivenolje, gul løk, hvitvin, kyll..."
4,328e4786-f496-4dde-a5f5-8675668a1c89,Lammeburger med kantareller og tyttebærkrem,Oppskrift på en saftig høstburger med sesongen...,"MENY lammeburgere, smør, burgerbrød, ferske ka..."


In [78]:
weekly_menus = pd.read_csv("data/meny_weekly_menus.csv")
weekly_menus.head()

Unnamed: 0,year,week,week_day,recipe_id,description,title,url
0,2023,40,Mandag,5f88a2c1-a078-7334-e19d-2bae7d71fada,Nå er soppsesongen her! Lurer du på hva du kan...,Kremet soppsuppe,/oppskrifter/Suppe/Kremet-soppsuppe/
1,2023,40,Tirsdag,45365543-d026-4d10-9435-877b9f0bfbc5,"Oppskrift på enkel, rask, og litt sunnere midd...",Laksefilet med sellerirotmos,/oppskrifter/Fisk/Laks/laksefilet-med-sellerir...
2,2023,40,Onsdag,b597b742-e9d9-4aa4-b3a6-4572202e8c4b,Enkel oppskrift på kylling red curry. Stekt ky...,Kylling red curry,/oppskrifter/gryte/kylling-red-curry/
3,2023,40,Torsdag,6d0dd194-c1c9-7d6e-8888-12814f2d5f39,Oppskrift på <a href='/tema/jul/lutefisk/Lutef...,Tradisjonell lutefisk,/oppskrifter/Fisk/Torsk/Tradisjonell-lutefisk/
4,2023,40,Fredag,3c822f4e-8c7b-49e7-a509-51a6b94cb158,"Oppskrift på fristende, gratinert enchilada me...",Enchiladas med kylling,/oppskrifter/Taco/enchiladas-med-kylling/


In [79]:
merged = recipes.merge(weekly_menus, left_on="ID", right_on="recipe_id", how="left")
merged.head()

Unnamed: 0,ID,Title,Description,Ingredients,year,week,week_day,recipe_id,description,title,url
0,7d9a6e4e-9d34-4715-bf08-5b65f709d664,Klassisk minestronesuppe,"Oppskrift på italiensk minestronesuppe, med go...","rødløk, hvitløk, stangselleri, gulrøtter, chil...",2021.0,35.0,Onsdag,7d9a6e4e-9d34-4715-bf08-5b65f709d664,"Oppskrift på italiensk minestronesuppe, med go...",Klassisk minestronesuppe,/oppskrifter/Suppe/klassisk-minestronesuppe/
1,d1ba9cfb-d048-9475-ddb9-1f1aa3cf33f1,Kremet pasta med laks,"Pasta med kremet saus, stekt laks og erter er ...","pasta, frosne grønne erter, smør, creme fraiche",,,,,,,
2,9f4eac12-2edf-ad9c-14d9-90bb92bcc3d8,Kyllingfilet med soppsaus,Oppskrift på god og enkel hverdagsmiddag med k...,"løk, sjampinjong, crême fraiche, soyasaus, kyl...",,,,,,,
3,8bec3976-7837-420d-b94f-d078b2ac6ae3,Klassisk risotto,"Slik lager du klassisk italiensk risotto, med ...","risottoris, olivenolje, gul løk, hvitvin, kyll...",2021.0,43.0,Mandag,8bec3976-7837-420d-b94f-d078b2ac6ae3,"Slik lager du klassisk italiensk risotto, med ...",Klassisk risotto,/oppskrifter/ris/klassisk-risotto/
4,328e4786-f496-4dde-a5f5-8675668a1c89,Lammeburger med kantareller og tyttebærkrem,Oppskrift på en saftig høstburger med sesongen...,"MENY lammeburgere, smør, burgerbrød, ferske ka...",,,,,,,


In [80]:
merged[merged["ID"] == "d1ba9cfb-d048-9475-ddb9-1f1aa3cf33f1"]["year"].isna()

1      True
598    True
Name: year, dtype: bool

In [81]:
print(merged["ID"].count())
merged = merged.drop_duplicates(subset=["ID"])
print(merged["ID"].count())

1055
465


In [82]:
merged["year"] = merged["year"].fillna(-1).astype(int)
merged["week"] = merged["week"].fillna(-1).astype(int)
merged.head()

Unnamed: 0,ID,Title,Description,Ingredients,year,week,week_day,recipe_id,description,title,url
0,7d9a6e4e-9d34-4715-bf08-5b65f709d664,Klassisk minestronesuppe,"Oppskrift på italiensk minestronesuppe, med go...","rødløk, hvitløk, stangselleri, gulrøtter, chil...",2021,35,Onsdag,7d9a6e4e-9d34-4715-bf08-5b65f709d664,"Oppskrift på italiensk minestronesuppe, med go...",Klassisk minestronesuppe,/oppskrifter/Suppe/klassisk-minestronesuppe/
1,d1ba9cfb-d048-9475-ddb9-1f1aa3cf33f1,Kremet pasta med laks,"Pasta med kremet saus, stekt laks og erter er ...","pasta, frosne grønne erter, smør, creme fraiche",-1,-1,,,,,
2,9f4eac12-2edf-ad9c-14d9-90bb92bcc3d8,Kyllingfilet med soppsaus,Oppskrift på god og enkel hverdagsmiddag med k...,"løk, sjampinjong, crême fraiche, soyasaus, kyl...",-1,-1,,,,,
3,8bec3976-7837-420d-b94f-d078b2ac6ae3,Klassisk risotto,"Slik lager du klassisk italiensk risotto, med ...","risottoris, olivenolje, gul løk, hvitvin, kyll...",2021,43,Mandag,8bec3976-7837-420d-b94f-d078b2ac6ae3,"Slik lager du klassisk italiensk risotto, med ...",Klassisk risotto,/oppskrifter/ris/klassisk-risotto/
4,328e4786-f496-4dde-a5f5-8675668a1c89,Lammeburger med kantareller og tyttebærkrem,Oppskrift på en saftig høstburger med sesongen...,"MENY lammeburgere, smør, burgerbrød, ferske ka...",-1,-1,,,,,


In [83]:
def format_row(row):
    out = f"Tittel: {row['Title']}. Beskrivelse: {row['Description']}. Ingredienser: {row['Ingredients']}. "
    if row["year"] != -1.0:
        out += f"Del av ukesmeny i {row['year']}, uke {row['week']} på {row['week_day']}."
    return out

merged["combined_info"] = merged.apply(format_row, axis=1,)
merged.head(2)

Unnamed: 0,ID,Title,Description,Ingredients,year,week,week_day,recipe_id,description,title,url,combined_info
0,7d9a6e4e-9d34-4715-bf08-5b65f709d664,Klassisk minestronesuppe,"Oppskrift på italiensk minestronesuppe, med go...","rødløk, hvitløk, stangselleri, gulrøtter, chil...",2021,35,Onsdag,7d9a6e4e-9d34-4715-bf08-5b65f709d664,"Oppskrift på italiensk minestronesuppe, med go...",Klassisk minestronesuppe,/oppskrifter/Suppe/klassisk-minestronesuppe/,Tittel: Klassisk minestronesuppe. Beskrivelse:...
1,d1ba9cfb-d048-9475-ddb9-1f1aa3cf33f1,Kremet pasta med laks,"Pasta med kremet saus, stekt laks og erter er ...","pasta, frosne grønne erter, smør, creme fraiche",-1,-1,,,,,,Tittel: Kremet pasta med laks. Beskrivelse: Pa...


In [84]:
merged.head(2)["combined_info"]
print(merged.head(2)["combined_info"].iloc[0][-100:])
print(merged.head(2)["combined_info"].iloc[1][-100:])

skraft, hvite bønner, purre, pasta, oregano, salt, pepper. Del av ukesmeny i 2021, uke 35 på Onsdag.
. Rask, sunn og enkelt middagstips.. Ingredienser: pasta, frosne grønne erter, smør, creme fraiche. 


In [85]:
import tiktoken

embedding_model = "text-embedding-ada-002"
embedding_encoding = "cl100k_base"  # this the encoding for text-embedding-ada-002
max_tokens = 8000  # the maximum for text-embedding-ada-002 is 8191

encoding = tiktoken.get_encoding(embedding_encoding)

# omit descriptions that are too long to embed
merged["n_tokens"] = merged.combined_info.apply(lambda x: len(encoding.encode(x)))
offers = merged[merged.n_tokens <= max_tokens]


In [86]:
from openai.embeddings_utils import get_embedding

merged["embedding"] = merged.combined_info.apply(
    lambda x: get_embedding(x, engine=embedding_model),
)
merged.head()

Unnamed: 0,ID,Title,Description,Ingredients,year,week,week_day,recipe_id,description,title,url,combined_info,n_tokens,embedding
0,7d9a6e4e-9d34-4715-bf08-5b65f709d664,Klassisk minestronesuppe,"Oppskrift på italiensk minestronesuppe, med go...","rødløk, hvitløk, stangselleri, gulrøtter, chil...",2021,35,Onsdag,7d9a6e4e-9d34-4715-bf08-5b65f709d664,"Oppskrift på italiensk minestronesuppe, med go...",Klassisk minestronesuppe,/oppskrifter/Suppe/klassisk-minestronesuppe/,Tittel: Klassisk minestronesuppe. Beskrivelse:...,155,"[0.01983242854475975, -0.02484963834285736, 0...."
1,d1ba9cfb-d048-9475-ddb9-1f1aa3cf33f1,Kremet pasta med laks,"Pasta med kremet saus, stekt laks og erter er ...","pasta, frosne grønne erter, smør, creme fraiche",-1,-1,,,,,,Tittel: Kremet pasta med laks. Beskrivelse: Pa...,98,"[0.02298697829246521, 0.006297714542597532, 0...."
2,9f4eac12-2edf-ad9c-14d9-90bb92bcc3d8,Kyllingfilet med soppsaus,Oppskrift på god og enkel hverdagsmiddag med k...,"løk, sjampinjong, crême fraiche, soyasaus, kyl...",-1,-1,,,,,,Tittel: Kyllingfilet med soppsaus. Beskrivelse...,132,"[0.00546360295265913, -0.002787069184705615, -..."
3,8bec3976-7837-420d-b94f-d078b2ac6ae3,Klassisk risotto,"Slik lager du klassisk italiensk risotto, med ...","risottoris, olivenolje, gul løk, hvitvin, kyll...",2021,43,Mandag,8bec3976-7837-420d-b94f-d078b2ac6ae3,"Slik lager du klassisk italiensk risotto, med ...",Klassisk risotto,/oppskrifter/ris/klassisk-risotto/,Tittel: Klassisk risotto. Beskrivelse: Slik la...,112,"[0.01895941235125065, -0.04094412550330162, -0..."
4,328e4786-f496-4dde-a5f5-8675668a1c89,Lammeburger med kantareller og tyttebærkrem,Oppskrift på en saftig høstburger med sesongen...,"MENY lammeburgere, smør, burgerbrød, ferske ka...",-1,-1,,,,,,Tittel: Lammeburger med kantareller og tyttebæ...,170,"[-0.011739281006157398, -0.018055418506264687,..."


In [87]:
merged.rename(columns={"embedding": "vector"}, inplace=True)
merged.rename(columns={"combined_info": "text"}, inplace=True)
merged.to_pickle("data/merged_recipies_and_weekly_menus.pkl")

In [3]:
merged = pd.read_pickle("data/merged_recipies_and_weekly_menus.pkl")

In [89]:
merged["ID"].count()

465

In [4]:
import lancedb
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import LanceDB
from langchain.chains import RetrievalQA

uri = "dataset/sample-recipes-lancedb"
db = lancedb.connect(uri)
table = db.create_table("recipes", merged, mode="overwrite")
embeddings = OpenAIEmbeddings()
docsearch = LanceDB(connection = table, embedding = embeddings)

ValidationError: 1 validation error for OpenAIEmbeddings
__root__
  Did not find openai_api_key, please add an environment variable `OPENAI_API_KEY` which contains it, or pass  `openai_api_key` as a named parameter. (type=value_error)

In [91]:
from langchain.prompts import PromptTemplate
from langchain.llms import OpenAI
from langchain.chat_models import ChatOpenAI

template = """You are a recipe recommender system that help users to find weekly menus that match their preferences. 
Use the following pieces of context to answer the question at the end. 
For each question, suggest 7 different recipies for a weekly menu, with a short description of the dish and the reason why the user might like it. Use the names of the week days to refer to the days of the week. If applicable, use information about when this recipe was part of a weekly menu to find recipes that are suitable for the time of year and week day.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

{context}

Question: {question}
Your response:"""


PROMPT = PromptTemplate(
    template=template, input_variables=["context", "question"])

chain_type_kwargs = {"prompt": PROMPT}

llm=ChatOpenAI(model="gpt-4")

qa = RetrievalQA.from_chain_type(llm=llm, 
    chain_type="stuff", 
    retriever=docsearch.as_retriever(search_kwargs={"k": 7}),
    return_source_documents=True, 
    chain_type_kwargs=chain_type_kwargs)

query = "Suggest a weekly menu with varied recipes" #"Foreslå en ukesmeny med varierte oppskrifter."
result = qa({'query':query})
print(result['result'])

  builder = builder.nearest(**nearest)


Monday: Sommerkoteletter med stekt paprika. This dish is a satisfying and easy to prepare meal made with summer chops, bell peppers, and rice. It's a great start for the week, providing a balanced and flavorful meal that the whole family will enjoy.

Tuesday: Wok med grønnsaker, nudler og kjøttpølse. This is a simple yet delicious wok dish featuring noodles, vegetables, and sausage. This will add some variety to your menu and is a perfect way to incorporate more vegetables into your meals.

Wednesday: Wok med nudler, tomatsaus og kjøttboller. This wok dish is made with noodles, meatballs, and bell peppers, offering a different take on the previous day's wok. The addition of a tomato sauce will give this dish a unique flavor profile.

Thursday: Svinekoteletter med cornflakes og stekt paprika. Another quick and easy dish, this meal features pork chops with cornflakes and fried bell pepper. It's a tasty and satisfying dish that can be prepared in less than 20 minutes.

Friday: Enkel gryte

In [66]:
print(len(result['source_documents']))
for r in result["source_documents"]:
    print(r.page_content + '\n')

7
Tittel: Sommerkoteletter med stekt paprika. Beskrivelse: Panerte sommerkoteletter med stekt paprika og ris er god, smakfull og enkel hverdagsmat. Det lages på under 20 minutter og du trenger kun få ingredienser for en fullverdig middagsrett hele familien vil like.. Ingredienter: sommerkoteletter, egg, cornflakes, paprika (gjerne i forskjellige farger), , rapsolje, ris, Jacobs Utvalgte chilimajones, salt, pepper. 

Tittel: Wok med nudler, tomatsaus og kjøttboller. Beskrivelse: En god wok med en blanding av sprø paprika, nudler og kjøttboller. En fullverdig og enkel middagsrett som hele familien vil like.. Ingredienter: nudler, kjøttboller, paprika, strimlet, rapsolje, pastasaus, gjerne Jacobs Utvalgte. 

Tittel: Wok med grønnsaker, nudler og kjøttpølse. Beskrivelse: Wok er perfekt hverdagsmiddag! Prøv wok med kjøttpølse, creme fraiche, nudler og grønnsaker. Enkel og veldig god oppskrift.. Ingredienter: nudler, kjøttpølser uten skinn, rapsolje, grønnsaker, ferske eller wokmix, creme fr

In [92]:

template = """Du er et anbefalingssystem av oppskrifter. Gitt brukerens preferanser, anbefal en ukentlig middagsmeny bestående av 7 oppskrifter.
For hver dag i uken, gi oppskriften i formatet: 'Navn på dag: Oppskriftsnavn - Kort beskrivelse - Grunn'.
Hvis du ikke vet svaret, prøv å finne andre oppskrifter du tror gir variasjon til de andre oppskriftene.
Hvis du fortsatt ikke vet svaret, ikke prøv å finne på et svar.

{context}

Spørsmål: {question}
Ditt svar:"""


PROMPT = PromptTemplate(
    template=template, input_variables=["context", "question"])

chain_type_kwargs = {"prompt": PROMPT}

llm=ChatOpenAI(model="gpt-4")

qa = RetrievalQA.from_chain_type(llm=llm, 
    chain_type="stuff", 
    retriever=docsearch.as_retriever(search_kwargs={"k": 7}),
    return_source_documents=True, 
    chain_type_kwargs=chain_type_kwargs)

query = "Foreslå en ukesmeny med varierte oppskrifter."
result = qa({'query':query})
print(result['result'])

  builder = builder.nearest(**nearest)


Mandag: Enkel gryte med kjøttkaker - Raskt middagstips med kjøttkaker i biter, sopp, brokkoli og fløte - Perfekt for å starte uken med en enkel og velsmakende gryte.

Tirsdag: Svinekoteletter med lun fransk potetsalat - Enkel og god middag med svinekjøtt - Gir variasjon med en deilig potetsalat og svinekoteletter.

Onsdag: Fiskekake i pita - Barnevennlig middagstips med fiskekaker i grove biter i fersk pitabrød - Gir variasjon ved å introdusere fisk i ukesmenyen.

Torsdag: Wok med grønnsaker, nudler og kjøttpølse - Perfekt hverdagsmiddag med kjøttpølse, creme fraiche, nudler og grønnsaker - Enkel og veldig god oppskrift for en travle ukedag.

Fredag: Urtepanerte koteletter - Koteletter panert med urter og brødsmuler, med lune linser med hvitløk, urter og tomat som tilbehør - Perfekt for en fredagsmiddag.

Lørdag: Svinekoteletter i form - Enkel oppskrift på koteletter i form med grønnsaker og en mild og barnevennlig saus - God lørdagsmiddag som hele familien vil nyte.

Søndag: Pasta med

In [93]:
print(len(result['source_documents']))
for r in result["source_documents"]:
    print(r.page_content + '\n')

7
Tittel: Enkel gryte med kjøttkaker. Beskrivelse: Raskt middagstips med kjøttkaker i biter, sopp, brokkoli og fløte. Varier grønnsaker etter smak og bruk gjerne rester.. Ingredienser: ferdige kjøttkaker, friske sjampinjonger, gul løk, brokkoli, fløte, rød paprika, salt, olje til steking, pepper. 

Tittel: Svinekoteletter med lun fransk potetsalat. Beskrivelse: Oppskrift på enkel og god middag med svinekjøtt. Varier vinaigretten med urter og krydder, den kan også kjøpes ferdig. Blir det rester igjen kan du blande kotelettstrimler i potetsalaten og spise neste dag, den er like god kald.. Ingredienser: svinekoteletter, stangselleri, hvitløk, hakket fersk dill, sjalottløk, salt, pepper. 

Tittel: Fiskekake i pita. Beskrivelse: Barnevennlig middagstips! Ha fiskekaker i grove biter i fersk pitabrød med revet eple, gulrot og avokado. Lett å like og litt sunnere middag.. Ingredienser: syrlig eple, gulrøtter, agurk, sitron, salt, pepper. 

Tittel: Wok med grønnsaker, nudler og kjøttpølse. Besk

## Offers

In [94]:
offers = pd.read_csv("data/products_on_offer.csv")
offers.head()

Unnamed: 0,title,subtitle
0,Grandiosa Pizza,575g Stabburet
1,Kjøttkaker,m/Ertestuing 605g Fjordland
2,Tagliatelle m/Egg,glutenfri 250g Semper
3,Lasagne Gul,500g Barilla
4,Pasta Girandole,500g Barilla


In [101]:
offers["combined_info"] = offers.apply(
    lambda row: f"{row['title']} {row['subtitle']}",
    axis=1,
)

In [102]:
template_prefix = """Du er et anbefalingssystem av oppskrifter. Gitt brukerens preferanser og tilbud denne uken, anbefal en ukentlig middagsmeny bestående av 7 oppskrifter.
For hver dag i uken, gi oppskriften i formatet: 'Navn på dag: Oppskriftsnavn - Kort beskrivelse - Grunn'.
Hvis du ikke vet svaret, prøv å finne andre oppskrifter du tror gir variasjon til de andre oppskriftene.
Hvis du fortsatt ikke vet svaret, ikke prøv å finne på et svar.

{context}
"""


offers_info = """Dette er produkter og ingredienser på tilbud denne uken. Du kan bruke denne informasjonen til å forbedre søket:
 {offers}"""

template_suffix= """Spørsmål: {question}
Ditt svar:"""

offers_info = offers_info.format(offers=", ".join(offers["combined_info"].tolist()))

COMBINED_PROMPT = template_prefix +'\n'+ offers_info +'\n'+ template_suffix
print(COMBINED_PROMPT)

PROMPT = PromptTemplate(
    template=COMBINED_PROMPT, input_variables=["context", "question"])

chain_type_kwargs = {"prompt": PROMPT}

llm=ChatOpenAI(model="gpt-4")

qa = RetrievalQA.from_chain_type(llm=llm, 
    chain_type="stuff", 
    retriever=docsearch.as_retriever(search_kwargs={"k": 7}),
    return_source_documents=True, 
    chain_type_kwargs=chain_type_kwargs)

query = "Foreslå en ukesmeny med varierte oppskrifter."
result = qa({'query':query})
print(result['result'])

Du er et anbefalingssystem av oppskrifter. Gitt brukerens preferanser og tilbud denne uken, anbefal en ukentlig middagsmeny bestående av 7 oppskrifter.
For hver dag i uken, gi oppskriften i formatet: 'Navn på dag: Oppskriftsnavn - Kort beskrivelse - Grunn'.
Hvis du ikke vet svaret, prøv å finne andre oppskrifter du tror gir variasjon til de andre oppskriftene.
Hvis du fortsatt ikke vet svaret, ikke prøv å finne på et svar.

{context}

Dette er produkter og ingredienser på tilbud denne uken. Du kan bruke denne informasjonen til å forbedre søket:
 Grandiosa Pizza 575g Stabburet, Kjøttkaker m/Ertestuing 605g Fjordland, Tagliatelle m/Egg glutenfri 250g Semper, Lasagne Gul 500g Barilla, Pasta Girandole 500g Barilla, Meksikansk Gryte glutenfri 183g Toro, Fusilli 500g Barilla, Pasta Sedani glutenfri Økol 300g Semper, Kjøttsuppe 350g Fjordland, Farfalle 500g Barilla, Fusilli med Havre Gl.Fri 300g Semper, Spaghetti Fullkorn 1kg Barilla, Fiskesuppe 350g Fjordland, Middagskaker 565g Fjordland, Bi

  builder = builder.nearest(**nearest)


Mandag: Enkel gryte med kjøttkaker - Raskt middagstips med kjøttkaker i biter, sopp, brokkoli og fløte. Varier grønnsaker etter smak og bruk gjerne rester. - Ferdige kjøttkaker er på tilbud denne uken.

Tirsdag: Svinekoteletter med lun fransk potetsalat - Oppskrift på enkel og god middag med svinekjøtt. Varier vinaigretten med urter og krydder, den kan også kjøpes ferdig. Blir det rester igjen kan du blande kotelettstrimler i potetsalaten og spise neste dag, den er like god kald. - Svinestek er på tilbud denne uken.

Onsdag: Fiskekake i pita - Barnevennlig middagstips! Ha fiskekaker i grove biter i fersk pitabrød med revet eple, gulrot og avokado. Lett å like og litt sunnere middag. - Fiskesuppe er på tilbud og kan være en god kilde til fiskekaker.

Torsdag: Pasta med kjøttsaus - Ukens middag på under 20 minutter! Familievennlig middagsfavoritt med fersk tagliatelle med fullkorn, og ferdig tomatsaus med ekstra grønnsaker. Både kjøttdeig og karbonadedeig kan brukes. - Pasta er på tilbud

## Self-Query Retriever
Want to use a self-query retriever to answer queries like "Recommend me a menu. I dont like fish." where recipes with fish should be excluded by filtering.

In [13]:
!pip install -q lark chromadb

In [14]:
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import Chroma

In [26]:
import pandas as pd 

merged = pd.read_pickle("data/merged_recipies_and_weekly_menus.pkl")
documents = merged["text"].tolist() 
ids = [str(x) for x in merged.index.tolist()]
embeddings = merged["vector"].tolist()
metadatas = [{"source": md["ID"], **md} for md in merged[["ID", "Title", "Description", "Ingredients"]].to_dict(orient='records')]

In [27]:
metadatas[0]

{'source': '7d9a6e4e-9d34-4715-bf08-5b65f709d664',
 'ID': '7d9a6e4e-9d34-4715-bf08-5b65f709d664',
 'Title': 'Klassisk minestronesuppe',
 'Description': 'Oppskrift på italiensk minestronesuppe, med gode hermetiske tomater, chorizo og pasta. Et godt middagstips for hele familien! Server gjerne med nystekte rundstykker.',
 'Ingredients': 'rødløk, hvitløk, stangselleri, gulrøtter, chili, olivenolje, chorizo, hakkede tomater, grønnsakskraft, hvite bønner, purre, pasta, oregano, salt, pepper'}

In [40]:
import chromadb

chroma_client = chromadb.Client()
chroma_client.delete_collection(name="recipes")
collection = chroma_client.get_or_create_collection(name="recipes")
collection.add(
    embeddings=embeddings,
    documents=documents,
    ids=ids,
    metadatas=metadatas
)

embedding_function = OpenAIEmbeddings()
chroma_docsearch = Chroma(client=chroma_client, collection_name="recipes", embedding_function=embedding_function)

In [41]:
db_retriever = chroma_docsearch.as_retriever()
db_retriever.get_relevant_documents("Laks i pita")

[Document(page_content='Tittel: Lam i pita. Beskrivelse: Om du har rester av lammekjøtt, er denne enkle middagen verdt å prøve! Oppskrift på frityrstekt lam i pitabrød, eller lammekebab, med paprika, søtpotet og squash. Topp det hele med en frisk og mild yoghurtdressing med mynte. Rask middag for hele familien til både hverdag og helg!. Ingredienser: pitabrød, lammekjøtt, rød paprika, gul paprika, søtpotet, grønn squash, crispi salat, tempura mix, frityrolje. ', metadata={'Description': 'Om du har rester av lammekjøtt, er denne enkle middagen verdt å prøve! Oppskrift på frityrstekt lam i pitabrød, eller lammekebab, med paprika, søtpotet og squash. Topp det hele med en frisk og mild yoghurtdressing med mynte. Rask middag for hele familien til både hverdag og helg!', 'ID': 'fca7b8ac-6337-4f36-9349-086e08b47ee5', 'Ingredients': 'pitabrød, lammekjøtt, rød paprika, gul paprika, søtpotet, grønn squash, crispi salat, tempura mix, frityrolje', 'Title': 'Lam i pita', 'source': 'fca7b8ac-6337-4f

In [34]:
from langchain.chains import RetrievalQAWithSourcesChain
from langchain.retrievers.self_query.base import SelfQueryRetriever
from langchain.chains.query_constructor.base import AttributeInfo

metadata_field_info=[
    AttributeInfo(
        name="Title",
        description="The title of the recipe", 
        type="string", 
    ),
    AttributeInfo(
        name="Description",
        description="Description of the recipe", 
        type="string", 
    ),
    AttributeInfo(
        name="Ingredients",
        description="Ingredients required to make the recipe", 
        type="string", 
    ),
    AttributeInfo(
        name="source",
        description="Identifier of the recipe", 
        type="string", 
    ),
]
document_content_description = "Recipies with a brief description and ingredients in Norwegian."


In [62]:
from langchain.prompts import PromptTemplate
from langchain.llms import OpenAI
from langchain.chat_models import ChatOpenAI

template = """Du er et anbefalingssystem av oppskrifter. Gitt brukerens preferanser og tilbud denne uken, anbefal en ukentlig middagsmeny bestående av 7 oppskrifter.
For hver dag i uken, gi oppskriften i formatet: 'Navn på dag: Oppskriftsnavn - Kort beskrivelse - Grunn'.
Hvis du ikke vet svaret, prøv å finne andre oppskrifter du tror gir variasjon til de andre oppskriftene.
Hvis du fortsatt ikke vet svaret, ikke prøv å finne på et svar.

{context}

Spørsmål: {question}
Ditt svar:"""


PROMPT = PromptTemplate(
    template=template, input_variables=["context", "question"])

chain_type_kwargs = {"prompt": PROMPT}

llm=ChatOpenAI()

retriever = SelfQueryRetriever.from_llm(
    llm, 
    chroma_docsearch, 
    document_content_description, 
    metadata_field_info, 
    enable_limit=True,
    verbose=True,
    search_type="mmr"
)


In [63]:
retriever.get_relevant_documents("Hva er noen oppskrifter med fisk?")



query='fisk' filter=None limit=None


[Document(page_content='Tittel: Panert fisk med chilimajones. Beskrivelse: Enkel og veldig god fiskemiddag med panert sei, eller torsk, ovnsbakte poteter med løkmarmelade og chilimajones. Dette er en middag som nesten lager seg selv og er  full av deilige smaker.. Ingredienser: panert sei, smør. ', metadata={'Description': 'Enkel og veldig god fiskemiddag med panert sei, eller torsk, ovnsbakte poteter med løkmarmelade og chilimajones. Dette er en middag som nesten lager seg selv og er  full av deilige smaker.', 'ID': '47d1b075-c0f9-455c-a35a-49576b2a1b7a', 'Ingredients': 'panert sei, smør', 'Title': 'Panert fisk med chilimajones', 'source': '47d1b075-c0f9-455c-a35a-49576b2a1b7a'}),
 Document(page_content='Tittel: Fisk og skalldyrsuppe med safran. Beskrivelse: Varmende suppe med mye god smak. Velg helst fiskeslag som er faste i kjøttet, slik som laks, sei, skrei eller torsk. Server gjerne med grovt brød.. Ingredienser: sjalottløk, hvitløk, sellerirot, fennikel, olivenolje, safran, fiske

In [64]:
# qa = RetrievalQAWithSourcesChain.from_chain_type(llm, 
#                                                     chain_type="stuff", 
#                                                     retriever=retriever,
#                                                  )
from langchain.chains import RetrievalQA

qa = RetrievalQA.from_chain_type(llm=llm, 
    chain_type="stuff", 
    retriever=retriever,
    return_source_documents=True, 
    chain_type_kwargs=chain_type_kwargs)

In [66]:
query = "Foreslå en ukesmeny med varierte oppskrifter. Inkluder 1 oppskrift med fisk i menyen"
result = qa({'query':query})



query=' ' filter=None limit=7


In [67]:
print(result["result"])

Mandag: Lakseburger med purre og reker - En litt sunnere burger med hvitløkstzatziki. Grunn: Laksefilet, pillede reker, purre, agurk, yoghurt naturell, hvitløk, salt, pepper, balsamico cream, avocado, spinat, spirer, hamburgerbrød.
 
Tirsdag: Enkle pizzasnurrer med tacokjøttdeig - Enkel og rask oppskrift på gode pizzasnurrer med kjøttdeig eller karbonadedeig. Grunn: Ferdig pizzadeig.

Onsdag: Grønnsakslasagne med paprika og spinat - Varmende hjemmelaget vegetarlasagne. Grunn: Cottage cheese, parmesan, egg, salt, pepper.

Torsdag: Smash burger - Oppskrift på den nye trendburgeren "Smash burger". Grunn: Kjøttdeig, salt, pepper, cheddar.

Fredag: Indrefilet av okse med aspargesbønner og rødvinssaus - Oppskrift på saftig biff med små poteter, cherrytomater og aspargesbønner. Grunn: Indrefilet av okse, salt, pepper, smør, perlepoteter, aspargesbønner, cherrytomater, finhakket gressløk, rødvinsaus.

Lørdag: Stekt skrei med baconsjy og mandelpoteter - Oppskrift på skinnstekt skrei loin med sj

In [58]:
chat_history = [(query, result["result"])]
query = "Jeg liker ikke fisk, kan du anbefale noe annet?"
result = qa({"query": query, "chat_history": chat_history})



query='NO_FILTER' filter=None limit=None


In [59]:
print(result["result"])

Selvfølgelig! Her er en alternativ oppskrift for deg:

Tittel: Kyllingpiccata med sitron og kapers. Beskrivelse: En smaksrik og saftig kyllingrett med en herlig blanding av sitron og kapers. Serveres med fersk pasta eller ris og en frisk salat ved siden av. Ingredienser: kyllingfileter, salt, pepper, hvetemel, smør, olivenolje, hvitløk, sitronsaft, kyllingbuljong, kapers, fersk persille.


In [60]:
chat_history.extend((query, result["result"]))
query = "Gi meg den fulle ukesmenyen."
result = qa({"query": query, "chat_history": chat_history})



query=' ' filter=None limit=7


In [61]:
print(result["result"])

Mandag: Indrefilet av okse med potetmos og ovnsbakte tomater - Oppskrift på saftig biff med rask peppersaus, hjemmelaget potetmos og ovnsbakte tomater. Godt til helgen eller på en hverdag du ønsker å kose deg litt ekstra.
Tirsdag: Svinekoteletter med cornflakes og stekt paprika - Panerte koteletter med stekt paprika og ris er god, smakfull og enkel hverdagsmat.
Onsdag: Enkle pizzasnurrer med tacokjøttdeig - Enkel og rask oppskrift på gode pizzasnurrer, eller pizzaboller, med kjøttdeig eller karbonadedeig.
Torsdag: Pastasalat med tomat og basilikum - Pastasalat er enkelt og godt tilbehør som kan lages hjemme i en fei, og passer til grillmat, koldtbord eller i matpakka.
Fredag: Indrefilet av okse med aspargesbønner og rødvinssaus - Oppskrift på saftig biff med små poteter, cherrytomater og aspargesbønner. En klassisk helgemiddag.
Lørdag: Speltrisotto med bakte rotgrønnsaker og paprikasaus - En deilig vegetarisk og laktosefri rett, med grønnsaker i vakre farger, enkel paprikasaus og sunn 

## TODO: 
- HyDE
